技術資料

PHPで便利なマルチバイト文字操作関数をまとめて紹介

作成日:2009.03.09

PHP

PHPのマルチバイト文字を扱うために用意されたmb_系関数を活用して、文字コードの判別や変換、文字列操作を効率よく行う方法を紹介します。文字化けの防止やデータ処理を円滑に進めるために役立つ関数群を解説します。

error この記事は最終更新日から15年以上が経過しています。

プログラミングをする上で、マルチバイト文字(全角文字etc)の扱いというのはなかなか面倒な問題ですよね。
言語側で用意されている文字列操作系関数が、1バイト文字にしか対応していなくて困ったりとか。

PHP のマルチバイト文字操作系関数(mb_ が頭につく関数群)は、そういう意味で非常に便利な存在だといえます。

というわけで、個人的によくお世話になっている(or 今後なる予定の)関数群を、備忘録的にまとめておきます。

mb_check_encoding

文字列が、指定した文字コードかどうか判別する関数。

文字列 $string が utf-8 かどうか判別する場合、

if(mb_check_encoding($string,'UTF-8')){
    print ("\$string は UTF-8 です。\n");
}else{
    print ("\$string は UTF-8 ではないです。\n");
}

みたいな感じで使う。

mb_detect_encoding

文字列の文字コードを取得する。

$encode = mb_detect_encoding($string);

mb_convert_encoding

文字列を、指定した文字コードに変換する。

euc の文字列を utf-8 に変換する場合、

$utf8_string = mb_convert_encoding($euc_string,'UTF-8','EUC-JP');

みたいな感じで使う。

最後の「'EUC-JP'」の部分は、配列や、カンマ区切りの文字列で指定可能。
また「auto」を指定すると、自動判別してくれる(あまりあてにならない)。

mb_convert_kana

全角文字と半角文字の相互変換。

$string = mb_convert_kana($string,option,'UTF-8');

「option」の部分で、変換前・変換後の文字種を指定する。

a
全角英数字を半角英数字に変換。
A
半角英数字を全角英数字に変換。
s
全角スペースを半角スペースに変換。
S
半角スペースを全角スペースに変換。
k
全角カナを半角カナに変換。
K
半角カナを全角カナに変換。
h
全角かなを半角カナに変換。
H
半角カナを全角かなに変換。
c
全角カナを全角かなに変換。
C
全角かなを全角カナに変換。
V
濁点つき半角カナを一文字の全角文字に変換。K や H と併用。

mb_strlen

文字列の長さを、マルチバイト文字も各一文字扱いで取得する。

$length = mb_strlen($string,'UTF-8');

mb_substr

文字列を、マルチバイト文字も各一文字扱いで、指定した長さにして返す。

文字列の頭から20文字目までを取得したい場合、

$substring = mb_substr($string,0,20,'UTF-8');

みたいな感じにする。

mb_send_mail

自動で文字コードを変換した上で、メール送信する。

mb_send_mail($to_address,$subject,$mailbody);

ただし、自動文字コード変換はあまりあてにならないので、件名や本文の文字コードをあらかじめ変換しておくか、PHP 内部のデフォルト文字コードを設定しておく方が良いかも。
詳しくは、PHPのmb_send_mail()関数で送信したメールが文字化けする際の対処法を参照のこと。

SimpleSAMLphpを使ったPHPアプリケーションのSSO対応ガイド

2025.02.11

SimpleSAMLphpを使ってPHPアプリケーションにSSO機能を追加する方法を紹介します。Microsoft Entra IDとの連携方法や、認証情報の取得方法について詳しく解説します。

Microsoft Entra ID PHP SAML認証 SimpleSAMLphp

Microsoft Entra IDとSimpleSAMLphpを利用したSAML認証SSO構築ガイド

2025.01.26

ローカル環境でMicrosoft Entra IDと連携したSAML認証のシングルサインオンを実現するための手順を紹介します。SimpleSAMLphpを利用した設定方法や、Microsoft側の構成変更について詳しく解説しています。

Microsoft Entra ID PHP SAML認証 SimpleSAMLphp

PHPで文字列をスペースで区切って配列に変換するテクニック

2025.02.09

PHPでキーワード検索を実装する際などに、文字列をスペースで区切って配列に変換する方法を解説します。全角スペースの変換や空要素の削除についても詳しく説明します。

PHP

PHPでmPDFを使ってHTMLをPDFに変換する方法

2025.02.07

PHPのライブラリmPDFを使用して、HTMLドキュメントをPDFとして出力する方法を詳しく解説します。インストールから日本語対応まで、具体的なコード例を交えて説明します。

mPDF PHP

阿部辰也へのお仕事の依頼・お問い合わせ

お名前 *必須
会社名
メールアドレス *必須
電話番号
URL
お問い合わせのきっかけ
お問い合わせの内容 *必須
個人情報の取り扱いについて *必須 プライバシーポリシーをご確認いただき、同意いただける場合は「同意する」にチェックをしてください。

keyboard_double_arrow_up
TOP