PHPで便利なマルチバイト文字操作関数をまとめて紹介
作成日:2009.03.09
PHPのマルチバイト文字を扱うために用意されたmb_系関数を活用して、文字コードの判別や変換、文字列操作を効率よく行う方法を紹介します。文字化けの防止やデータ処理を円滑に進めるために役立つ関数群を解説します。
error この記事は最終更新日から15年以上が経過しています。
プログラミングをする上で、マルチバイト文字(全角文字etc)の扱いというのはなかなか面倒な問題ですよね。
言語側で用意されている文字列操作系関数が、1バイト文字にしか対応していなくて困ったりとか。
PHP のマルチバイト文字操作系関数(mb_ が頭につく関数群)は、そういう意味で非常に便利な存在だといえます。
というわけで、個人的によくお世話になっている(or 今後なる予定の)関数群を、備忘録的にまとめておきます。
mb_check_encoding
文字列が、指定した文字コードかどうか判別する関数。
文字列 $string が utf-8 かどうか判別する場合、
if(mb_check_encoding($string,'UTF-8')){
print ("\$string は UTF-8 です。\n");
}else{
print ("\$string は UTF-8 ではないです。\n");
}
みたいな感じで使う。
mb_detect_encoding
文字列の文字コードを取得する。
$encode = mb_detect_encoding($string);
mb_convert_encoding
文字列を、指定した文字コードに変換する。
euc の文字列を utf-8 に変換する場合、
$utf8_string = mb_convert_encoding($euc_string,'UTF-8','EUC-JP');
みたいな感じで使う。
最後の「'EUC-JP'」の部分は、配列や、カンマ区切りの文字列で指定可能。
また「auto」を指定すると、自動判別してくれる(あまりあてにならない)。
mb_convert_kana
全角文字と半角文字の相互変換。
$string = mb_convert_kana($string,option,'UTF-8');
「option」の部分で、変換前・変換後の文字種を指定する。
- a
- 全角英数字を半角英数字に変換。
- A
- 半角英数字を全角英数字に変換。
- s
- 全角スペースを半角スペースに変換。
- S
- 半角スペースを全角スペースに変換。
- k
- 全角カナを半角カナに変換。
- K
- 半角カナを全角カナに変換。
- h
- 全角かなを半角カナに変換。
- H
- 半角カナを全角かなに変換。
- c
- 全角カナを全角かなに変換。
- C
- 全角かなを全角カナに変換。
- V
- 濁点つき半角カナを一文字の全角文字に変換。K や H と併用。
mb_strlen
文字列の長さを、マルチバイト文字も各一文字扱いで取得する。
$length = mb_strlen($string,'UTF-8');
mb_substr
文字列を、マルチバイト文字も各一文字扱いで、指定した長さにして返す。
文字列の頭から20文字目までを取得したい場合、
$substring = mb_substr($string,0,20,'UTF-8');
みたいな感じにする。
mb_send_mail
自動で文字コードを変換した上で、メール送信する。
mb_send_mail($to_address,$subject,$mailbody);
ただし、自動文字コード変換はあまりあてにならないので、件名や本文の文字コードをあらかじめ変換しておくか、PHP 内部のデフォルト文字コードを設定しておく方が良いかも。
詳しくは、PHPのmb_send_mail()関数で送信したメールが文字化けする際の対処法を参照のこと。
SimpleSAMLphpを使ったPHPアプリケーションのSSO対応ガイド
2025.02.11
SimpleSAMLphpを使ってPHPアプリケーションにSSO機能を追加する方法を紹介します。Microsoft Entra IDとの連携方法や、認証情報の取得方法について詳しく解説します。
Microsoft Entra IDとSimpleSAMLphpを利用したSAML認証SSO構築ガイド
2025.01.26
ローカル環境でMicrosoft Entra IDと連携したSAML認証のシングルサインオンを実現するための手順を紹介します。SimpleSAMLphpを利用した設定方法や、Microsoft側の構成変更について詳しく解説しています。
PHPで文字列をスペースで区切って配列に変換するテクニック
2025.02.09
PHPでキーワード検索を実装する際などに、文字列をスペースで区切って配列に変換する方法を解説します。全角スペースの変換や空要素の削除についても詳しく説明します。
PHPでmPDFを使ってHTMLをPDFに変換する方法
2025.02.07
PHPのライブラリmPDFを使用して、HTMLドキュメントをPDFとして出力する方法を詳しく解説します。インストールから日本語対応まで、具体的なコード例を交えて説明します。