技術資料

PHPで便利なマルチバイト文字操作関数をまとめて紹介

2009.03.09

PHP

error この記事は最終更新日から15年以上が経過しています。

プログラミングをする上で、マルチバイト文字(全角文字etc)の扱いというのはなかなか面倒な問題ですよね。
言語側で用意されている文字列操作系関数が、1バイト文字にしか対応していなくて困ったりとか。

PHP のマルチバイト文字操作系関数(mb_ が頭につく関数群)は、そういう意味で非常に便利な存在だといえます。

というわけで、個人的によくお世話になっている(or 今後なる予定の)関数群を、備忘録的にまとめておきます。

mb_check_encoding

文字列が、指定した文字コードかどうか判別する関数。

文字列 $string が utf-8 かどうか判別する場合、

if(mb_check_encoding($string,'UTF-8')){
    print ("\$string は UTF-8 です。\n");
}else{
    print ("\$string は UTF-8 ではないです。\n");
}

みたいな感じで使う。

mb_detect_encoding

文字列の文字コードを取得する。

$encode = mb_detect_encoding($string);

mb_convert_encoding

文字列を、指定した文字コードに変換する。

euc の文字列を utf-8 に変換する場合、

$utf8_string = mb_convert_encoding($euc_string,'UTF-8','EUC-JP');

みたいな感じで使う。

最後の「'EUC-JP'」の部分は、配列や、カンマ区切りの文字列で指定可能。
また「auto」を指定すると、自動判別してくれる(あまりあてにならない)。

mb_convert_kana

全角文字と半角文字の相互変換。

$string = mb_convert_kana($string,option,'UTF-8');

「option」の部分で、変換前・変換後の文字種を指定する。

a
全角英数字を半角英数字に変換。
A
半角英数字を全角英数字に変換。
s
全角スペースを半角スペースに変換。
S
半角スペースを全角スペースに変換。
k
全角カナを半角カナに変換。
K
半角カナを全角カナに変換。
h
全角かなを半角カナに変換。
H
半角カナを全角かなに変換。
c
全角カナを全角かなに変換。
C
全角かなを全角カナに変換。
V
濁点つき半角カナを一文字の全角文字に変換。K や H と併用。

mb_strlen

文字列の長さを、マルチバイト文字も各一文字扱いで取得する。

$length = mb_strlen($string,'UTF-8');

mb_substr

文字列を、マルチバイト文字も各一文字扱いで、指定した長さにして返す。

文字列の頭から20文字目までを取得したい場合、

$substring = mb_substr($string,0,20,'UTF-8');

みたいな感じにする。

mb_send_mail

自動で文字コードを変換した上で、メール送信する。

mb_send_mail($to_address,$subject,$mailbody);

ただし、自動文字コード変換はあまりあてにならないので、件名や本文の文字コードをあらかじめ変換しておくか、PHP 内部のデフォルト文字コードを設定しておく方が良いかも。
詳しくは、PHPのmb_send_mail()関数で送信したメールが文字化けする際の対処法を参照のこと。

PHPでGoogle Analyticsデータを取得する初心者向けガイド:APIの設定からコード例まで

2024.12.25

Google Analytics Data API の有効化から、PHP を使った具体的なデータ取得手順まで、わかりやすく解説しています。初心者の方でも安心して実装できるよう、コード例も用意。

Google Analytics Data API PHP

PHPで扱う日付と時刻の基礎:DateTimeImmutableの活用例

2024.12.07

PHPで日付や時刻を操作する際、DateTimeImmutableクラスを使用することで、データの安全性と効率的な処理が実現します。本記事では、基本的な使い方から日付の加減算、フォーマット指定、時刻比較まで、実践的な例を通じて解説します。

PHP

OGP画像作成を効率化:PHPを使った自動生成方法を解説

2024.11.21

SNSシェアに欠かせないOGP画像、毎回手作業で作成するのは手間がかかりますよね。本記事では、PHPを使って記事タイトルを含むOGP画像を自動生成する方法を解説します。テンプレート画像を活用した簡単な手順をぜひお試しください。

PHP

PHPによるCSRF対策入門:トークン生成から認証までの流れを解説

2024.11.19

フォーム送信時のセキュリティを高めるためには、CSRF対策が欠かせません。本記事では、PHPでのトークン生成から認証チェックまで、実装手順を具体的に解説します。

PHP

阿部辰也へのお仕事の依頼・お問い合わせ

お名前 *必須
会社名
メールアドレス *必須
電話番号
URL
お問い合わせのきっかけ
お問い合わせの内容 *必須
個人情報の取り扱いについて *必須 プライバシーポリシーをご確認いただき、同意いただける場合は「同意する」にチェックをしてください。

keyboard_double_arrow_up
TOP