PHPで便利なマルチバイト文字操作関数をまとめて紹介
2009.03.09
error この記事は最終更新日から15年以上が経過しています。
プログラミングをする上で、マルチバイト文字(全角文字etc)の扱いというのはなかなか面倒な問題ですよね。
言語側で用意されている文字列操作系関数が、1バイト文字にしか対応していなくて困ったりとか。
PHP のマルチバイト文字操作系関数(mb_ が頭につく関数群)は、そういう意味で非常に便利な存在だといえます。
というわけで、個人的によくお世話になっている(or 今後なる予定の)関数群を、備忘録的にまとめておきます。
mb_check_encoding
文字列が、指定した文字コードかどうか判別する関数。
文字列 $string が utf-8 かどうか判別する場合、
if(mb_check_encoding($string,'UTF-8')){
print ("\$string は UTF-8 です。\n");
}else{
print ("\$string は UTF-8 ではないです。\n");
}
みたいな感じで使う。
mb_detect_encoding
文字列の文字コードを取得する。
$encode = mb_detect_encoding($string);
mb_convert_encoding
文字列を、指定した文字コードに変換する。
euc の文字列を utf-8 に変換する場合、
$utf8_string = mb_convert_encoding($euc_string,'UTF-8','EUC-JP');
みたいな感じで使う。
最後の「'EUC-JP'」の部分は、配列や、カンマ区切りの文字列で指定可能。
また「auto」を指定すると、自動判別してくれる(あまりあてにならない)。
mb_convert_kana
全角文字と半角文字の相互変換。
$string = mb_convert_kana($string,option,'UTF-8');
「option」の部分で、変換前・変換後の文字種を指定する。
- a
- 全角英数字を半角英数字に変換。
- A
- 半角英数字を全角英数字に変換。
- s
- 全角スペースを半角スペースに変換。
- S
- 半角スペースを全角スペースに変換。
- k
- 全角カナを半角カナに変換。
- K
- 半角カナを全角カナに変換。
- h
- 全角かなを半角カナに変換。
- H
- 半角カナを全角かなに変換。
- c
- 全角カナを全角かなに変換。
- C
- 全角かなを全角カナに変換。
- V
- 濁点つき半角カナを一文字の全角文字に変換。K や H と併用。
mb_strlen
文字列の長さを、マルチバイト文字も各一文字扱いで取得する。
$length = mb_strlen($string,'UTF-8');
mb_substr
文字列を、マルチバイト文字も各一文字扱いで、指定した長さにして返す。
文字列の頭から20文字目までを取得したい場合、
$substring = mb_substr($string,0,20,'UTF-8');
みたいな感じにする。
mb_send_mail
自動で文字コードを変換した上で、メール送信する。
mb_send_mail($to_address,$subject,$mailbody);
ただし、自動文字コード変換はあまりあてにならないので、件名や本文の文字コードをあらかじめ変換しておくか、PHP 内部のデフォルト文字コードを設定しておく方が良いかも。
詳しくは、PHPのmb_send_mail()関数で送信したメールが文字化けする際の対処法を参照のこと。
PHPでGoogle Analyticsデータを取得する初心者向けガイド:APIの設定からコード例まで
2024.12.25
Google Analytics Data API の有効化から、PHP を使った具体的なデータ取得手順まで、わかりやすく解説しています。初心者の方でも安心して実装できるよう、コード例も用意。
PHPで扱う日付と時刻の基礎:DateTimeImmutableの活用例
2024.12.07
PHPで日付や時刻を操作する際、DateTimeImmutableクラスを使用することで、データの安全性と効率的な処理が実現します。本記事では、基本的な使い方から日付の加減算、フォーマット指定、時刻比較まで、実践的な例を通じて解説します。
OGP画像作成を効率化:PHPを使った自動生成方法を解説
2024.11.21
SNSシェアに欠かせないOGP画像、毎回手作業で作成するのは手間がかかりますよね。本記事では、PHPを使って記事タイトルを含むOGP画像を自動生成する方法を解説します。テンプレート画像を活用した簡単な手順をぜひお試しください。
PHPによるCSRF対策入門:トークン生成から認証までの流れを解説
2024.11.19
フォーム送信時のセキュリティを高めるためには、CSRF対策が欠かせません。本記事では、PHPでのトークン生成から認証チェックまで、実装手順を具体的に解説します。