在使用 PHP 的 explode
函數分割多字節編碼(如 UTF-8)的字符串時,需要注意確保正確處理字節順序標記(BOM)和字符編碼。以下是一些建議:
$str = preg_replace('/^\xEF\xBB\xBF/', '', $str);
mb_split
函數代替 explode
。mb_split
函數支持多字節編碼,可以正確處理 Unicode 字符。例如,如果您要使用逗號作為分隔符,可以這樣做:$delimiter = ',';
$str = "你好,世界,PHP";
$parts = mb_split($delimiter, $str);
$parts
數組現在將包含分割后的字符串:Array ( [0] => 你好 [1] => 世界 [2] => PHP )
。
explode
,請確保正確計算字符串的字節長度。可以使用 mb_strlen
函數獲取字符串的長度:$delimiter = ',';
$str = "你好,世界,PHP";
$length = mb_strlen($str);
$parts = [];
for ($i = 0; $i < $length; $i += mb_strlen($delimiter)) {
$parts[] = mb_substr($str, $i, mb_strlen($delimiter));
}
這將確保使用正確的分隔符分割多字節編碼的字符串。