您好,登錄后才能下訂單哦!
本篇內容介紹了“如何解決GBK中文遭遇亂碼的問題”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
類似如下的字符串(GBK), explode不能得到正確結果:
1.$result = explode("|", "滕華弢|海青"); 究其原因, 對于”弢”字(讀tao,不認識沒關系,我也不認識), 因為他的GBK編碼值為: 8f7c, 不巧的是, “|”的ASCII值也是7c.
這樣的問題, 還有很多 : 因為GBK編碼的編碼范圍是: 0×8140-0xfefe, 所以, 理論上來說, 任何低字節是7c的字都會有這個問題, 比如:
1.倈(827c), 億(837c), 眧(b17c), 鍇(e57c).......等等等等對于這樣的情況,
1.第一, 可以采用轉碼到utf8, 然后explode, 再轉回來, 這是比較麻煩的方法.
2.第二, 我們可以采用正則拿"匹配出"來代替"分離出":
3.preg_match_all("/([/x81-/xfe][/x40-/xfe])+/", $gbk_str, $matches);//寫死編碼這樣, $matches中0號索引對應的數組就是結果詞的數組了..
“如何解決GBK中文遭遇亂碼的問題”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。