您好,登錄后才能下訂單哦!
本篇內容介紹了“如何使用Curl進行抓取遠程內容時url中文編碼問題”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!
PHP中對于URL進行編碼,可以使用 urlencode() 或者 rawurlencode(),二者的區別是前者把空格編碼為 '+',而后者把空格編碼為 '%20',不過應該注意的是,在編碼時應該只對部分URL編碼,否則URL中的冒號和反斜杠也會被轉義。下面是詳細解釋:
復制代碼 代碼如下:
string urlencode( string str)
返回字符串,此字符串中除了 -_. 之外的所有非字母數字字符都將被替換成百分號(%)后跟兩位十六進制數,空格則編碼為加號(+)。
例子 1 :urlencode函數與rawurlencode函數區別
復制代碼 代碼如下:
$str='博 客';
echo urlencode($str);
echo "<br>";
echo rawurlencode($str);
url結果:
復制代碼 代碼如下:
%B2%A9+%BF%CD
%B2%A9%20%BF%CD
例子 2 :url中文編碼方法
從url:"http://www.baidu.com/s?wd=博 客" 轉為 url:"http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2";
復制代碼 代碼如下:
$url='http://www.baidu.com/s?wd=博 客';
$arr=explode('=',$url);
$url=$arr[0].'='.rawurlencode($arr[1]);
echo $url;
結果:
http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2
或許用以下url編碼函數
復制代碼 代碼如下:
function cn_urlencode($url){
$pregstr = "/[\x{4e00}-\x{9fa5}]+/u";//UTF-8中文正則
if(preg_match_all($pregstr,$url,$matchArray)){//匹配中文,返回數組
foreach($matchArray[0] as $key=>$val){
$url=str_replace($val, urlencode($val), $url);//將轉譯替換中文
}
if(strpos($url,' ')){//若存在空格
$url=str_replace(' ','%20',$url);
}
}
return $url;
}
url結果:
http://www.baidu.com/s?wd=%E5%8D%9A%20%E5%AE%A2
“如何使用Curl進行抓取遠程內容時url中文編碼問題”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。