91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

怎么在php中利用遞歸抓取網頁內容

發布時間:2021-01-16 11:30:36 來源:億速云 閱讀:150 作者:Leah 欄目:開發技術

本篇文章給大家分享的是有關怎么在php中利用遞歸抓取網頁內容,小編覺得挺實用的,因此分享給大家學習,希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

具體如下:

<?php
class crawler{
 private $_depth=5;
 private $_urls=array();
 function extract_links($url)
 {
  if(!$this->_started){
   $this->_started=1;
   $curr_depth=0;
  }else{
   $curr_depth++;
  }
  if($curr_depth<$this->_depth)
  {
   $data=file_get_contents($url);
   if(preg_match_all('/((?:http|https)://(?:www.)*(?:[a-zA-Z0-9_-]{1,15}.+[a-zA-Z0-9_]{1,}){1,}(?:[a-zA-Z0-9_/.-?&:%,!;]*))/',$data,$urls12))
   {
    foreach($urls12[0] as $k=>$v){
     $check=get_headers($v,1);
     if(strstr($v,$url) && $check[0]=='HTTP/1.1 200 OK' && !array_search($v,$this->_urls) && $curr_depth<$this->_depth){
      $this->_urls[]=$v;
      $this->extract_links($v);
     }
    }
   }
  }
  return $this->_urls;
 }
}
?>

以上就是怎么在php中利用遞歸抓取網頁內容,小編相信有部分知識點可能是我們日常工作會見到或用到的。希望你能通過這篇文章學到更多知識。更多詳情敬請關注億速云行業資訊頻道。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

博罗县| 镇沅| 淄博市| 新宾| 通渭县| 苍山县| 台山市| 阿勒泰市| 凤台县| 长乐市| 广宗县| 宁晋县| 玉溪市| 扎赉特旗| 从江县| 固镇县| 大足县| 同心县| 集贤县| 广水市| 东兰县| 得荣县| 正安县| 徐闻县| 平凉市| 石屏县| 宜昌市| 进贤县| 林甸县| 佳木斯市| 石楼县| 鄂伦春自治旗| 株洲市| 启东市| 吉隆县| 老河口市| 上虞市| 凉山| 铜山县| 绿春县| 彩票|