您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關使用PHP怎么實現抓取小說網站內容功能,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
具體如下:
ini_set('user_agent','Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; .NET CLR 2.0.50727; .NET CLR 3.0.04506.30; GreenBrowser)'); ini_set('max_execution_time', '0'); $base = 'https://www.qu.la/book/19434/'; $start = '7504808.html'; $content_grep = '/ (.*)<br\/>/'; //$content_grep = '/<div id="content">(.*)<br\/>/sS'; $next_grep = '/<a id="pager_next" href=\"(\d+\.html)\" target="_top" class="next">下一章<\/a>/'; $next = $start; $file_name = '聽書了.txt'; while($next) { echo 'getting ' . $next . PHP_EOL; $result = file_get_contents($base . $next); preg_match_all($content_grep, $result, $match); $isTitle = true; $content = ""; foreach($match[1] as $line) { $line = str_replace("<br/>", '', $line); $line = str_replace(" ", '', $line); if($isTitle) { $content = $line . PHP_EOL . PHP_EOL; $isTitle = false; } else { $content .= ' ' . $line . PHP_EOL . PHP_EOL; } } $file = fopen($file_name, 'a'); echo 'write length: ' . strlen($content) . PHP_EOL; fwrite($file, $content); fclose($file); echo '.'; preg_match($next_grep, $result, $match); $next = $match[1]; }
php的框架:1、Laravel,Laravel是一款免費并且開源的PHP應用框架。2、Phalcon,Phalcon是運行速度最快的一個PHP框架。3、Symfony,Symfony是一款為Web項目準備的PHP框架。4、Yii,Yii是一款快速、安全和專業的PHP框架。5、CodeIgniter,CodeIgniter是一款非常敏捷的開源PHP框架。6、CakePHP,CakePHP是一款老牌的PHP框架。7.Kohana,Kohana是一款敏捷但是功能強大的PHP框架。
關于使用PHP怎么實現抓取小說網站內容功能就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。