要使用PHP提取網頁上的所有文字,可以使用PHP的DOMDocument和XPath庫來解析HTML頁面并提取文本內容。
以下是一個示例代碼:
<?php
// 網頁地址
$url = 'http://example.com';
// 創建DOMDocument對象
$dom = new DOMDocument();
// 加載網頁
$dom->loadHTMLFile($url);
// 創建XPath對象
$xpath = new DOMXPath($dom);
// 使用XPath查詢所有文本節點
$textNodes = $xpath->query('//text()');
// 遍歷文本節點并提取文本內容
foreach ($textNodes as $textNode) {
$text = trim($textNode->nodeValue);
// 輸出文本內容
echo $text . "\n";
}
?>
在上述代碼中,首先通過DOMDocument
對象加載指定網頁,然后使用DOMXPath
對象查詢所有的文本節點。接著使用foreach
循環遍歷文本節點,并通過nodeValue
屬性獲取文本內容。
最后,可以將提取的文本內容輸出到控制臺或保存到文件中,根據自己的需求進行處理。