是的,Playwright for Java 可以用來編寫爬蟲。Playwright 是一個用于多瀏覽器自動化的 Node.js 庫,但它也提供了 Java 綁定。通過 Playwright for Java,你可以控制瀏覽器,生成頁面內容,抓取數據等。
以下是一個簡單的 Playwright for Java 爬蟲示例:
import com.microsoft.playwright.*;
public class WebScraper {
public static void main(String[] args) throws Exception {
// 啟動瀏覽器
Browser browser = Browser.launch();
// 新建一個頁面
Page page = browser.newPage();
// 導航到目標網站
page.navigate("https://example.com");
// 獲取頁面標題
String title = page.title();
System.out.println("Page title: " + title);
// 抓取頁面上的鏈接
List<String> links = page.$$eval("a", links -> links.stream()
.map(a -> a.getAttribute("href"))
.collect(Collectors.toList()));
System.out.println("Links: " + links);
// 關閉瀏覽器
browser.close();
}
}
這個示例展示了如何使用 Playwright for Java 打開一個瀏覽器窗口,導航到一個網站,獲取頁面標題和鏈接。你可以根據需要擴展這個示例,以實現更復雜的爬蟲功能。