91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

利用Java怎么對郵箱進行爬取

發布時間:2020-12-08 16:10:48 來源:億速云 閱讀:186 作者:Leah 欄目:編程語言

這篇文章給大家介紹利用Java怎么對郵箱進行爬取,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。

實現方法如下:

package day05; 
import java.io.BufferedReader; 
import java.io.IOException; 
import java.io.InputStreamReader; 
import java.net.URL; 
import java.util.ArrayList; 
import java.util.List; 
import java.util.regex.Matcher; 
import java.util.regex.Pattern; 
public class SpiderDemo { 
  public static void main(String[] args) throws IOException { 
    List<String> list = getMailByWeb(); 
    for (String mail : list) { 
      System.out.println(mail); 
    } 
  } 
  public static List<String> getMailByWeb() throws IOException { 
    URL url = new URL("http://www.itheima.com/aboutt/1376.html"); 
    BufferedReader input = new BufferedReader(new InputStreamReader(url.openStream())); 
    String regex = "\\w+@\\w+(\\.\\w+)+"; 
    Pattern p = Pattern.compile(regex); 
    List<String> list = new ArrayList<String>(); 
    String line = null; 
    while ((line = input.readLine()) != null) { 
      Matcher m = p.matcher(line); 
      while (m.find()) { 
        list.add(m.group()); 
      } 
    } 
    return list; 
  } 
} 

總結

 Jsoup解析html方法,通常被人稱之為爬蟲技術。(個人認為可能是返回的數據,只有一小部分是我們需要的,造成了數據的冗余,和網絡延遲)。

關于利用Java怎么對郵箱進行爬取就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

葵青区| 瑞金市| 巧家县| 喀喇| 清新县| 县级市| 鱼台县| 随州市| 集安市| 乐昌市| 抚宁县| 横山县| 怀柔区| 中宁县| 昭平县| 洛阳市| 呼和浩特市| 乌拉特前旗| 聊城市| 射阳县| 双峰县| 广丰县| 马鞍山市| 闸北区| 如东县| 津南区| 海原县| 旺苍县| 六安市| 札达县| 广州市| 海安县| 康定县| 吴江市| 永善县| 辽宁省| 台中市| 安徽省| 长子县| 依安县| 齐齐哈尔市|