您好,登錄后才能下訂單哦!
本文實例為大家分享了java抓取郵箱號碼的具體代碼,供大家參考,具體內容如下
java抓取文件中郵箱號碼的具體代碼
package reg; import java.io.BufferedReader; import java.io.FileNotFoundException; import java.io.FileReader; import java.io.IOException; import java.util.ArrayList; import java.util.List; import java.util.regex.Matcher; import java.util.regex.Pattern; public class TestEmail { public static void main(String[] args) { // TODO Auto-generated method stub BufferedReader br=null; try { br=new BufferedReader(new FileReader("D:/1.htm")); String str=null; StringBuilder sb=new StringBuilder(); while((str=br.readLine())!=null){ sb.append(str); } List es=getEmail(sb.toString()); for(String e:es){ System.out.println(e); } } catch (FileNotFoundException e) { // TODO: handle exception e.printStackTrace(); }catch (IOException e) { // TODO: handle exception e.printStackTrace(); }finally { try { if(br!=null) br.close(); } catch (IOException e) { // TODO: handle exception e.printStackTrace(); } } } public static List getEmail(String str){ List es=new ArrayList(); Pattern p=Pattern.compile("[\\w\\.-]*\\w+@[\\w\\.-]*\\w+\\.\\w{2,5}"); // Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+"); Matcher m=p.matcher(str); while(m.find()){ es.add(m.group()); } return es; } }
java抓取網頁中郵箱號碼的具體代碼
package reg; import java.io.BufferedReader; import java.io.InputStreamReader; import java.util.regex.Matcher; import java.util.regex.Pattern; public class Testemail01 { public static String getWebCon(String domain) { System.out.println("開始抓取郵件地址..("+domain+")"); StringBuffer sb=new StringBuffer(); try { java.net.URL url=new java.net.URL(domain); BufferedReader in=new BufferedReader(new InputStreamReader(url.openStream())); String line; while((line=in.readLine())!=null) { parse(line); } in.close(); } catch(Exception e) { sb.append(e.toString()); System.err.println(e); } return sb.toString(); } public static void main(String[] args) { String s=Testemail01.getWebCon("http://tieba.baidu.com/p/2366935784"); } private static void parse(String line) { Pattern p=Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");//郵箱的正則表達式 Matcher m=p.matcher(line); while(m.find()) { System.out.println(m.group()); } } }
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持億速云。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。