91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

利用Java怎么對網頁數據進行獲取

發布時間:2021-01-22 17:00:37 來源:億速云 閱讀:296 作者:Leah 欄目:編程語言

這篇文章將為大家詳細講解有關利用Java怎么對網頁數據進行獲取,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。

1:通過HttpClient請求到達某網頁的url訪問地址(特別需要注意的是請求方式)

2:獲取網頁源碼

3:查看源碼是否有我們需要提取的數據

4:對源碼進行拆解,一般使用分割,正則或者第三方jar包

5:獲取需要的數據對自己創建的對象賦值

6:數據提取保存

下面簡單的說一下在提取數據中的部分源碼,以及用途:

/**
   * 向指定URL發送GET方法的請求
   *
   * @param url
   *      發送請求的URL
   * @param param
   *      請求參數,請求參數應該是 name1=value1&name2=value2 的形式。
   * @return URL 所代表遠程資源的響應結果
   */
  public static String sendGet(String url, String param) {
    String result = "";
    BufferedReader in = null;
    try {
      String urlNameString = url;
      URL realUrl = new URL(urlNameString);
      // 打開和URL之間的連接
      URLConnection connection = realUrl.openConnection();
      // 設置通用的請求屬性
      connection.setRequestProperty("accept", "*/*");
      connection.setRequestProperty("connection", "Keep-Alive");
      connection.setRequestProperty("user-agent",
          "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1;SV1)");
      // 建立實際的連接
      connection.connect();
      // 獲取所有響應頭字段
      Map<String, List<String>> map = connection.getHeaderFields();

      // 定義 BufferedReader輸入流來讀取URL的響應
      in = new BufferedReader(new InputStreamReader(
          connection.getInputStream())); //這里如果出現亂碼,請使用帶編碼的InputStreamReader構造方法,將需要的編碼設置進去
      String line;
      while ((line = in.readLine()) != null) {
        result += line;
      }
    } catch (Exception e) {
      System.out.println("發送GET請求出現異常!" + e);
      e.printStackTrace();
    }
    // 使用finally塊來關閉輸入流
    finally {
      try {
        if (in != null) {
          in.close();
        }
      } catch (Exception e2) {
        e2.printStackTrace();
      }
    }
    return result;
  }

解析存儲數據

public Bid getData(String html) throws Exception {
    //獲取的數據,存放在到Bid的對象中,自己可以重新建立一個對象存儲
    Bid bid = new Bid();
    //采用Jsoup解析
    Document doc = Jsoup.parse(html);
    // System.out.println("doc內容" + doc.text());
    //獲取html標簽中的內容tr
    Elements elements = doc.select("tr");
    System.out.println(elements.size() + "****條");
    //循環遍歷數據
    for (Element element : elements) {
      if (element.select("td").first() == null){
        continue;
      }
      Elements tdes = element.select("td");
      for(int i = 0; i < tdes.size(); i++){
        this.relation(tdes,tdes.get(i).text(),bid,i+1);
      }
    }
    return bid;
  }

得到的數據

Bid {
  h3 = '詳見內容', 
   itemName = '訴訟服務中心設備采購',
   item = '貨物/辦公消耗用品及類似物品/其他辦公消耗用品及類似物品', 
   itemUnit = '詳見內容', 
   areaName = '港北區', 
   noticeTime = '2018年10月22日 18:41',
   itemNoticeTime = 'null',
   itemTime = 'null',
   kaibiaoTime = '2018年10月26日 09:00', 
   winTime = 'null',
   kaibiaoDiDian = 'null', 
   yusuanMoney = '¥67.00元(人民幣)', 
   allMoney = 'null', 
   money = 'null', 
   text = ''
}

關于利用Java怎么對網頁數據進行獲取就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

抚宁县| 洞口县| 内江市| 泗洪县| 浦北县| 昌宁县| 呼和浩特市| 衢州市| 新郑市| 昌乐县| 大姚县| 邻水| 麻城市| 光山县| 绥棱县| 龙岩市| 琼海市| 梨树县| 新津县| 中江县| 靖宇县| 锦屏县| 忻州市| 民权县| 蒲城县| 安吉县| 株洲县| 三河市| 济宁市| 乌兰浩特市| 牙克石市| 星子县| 吉木萨尔县| 巴林左旗| 厦门市| 平乐县| 都安| 冕宁县| 浦县| 和林格尔县| 仙游县|