您好,登錄后才能下訂單哦!
本篇內容主要講解“java讀取文件里面部分漢字內容亂碼怎么辦”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“java讀取文件里面部分漢字內容亂碼怎么辦”吧!
讀取一個txt文件,到代碼中打印出來,發票有部分漢字的內容是亂碼的。
我開始的方式是這樣的, 如下,這是完全錯誤的,漢字是兩個字節的,如果每次讀固定個字節,可能會把漢字截斷。
就會出現部分亂碼的情況。
package susq.path; import java.io.File; import java.io.FileInputStream; import java.io.IOException; /** * @author susq * @since 2018-05-18-19:28 */ public class WrongMethodReadTxt { public static void main(String[] args) throws IOException { ClassLoader classLoader = WrongMethodReadTxt.class.getClassLoader(); String filePath = classLoader.getResource("").getPath() + "/expect1.txt"; System.out.println(filePath); File file = new File(filePath); try (FileInputStream in = new FileInputStream(file)) { byte[] bytes = new byte[1024]; StringBuffer sb = new StringBuffer(); int len; while ((len = in.read(bytes)) != -1) { sb.append(new String(bytes, 0, len)); } System.out.println(sb.toString()); } } }
如果存在漢字,就要按字符的方式讀取:
package susq.path; import java.io.BufferedReader; import java.io.File; import java.io.FileReader; import java.io.IOException; /** * @author susq * @since 2018-05-18-17:39 */ public class SysPath { public static void main(String[] args) throws IOException { ClassLoader classLoader = SysPath.class.getClassLoader(); String filePath = classLoader.getResource("").getPath() + "/expect1.txt"; System.out.println(filePath); File file = new File(filePath); try (BufferedReader br = new BufferedReader(new FileReader(file))) { StringBuffer sb = new StringBuffer(); while (br.ready()) { sb.append(br.readLine()); } System.out.println(sb); } } }
情況:用IO流讀取數據時,若是不設置編碼格式,出來的數據未必是我們所要的
代碼:(字符串設置對應的編碼即可,但這種方式,會導致個別中文亂碼,貌似是byte[]導致的)
//這里我通過socket方式,獲取流,并讀取數據 //代理需要外置配置(代理配置需要判斷,若有配置,則添加,若無配置,則不添加) Socket socket = new Socket("192.168.99.100", 80); String url = "GET " + href + " HTTP/1.1\r\n\r\n"; socket.getOutputStream().write(new String(url).getBytes()); InputStream is = socket.getInputStream(); byte[] bs = new byte[1024]; int i; StringBuilder str = new StringBuilder(); while ((i = is.read(bs)) > 0) { //一定要加編碼,不然,在輸出到文件時,部分數據會亂 str.append(new String(bs, 0, i,"UTF-8")); //由于socket讀取不會斷開,所以只能自斷開連接讀取 if(new String(bs, 0, i,"UTF-8").contains("</html>")){ break; } }
代碼:
//代理需要外置配置(代理配置需要判斷,若有配置,則添加,若無配置,則不添加) Socket socket = new Socket("192.168.99.100", 80); //Socket socket = new Socket(); String url = "GET " + href + " HTTP/1.1\r\n\r\n"; socket.getOutputStream().write(new String(url).getBytes()); InputStream is = socket.getInputStream(); //解決個別中文亂碼 StringBuilder str = new StringBuilder(""); InputStreamReader isr = new InputStreamReader(is,"UTF-8"); BufferedReader br = new BufferedReader(isr); String line = null; while ((line = br.readLine()) != null) { str.append(line + "\n"); if(line.contains("</html>")){ break; } }
到此,相信大家對“java讀取文件里面部分漢字內容亂碼怎么辦”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。