您好,登錄后才能下訂單哦!
這篇文章給大家介紹Excel文件利用Poi進行讀取時出現內存溢出如何解決,內容非常詳細,感興趣的小伙伴們可以參考借鑒,希望對大家能有所幫助。
1.dump內存文件
liunx使用如下命令:
./jmap -dump:format=b,file=heap.hprof pid
2.使用Eclipse Memory Analysis進行分析
異常如下:
at org.apache.poi.xssf.usermodel.XSSFRow.<init>(Lorg/openxmlformats/schemas/spreadsheetml/x2006/main/CTRow;Lorg/apache/poi/xssf/usermodel/XSSFSheet;)V (XSSFRow.java:68) at org.apache.poi.xssf.usermodel.XSSFSheet.initRows(Lorg/openxmlformats/schemas/spreadsheetml/x2006/main/CTWorksheet;)V (XSSFSheet.java:157) at org.apache.poi.xssf.usermodel.XSSFSheet.read(Ljava/io/InputStream;)V (XSSFSheet.java:132) at org.apache.poi.xssf.usermodel.XSSFSheet.onDocumentRead()V (XSSFSheet.java:119) at org.apache.poi.xssf.usermodel.XSSFWorkbook.onDocumentRead()V (XSSFWorkbook.java:222) at org.apache.poi.POIXMLDocument.load(Lorg/apache/poi/POIXMLFactory;)V (POIXMLDocument.java:200) at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(Ljava/io/InputStream;)V (XSSFWorkbook.java:179)
POI在加載Excel引發了內存泄漏,中間創建了大量的對象,占用了大量的內存
3.查看上傳的Excel大小
經查看發現很多Excel大小在9M的文件
4.查看代碼POI讀取Excel的方式
發現使用的是用戶模式,這樣會占用大量的內存;POI提供了2中讀取Excel的模式,分別是:
經上面分析基本可以確定問題出在使用POI的用戶模式去讀取Excel大文件,導致內存泄漏。
本地重現
下面模擬一個600kb大小的Excel(test.xlsx),分別用兩種模式讀取,然后觀察內存波動;
1.需要引入的庫maven:
<dependencies> <dependency> <groupId>org.apache.poi</groupId> <artifactId>poi-ooxml</artifactId> <version>3.6</version> </dependency> <dependency> <groupId>com.syncthemall</groupId> <artifactId>boilerpipe</artifactId> <version>1.2.1</version> </dependency> </dependencies>
2.用戶模式代碼如下:
import java.io.File; import java.io.FileInputStream; import java.io.IOException; import java.io.InputStream; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; public class UserModel { public static void main(String[] args) throws InterruptedException { try { Thread.sleep(5000); System.out.println("start read"); for (int i = 0; i < 100; i++) { try { Workbook wb = null; File file = new File("D:/test.xlsx"); InputStream fis = new FileInputStream(file); wb = new XSSFWorkbook(fis); Sheet sheet = wb.getSheetAt(0); for (Row row : sheet) { for (Cell cell : row) { System.out.println("row:" + row.getRowNum() + ",cell:" + cell.toString()); } } } catch (IOException e) { e.printStackTrace(); } } Thread.sleep(1000); } catch (Exception e) { e.printStackTrace(); } } }
3.事件模式代碼如下:
import java.io.InputStream; import org.apache.poi.openxml4j.opc.OPCPackage; import org.apache.poi.xssf.eventusermodel.XSSFReader; import org.apache.poi.xssf.model.SharedStringsTable; import org.apache.poi.xssf.usermodel.XSSFRichTextString; import org.xml.sax.Attributes; import org.xml.sax.ContentHandler; import org.xml.sax.InputSource; import org.xml.sax.SAXException; import org.xml.sax.XMLReader; import org.xml.sax.helpers.DefaultHandler; import org.xml.sax.helpers.XMLReaderFactory; public class EventModel { public void processOneSheet(String filename) throws Exception { OPCPackage pkg = OPCPackage.open(filename); XSSFReader r = new XSSFReader(pkg); SharedStringsTable sst = r.getSharedStringsTable(); XMLReader parser = fetchSheetParser(sst); InputStream sheet2 = r.getSheet("rId1"); InputSource sheetSource = new InputSource(sheet2); parser.parse(sheetSource); sheet2.close(); } public XMLReader fetchSheetParser(SharedStringsTable sst) throws SAXException { XMLReader parser = XMLReaderFactory.createXMLReader("org.apache.xerces.parsers.SAXParser"); ContentHandler handler = new SheetHandler(sst); parser.setContentHandler(handler); return parser; } private static class SheetHandler extends DefaultHandler { private SharedStringsTable sst; private String lastContents; private boolean nextIsString; private SheetHandler(SharedStringsTable sst) { this.sst = sst; } public void startElement(String uri, String localName, String name, Attributes attributes) throws SAXException { if (name.equals("c")) { System.out.print(attributes.getValue("r") + " - "); String cellType = attributes.getValue("t"); if (cellType != null && cellType.equals("s")) { nextIsString = true; } else { nextIsString = false; } } lastContents = ""; } public void endElement(String uri, String localName, String name) throws SAXException { if (nextIsString) { int idx = Integer.parseInt(lastContents); lastContents = new XSSFRichTextString(sst.getEntryAt(idx)).toString(); nextIsString = false; } if (name.equals("v")) { System.out.println(lastContents); } } public void characters(char[] ch, int start, int length) throws SAXException { lastContents += new String(ch, start, length); } } public static void main(String[] args) throws Exception { Thread.sleep(5000); System.out.println("start read"); for (int i = 0; i < 100; i++) { EventModel example = new EventModel(); example.processOneSheet("D:/test.xlsx"); Thread.sleep(1000); } } }
具體代碼來源:http://poi.apache.org/spreadsheet/how-to.html#xssf_sax_api
4.設置VM arguments:-Xms100m -Xmx100m
UserModel運行結果直接報OutOfMemoryError,如下所示:
Exception in thread "main" java.lang.OutOfMemoryError: GC overhead limit exceeded at java.lang.String.substring(String.java:1877) at org.apache.poi.ss.util.CellReference.separateRefParts(CellReference.java:353) at org.apache.poi.ss.util.CellReference.<init>(CellReference.java:87) at org.apache.poi.xssf.usermodel.XSSFCell.<init>(XSSFCell.java:105) at org.apache.poi.xssf.usermodel.XSSFRow.<init>(XSSFRow.java:68) at org.apache.poi.xssf.usermodel.XSSFSheet.initRows(XSSFSheet.java:157) at org.apache.poi.xssf.usermodel.XSSFSheet.read(XSSFSheet.java:132) at org.apache.poi.xssf.usermodel.XSSFSheet.onDocumentRead(XSSFSheet.java:119) at org.apache.poi.xssf.usermodel.XSSFWorkbook.onDocumentRead(XSSFWorkbook.java:222) at org.apache.poi.POIXMLDocument.load(POIXMLDocument.java:200) at org.apache.poi.xssf.usermodel.XSSFWorkbook.<init>(XSSFWorkbook.java:179) at zh.excelTest.UserModel.main(UserModel.java:23)
EventModel可以正常運行,使用Java VisualVM監控結果如下:
UserModel模式下讀取600kbExcel文件直接內存溢出,看了600kbExcel文件映射到內存中還是占用了不少內存;EventModel模式下可以流暢的運行。
5.設置VM arguments:-Xms200m -Xmx200m
UserModel可以正常運行,使用Java VisualVM監控結果如下:
EventModel可以正常運行,使用Java VisualVM監控結果如下:
UserModel模式和EventModel模式都可以正常運行,但是很明顯UserModel模式回收內存更加頻繁,而且在cpu的占用上更高。
總結
通過簡單的分析以及本地運行兩種模式進行比較,可以看到UserModel模式下使用的簡單的代碼實現了讀取,但是在讀取大文件時CPU和內存都不理想;
而EventModel模式雖然代碼寫起來比較繁瑣,但是在讀取大文件時CPU和內存更加占優。
關于Excel文件利用Poi進行讀取時出現內存溢出如何解決就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。