您好,登錄后才能下訂單哦!
本篇內容主要講解“NewOCR特色是什么”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“NewOCR特色是什么”吧!
NewOCR是一個免費的在線OCR(光學符合識別)服務,可幫助用戶分析上傳的任何圖像文件中的文本,然后將圖像中的文本轉換為可以在電腦上輕松編輯的文本,目前該網站支持多國語言。
NewOCR特色:
1、無上傳限制;
2、無需注冊即可使用;
3、保證數據安全,所有用戶上傳的文件都會從服務器中刪除,不做保留;
4、基于TesseractOCR引擎;
5、106種識別語言和字體支持;
6、支持的文件格式:JPEG,JFIF,PNG,GIF,BMP,PBM,PGM,PPM,PCX;Unix壓縮,bzip2,bzip,gzip;TIFF,PDF,DjVu;帶有圖像的DOCX,ODT文件;ZIP存檔中的多個圖像。
7、輸出格式:純文本(TXT)、MicrosoftWord(DOC)、AdobeAcrobat(PDF)。
OCR概念由來
OCR(OpticalCharacterRecognition,光學字符識別)是指電子設備(例如掃描儀或數碼相機)檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過程;即,針對印刷體字符,采用光學的方式將紙質文檔中的文字轉換成為黑白點陣的圖像文件,并通過識別軟件將圖像中的文字轉換成文本格式,供文字處理軟件進一步編輯加工的技術。如何除錯或利用輔助信息提高識別正確率,是OCR最重要的課題,ICR(IntelligentCharacterRecognition)的名詞也因此而產生。衡量一個OCR系統性能好壞的主要指標有:拒識率、誤識率、識別速度、用戶界面的友好性,產品的穩定性,易用性及可行性等。
OCR的概念是在1929年由德國科學家Tausheck最先提出來的,后來美國科學家Handel也提出了利用技術對文字進行識別的想法。而最早對印刷體漢字識別進行研究的是IBM公司的Casey和Nagy,1966年他們發表了第一篇關于漢字識別的文章,采用了模板匹配法識別了1000個印刷體漢字。
到此,相信大家對“NewOCR特色是什么”有了更深的了解,不妨來實際操作一番吧!這里是億速云網站,更多相關內容可以進入相關頻道進行查詢,關注我們,繼續學習!
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。