91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python語言檢測模塊langid和langdetect的使用實例

發布時間:2020-08-25 02:13:17 來源:腳本之家 閱讀:319 作者:Together_CZ 欄目:開發技術

之前使用數據編碼風格檢測的模塊chardet比較多一點,今天提到的兩個模塊是檢測數據的語言類型,比如是:中文還是英文,模塊的使用方法也比較簡單,我這里只是簡單地使用了一下,因為項目中有這個需求,所以拿來用了一下,并沒有深入地去研究這兩個模塊,模塊的地址鏈接我都給出來了,需要的話可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我們都有一個家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介紹兩款語言探測工具,用于區分文本到底是什么語言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()輸出探測出的所有語言類型及其所占的比例
  print detect_langs("Otec matka syn.")

結果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

總結

以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,謝謝大家對億速云的支持。如果你想了解更多相關內容請查看下面相關鏈接

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

阳朔县| 兰州市| 搜索| 德令哈市| 阿拉善左旗| 黑河市| 玛纳斯县| 富民县| 宾川县| 永丰县| 托克逊县| 昌邑市| 枣强县| 宾阳县| 尼玛县| 合肥市| 合山市| 乌什县| 汉沽区| 新绛县| 兴国县| 当阳市| 桑植县| 安乡县| 高密市| 仙居县| 邯郸市| 科尔| 夹江县| 临高县| 济宁市| 永泰县| 资讯| 无为县| 勐海县| 沂水县| 九台市| 龙里县| 建湖县| 衡阳市| 南开区|