您好,登錄后才能下訂單哦!
jieba庫:
利用一個中文詞庫,確定中文字符之間的關聯概率
中文字符間概率大的組成詞組,形成分詞結果
jieba庫分詞的三種模式:精確模式、全模式、搜索引擎模式
精確模式:把文本精確的切分開,不存在冗余單詞
全模式:把文本中所有可能的詞語都掃描出來,有冗余
搜索引擎模式:在精確模式的基礎上,對長詞再次切分
常用函數:
jieba.lcut(s):精確模式,返回一個列表類型的分詞結果
jieba.lcut(s,cut_all=True):全模式,返回一個列表類型的分詞結果,存在冗余
jieba.lcut_for_search(s):搜索引擎模式,返回一個列表類型的分詞結果,存在冗余
jieba.add_word(w):向分詞詞典增加新詞w
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。