您好,登錄后才能下訂單哦!
這篇文章將為大家詳細講解有關 jieba庫分詞模式怎么在Python項目中使用,文章內容質量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。
全模式:
import jieba seg_list = jieba.cut("南京市長江大橋歡迎你。", cut_all=True) print(type(seg_list),seg_list)
seg_list1 = jieba.lcut("南京市長江大橋歡迎你。", cut_all=False) print(type(seg_list1),seg_list1)
seg_list2 = jieba.cut_for_search("南京市長江大橋歡迎你。") print(type(seg_list2),seg_list2) print("全模式:" + "/ ".join(seg_list)) print("精確模式:" + "/ ".join(seg_list1)) print("搜索引擎模式:" + "/ ".join(seg_list2))
輸出結果:
全模式:南京/ 南京市/ 京市/ 市長/ 長江/ 長江大橋/ 大橋/ 歡迎/ 你/ 。
精確模式:南京市/ 長江大橋/ 歡迎/ 你/ 。
搜索引擎模式:南京/ 京市/ 南京市/ 長江/ 大橋/ 長江大橋/ 歡迎/ 你/ 。
內容擴展:
獲取詞性
我們還可以通過jiaba這個庫把詞性進行區分,比如動詞,名詞等
import jieba.posseg as psg seg_list = psg.cut("我要進行關鍵詞提取") print([(s.word, s.flag) for s in seg_list]) # [('我', 'r'), ('要', 'v'), ('進行', 'v'), ('關鍵詞', 'n'), ('提取', 'v')]
我們還可以提取動詞或者名詞,我們來提取下里面的動詞
import jieba.posseg as psg seg_list = psg.cut("我要進行關鍵詞提取") print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])
關于 jieba庫分詞模式怎么在Python項目中使用就分享到這里了,希望以上內容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。
免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。