91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Python怎么使用Spacy進行分詞

發布時間:2022-05-12 11:14:36 來源:億速云 閱讀:362 作者:iii 欄目:編程語言

這篇文章主要介紹“Python怎么使用Spacy進行分詞”,在日常操作中,相信很多人在Python怎么使用Spacy進行分詞問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Python怎么使用Spacy進行分詞”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!

說明

1、Spacy語言模型包含一些強大的文本分析功能,如詞性標記和命名實體識別。

2、導入spacy相關模塊后,需要加載中文處理包。然后讀小說數據,nlp處理天龍八部小說,包括分詞、定量、詞性標注、語法分析、命名實體識別,用符號/分隔小說。最后,通過is_stop函數判斷單詞中的單詞是否為無效單詞,刪除無效單詞后,將結果寫入txt文件。

實例

import spacy
import pandas as pd
import time
from spacy.lang.zh.stop_words import STOP_WORDS
 
nlp = spacy.load('zh_core_web_sm')
 
def fenci_stopwords(data,newdata1):
    fenci = []
    qc_stopwords =[]
 
    article = pd.read_table(data,encoding="utf-8")
    start1 = time.time()
    with open(newdata1,'w',encoding='utf-8') as f1:
        for i in article["天龍八部"]:#分詞
            doc = nlp(i)
            result1 = '/'.join([t.text for t in doc])
            fenci.append(result1)
 
  for j in fenci:#去除停用詞   
            words = nlp.vocab[j]    
            if words.is_stop == False:        
                qc_stopwords.append(j)
                result2 = '/'.join(qc_stopwords)
                f1.write(result2)
    end1 = time.time()
    return end1-start1

到此,關于“Python怎么使用Spacy進行分詞”的學習就結束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續學習更多相關知識,請繼續關注億速云網站,小編會繼續努力為大家帶來更多實用的文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

曲靖市| 邮箱| 邹城市| 柳河县| 普宁市| 长垣县| 涟源市| 蛟河市| 墨竹工卡县| 邹城市| 滨海县| 怀仁县| 信宜市| 库尔勒市| 永登县| 大渡口区| 尖扎县| 义乌市| 宜丰县| 黄梅县| 阆中市| 巴中市| 天全县| 安乡县| 彭山县| 麻栗坡县| 沙湾县| 青海省| 民丰县| 甘洛县| 美姑县| 平南县| 绥芬河市| 兴城市| 和静县| 乐山市| 五寨县| 昭觉县| 锡林郭勒盟| 宣化县| 浠水县|