91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本

溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

python可視化數據實例分析

發布時間:2022-05-17 11:39:15 來源:億速云 閱讀:163 作者:zzz 欄目:大數據

本篇內容介紹了“python可視化數據實例分析”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠學有所成!

1.詞頻統計

我們利用Python里的jieba分詞、matplotlib模塊分析整篇文章詞匯,并提取詞頻前20的詞語,得到結果如下:

python可視化數據實例分析

確實,涉及到兩位明星的詞語是最多的,其次是阿麗姐(不知道是不是作者的化身)。贊贊在其中是女性角色,難怪粉絲們暴跳如雷。這樣分析,似乎看不出太多的內含,我們把維度細化一點。

從敏感角度看,這個詞匯頻率會是怎樣的呢?由于純潔的我實在是接受不了,因此打了點馬賽克(如果這樣你都能猜出是什么詞....嗯...建議多看看天線寶寶):

python可視化數據實例分析

經過統計,文章出現一共20367個非黃色詞匯,284個涉黃詞匯。涉黃詞匯出現概率約為1.4%,也就是說每100個詞匯里就會出現一次黃詞,這個概率相當高了,感覺《挪威的森林》略遜一籌,《失樂園》大可一戰。

最后,來個詞云結束這一部分:

python可視化數據實例分析

2.句型分析

我們使用Lstm,按行對整片文章進行分析,看看這些句子呈現的情感特點是否有某邊倒的傾向,其中,當分為正面信度大于0.7,或負面信度大于0.7的時候分別分到正面分類和負面分類,其他情況為中性:

python可視化數據實例分析

得到結果如下:

>>{'neg': 988, 'pos': 332, 'mid': 471}

負面的句子占了55%,文章負面情緒較多。負面情緒只是衡量一篇文章的情感傾向,無法說明什么。

接下來才是關鍵,識別句子的涉黃程度,同樣地,設定概率置信度大于0.7的時候進行分類:

python可視化數據實例分析

獲得結果如下:

>> {'porn': 280, 'not_porn': 1511}

“python可視化數據實例分析”的內容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站,小編將為大家輸出更多高質量的實用文章!

向AI問一下細節

免責聲明:本站發布的內容(圖片、視頻和文字)以原創、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI

洮南市| 邳州市| 肇东市| 清水县| 南和县| 巍山| 三穗县| 朝阳市| 应用必备| 洪雅县| 镶黄旗| 阳朔县| 达拉特旗| 德保县| 承德市| 卢湾区| 和平县| 明星| 上虞市| 兴山县| 重庆市| 滦南县| 曲沃县| 万州区| 桂林市| 扶沟县| 大埔县| 广东省| 白山市| 温泉县| 广河县| 景泰县| 青河县| 茶陵县| 青冈县| 长春市| 蓬溪县| 安平县| 永善县| 象山县| 纳雍县|