python可視化數據實例分析

發布時間：2022-05-17 11:39:15 來源：億速云閱讀：163 作者：zzz 欄目：大數據

本篇內容介紹了“python可視化數據實例分析”的有關知識，在實際案例的操作過程中，不少人都會遇到這樣的困境，接下來就讓小編帶領大家學習一下如何處理這些情況吧！希望大家仔細閱讀，能夠學有所成！

我們利用Python里的jieba分詞、matplotlib模塊分析整篇文章詞匯，并提取詞頻前20的詞語，得到結果如下：

python可視化數據實例分析

確實，涉及到兩位明星的詞語是最多的，其次是阿麗姐（不知道是不是作者的化身）。贊贊在其中是女性角色，難怪粉絲們暴跳如雷。這樣分析，似乎看不出太多的內含，我們把維度細化一點。

從敏感角度看，這個詞匯頻率會是怎樣的呢？由于純潔的我實在是接受不了，因此打了點馬賽克（如果這樣你都能猜出是什么詞....嗯...建議多看看天線寶寶）：

python可視化數據實例分析

經過統計，文章出現一共20367個非黃色詞匯，284個涉黃詞匯。涉黃詞匯出現概率約為1.4%，也就是說每100個詞匯里就會出現一次黃詞，這個概率相當高了，感覺《挪威的森林》略遜一籌，《失樂園》大可一戰。

最后，來個詞云結束這一部分：

python可視化數據實例分析

我們使用Lstm，按行對整片文章進行分析，看看這些句子呈現的情感特點是否有某邊倒的傾向，其中，當分為正面信度大于0.7，或負面信度大于0.7的時候分別分到正面分類和負面分類，其他情況為中性：

python可視化數據實例分析

得到結果如下：

>>{'neg': 988, 'pos': 332, 'mid': 471}

負面的句子占了55%，文章負面情緒較多。負面情緒只是衡量一篇文章的情感傾向，無法說明什么。

接下來才是關鍵，識別句子的涉黃程度，同樣地，設定概率置信度大于0.7的時候進行分類：

python可視化數據實例分析

獲得結果如下：

>> {'porn': 280, 'not_porn': 1511}

“python可視化數據實例分析”的內容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業相關的知識可以關注億速云網站，小編將為大家輸出更多高質量的實用文章！

向AI問一下細節

91超碰碰碰碰久久久久久综合_超碰av人澡人澡人澡人澡人掠_国产黄大片在线观看画质优化_txt小说免费全本