在Linux中,可以使用wordcount
命令或結合其他工具進行詞頻分析
方法一:使用wordcount
命令
cat input.txt | wc -w
這將輸出文本中的單詞總數。
cat input.txt | sort | uniq -c | sort -nr
這將輸出按詞頻降序排列的結果,其中每行顯示一個單詞及其出現次數。
方法二:使用awk
命令
awk '{print $1}' input.txt | sort | uniq -c | sort -nr
這將輸出按詞頻降序排列的結果,其中每行顯示一個單詞及其出現次數。
在這兩種方法中,你可以根據需要修改輸入文件名、排序選項等。這些命令適用于基本的詞頻分析任務。如果你需要更復雜的詞頻分析,可以考慮使用Python、Perl或其他編程語言編寫自定義腳本。