自然言語処理100本ノック2020から逃げるな「38. ヒストグラム」

これは自然言語処理100本ノック2020に挑んだ、とある人間の記録
他の問題はこちら → 自然言語処理100本ノック2020から逃げるな まとめ

38. ヒストグラム

単語の出現頻度のヒストグラム(横軸に出現頻度,縦軸に出現頻度をとる単語の種類数を棒グラフで表したもの)を描け.

Pythonコード

import NLP100_35
import matplotlib.pyplot as plt

morpheme_freq_list = NLP100_35.get_morpheme_frequency()
counts = [m[1] for m in morpheme_freq_list]

plt.hist(counts)
plt.show()

35. 単語の出現頻度 で作成したget_morpheme関数を利用しています。

実行結果

f:id:tmls:20200525075008p:plain