自然言語処理100本ノック2020から逃げるな「36. 頻度上位10語」

これは自然言語処理100本ノック2020に挑んだ、とある人間の記録
他の問題はこちら → 自然言語処理100本ノック2020から逃げるな まとめ

36. 頻度上位10語

出現頻度が高い10語とその出現頻度をグラフ(例えば棒グラフなど)で表示せよ.

Pythonコード

import NLP100_35
import matplotlib.pyplot as plt

morpheme_list = NLP100_35.get_morpheme_frequency()

x, y = zip(*morpheme_list)

plt.bar(x[:10], y[:10])
plt.show()

# matplotlibの日本語フォントはmatplotlibrcのfontfamilyを書き換えることで対応した

35. 単語の出現頻度 で作成したget_morpheme関数を利用しています。

実行結果

f:id:tmls:20200525072745p:plain