これは自然言語処理100本ノック2020に挑んだ、とある人間の記録。
他の問題はこちら → 自然言語処理100本ノック2020から逃げるな まとめ
13. col1.txtとcol2.txtをマージ
12で作ったcol1.txtとcol2.txtを結合し,元のファイルの1列目と2列目をタブ区切りで並べたテキストファイルを作成せよ.確認にはpasteコマンドを用いよ.
Pythonコード
import sys path1 = sys.argv[1] path2 = sys.argv[2] with open(path1) as f1, \ open(path2) as f2, \ open('merged.txt', 'w') as fw: for l1 in f1: fw.write(l1.rstrip('\n') + '\t' + f2.readline())
確認用UNIXコマンド
私の環境は少し特殊(fish)なので、もしかしたら動かないかも。
paste col1.txt col2.txt > merged_unix.txt diff -s merged.txt merged_unix.txt
実行結果
長いので冒頭のみ。
merged.txt
Mary F Anna F Emma F Elizabeth F Minnie F Margaret F Ida F Alice F Bertha F Sarah F John M William M James M Charles M George M Frank M Joseph M Thomas M Henry M ...