自然言語処理100本ノック2020から逃げるな「13. col1.txtとcol2.txtをマージ」

これは自然言語処理100本ノック2020に挑んだ、とある人間の記録
他の問題はこちら → 自然言語処理100本ノック2020から逃げるな まとめ

13. col1.txtとcol2.txtをマージ

12で作ったcol1.txtとcol2.txtを結合し,元のファイルの1列目と2列目をタブ区切りで並べたテキストファイルを作成せよ.確認にはpasteコマンドを用いよ.

Pythonコード

import sys

path1 = sys.argv[1]
path2 = sys.argv[2]

with open(path1) as f1, \
        open(path2) as f2, \
        open('merged.txt', 'w') as fw:
    for l1 in f1:
        fw.write(l1.rstrip('\n') + '\t' + f2.readline())

確認用UNIXコマンド

私の環境は少し特殊(fish)なので、もしかしたら動かないかも。

paste col1.txt col2.txt > merged_unix.txt
diff -s merged.txt merged_unix.txt

実行結果

長いので冒頭のみ。

merged.txt
Mary  F
Anna    F
Emma    F
Elizabeth   F
Minnie  F
Margaret    F
Ida F
Alice   F
Bertha  F
Sarah   F
John    M
William M
James   M
Charles M
George  M
Frank   M
Joseph  M
Thomas  M
Henry   M
...