Apache Pig Latin で 1ファイルに STORE する
久しぶりにPig書いたら忘れていたので。
何も考えないでSTORE
すると、part-r-0000X
のようなファイルが複数できてしまう。
外部のプログラムから読み出すときは1ファイルのほうが都合が良かったりするよね。
Z = ORDER Y BY $0 PARALLEL 1; STORE Z INTO 'result';
apache pig - STORE output to a single CSV? - Stack Overflow
こちらにあるように、特定の命令の後ろにPARALLEL 1
とつければよかったのであった。