とある地味なブログ

プログラミングとお絵かきに関する雑記。

Apache Pig Latin で 1ファイルに STORE する

久しぶりにPig書いたら忘れていたので。

何も考えないでSTOREすると、part-r-0000Xのようなファイルが複数できてしまう。

外部のプログラムから読み出すときは1ファイルのほうが都合が良かったりするよね。

Z = ORDER Y BY $0 PARALLEL 1;
STORE Z INTO 'result';

apache pig - STORE output to a single CSV? - Stack Overflow

こちらにあるように、特定の命令の後ろにPARALLEL 1とつければよかったのであった。