とある地味なブログ

プログラミングとお絵かきに関する雑記。

Python で Google Speech API を適当に叩く

音声ファイルから音声認識して文字起こし、を手軽にやるため、 Google Speech APIを使って簡単なのを作りました。

公式のPythonサンプル、認証まわりで環境変数設定したりだるそうだったので、 API Key を貼るだけで動くやつを作りました。

Google Cloud Speech API Beta でwavファイルの音声認識 - Qiita

こちらの記事などを参考に進めて、API Keyを取得します。

Python2系で動きます。

使い方は、<API Key>を書き換えるだけ。

python transcribe.py

と実行して、

  1. ファイルダイアログが出て、
  2. wavファイルを選択して、
  3. ちょっと待って、
  4. txtファイルの保存先を選択するだけ。

ちなみに最初はNode.jsで作ろうとしましたが、Windowsではどうやっても

npm install google-cloud

で失敗したので諦めました。