Python で Google Speech API を適当に叩く
音声ファイルから音声認識して文字起こし、を手軽にやるため、 Google Speech APIを使って簡単なのを作りました。
公式のPythonサンプル、認証まわりで環境変数設定したりだるそうだったので、 API Key を貼るだけで動くやつを作りました。
Google Cloud Speech API Beta でwavファイルの音声認識 - Qiita
こちらの記事などを参考に進めて、API Keyを取得します。
Python2系で動きます。
使い方は、<API Key>
を書き換えるだけ。
python transcribe.py
と実行して、
- ファイルダイアログが出て、
wav
ファイルを選択して、- ちょっと待って、
txt
ファイルの保存先を選択するだけ。
ちなみに最初はNode.jsで作ろうとしましたが、Windowsではどうやっても
npm install google-cloud
で失敗したので諦めました。