VoskでWebVTT作成
Voskのサンプルで、WebVTT生成があったのでやってみた。
vosk-api/test_webvtt.py at master · alphacep/vosk-api
サンプルコードのmodel部分だけ変更でいけた。
あとpip install webvtt-py
の実行も必要だった。
便利なライブラリがあってPythonが流行るのがわかった気がする。
POSTS
Voskのサンプルで、WebVTT生成があったのでやってみた。
vosk-api/test_webvtt.py at master · alphacep/vosk-api
サンプルコードのmodel部分だけ変更でいけた。
あとpip install webvtt-py
の実行も必要だった。
便利なライブラリがあってPythonが流行るのがわかった気がする。
node.jsで使うのあきらめて、Pythonで試してみた。
あっさり使えた。
ついでに、3 分で作る無料の翻訳 API with Google Apps Script - Qiitaを参考に、日本語→英語翻訳APIを立てて連携してみた。
Pythonの文字列操作するのにちょっと手間取ったけど、意外とすんなりリアルタイム音声認識&翻訳が出来上がってびっくりした。
Read more日本語音声のマイク入力をオフラインでリアルタイム音声認識:「VOSK」を JavaScript(Node.js)で扱う - Qiita こちらを参考に。
早速npm install vosk
したところ、GitbashだとVisualStudioが見つからない的なエラー。WSL2環境で動かしたら通った。
そしてサンプルをコピーして実行すると、エラー。 マイク入力デバイスが見つからないっぽい。WSL環境からは見えないのかも。
Read moreffmpeg.wasmをgithub pagesで動かすよを読んでいて、Offline Transcribeを見に行ったらccoreilly/vosk-browser: A speech recognition library running in the browser thanks to a WebAssembly build of Vosk経由してalphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Nodeというものの存在を知った。
日本語での使用例もいくつか見つかった
簡単にできそうなので、今度試してみたい。
Read more