ffmpeg.wasmをgithub pagesで動かすよを読んでいて、Offline Transcribeを見に行ったらccoreilly/vosk-browser: A speech recognition library running in the browser thanks to a WebAssembly build of Vosk経由してalphacep/vosk-api: Offline speech recognition API for Android, iOS, Raspberry Pi and servers with Python, Java, C# and Nodeというものの存在を知った。
日本語での使用例もいくつか見つかった
- 日本語音声のマイク入力をオフラインでリアルタイム音声認識:「VOSK」を JavaScript(Node.js)で扱う - Qiita
- 話題の音声認識ツールキット Vosk を試してみた
- [M1] 音声認識ツール Voskを動かす [Node] | DevelopersIO
簡単にできそうなので、今度試してみたい。