Skip to content

Podcastのテキスト化

   

ポッドキャストをAIで書き起こし「LISTEN」 近藤淳也氏が立ち上げ - ITmedia NEWS

技術的にはRebuild - Podcast by Tatsuhiko Miyagawaで見たことある感じだったけど、これ登録されてるPodcastの横断検索出来たらすごく便利なサービスかもしれない。

mp3ダウンロードして、VOSK Offline Speech Recognition APIとかでテキスト化して、の前にタイムスタンプ情報が欲しいからVTT化ができるといいな、だれか作ってないかな。

ググったらMaxVRAM/Vosk-VTT-Client: Client for Vosk voice-to-text server, sending real-time transcriptions to remote OSC receiver.がヒットしたけどどうだろう。

VTTに出来たら、あとはプレーヤーと連携させれば良い。 なんか作りかけてた気もするけど、たしかNext.jsで画面作ろうとしてモジュール化とかが面倒で投げた記憶が。。。

またやり直してみようかな。