Tech Blog
-
-
2021.12.20
InsomniaでAmiVoiceが試せる。音声ファイルを文字起こし。
APIクライアントアプリInsomniaから、AmiVoice Cloud Platform (ACP) のHTTP音声認識APIを試す!
-
2021.12.06
【OBS】AmiVoiceを使って配信画面にリアルタイム自動字幕を付けてみた【字幕と音声・映像の同期方法も!】
ライブ配信時に聞き逃した方や海外の視聴者さんにとって、字幕があったら便利ですよね。 今回は音声認識を用いて、OBS Studioのリアルタイム自動生成字幕プラグインを作って試してみました。実際にお試し版も公開します。
-
2021.11.24
なぜ音声認識率は100%にならないのか?
音声認識技術の究極の目標は「認識率100%」ですが、そう簡単には実現できません。実現できない要因を、話者の特徴・方言などの音響的な観点や、固有名詞・表記ゆれなどの言語的な観点から例を挙げて説明します。
-
2021.11.08
音声ファイルをAmiVoiceで音声認識してみる簡単な方法
「音声ファイルを音声認識してみたい」という方のために、AmiVoiceを使って簡単に音声ファイルをテキスト化してみる方法について解説しました。開発者用のAPIやプログラムを使っていますが、今回のお試しではプログラミングの知識は不要です。
-
2021.10.25
AmiVoiceとGoogleの音声認識率を電子カルテ入力音声で徹底比較してみた!
以前の記事で、AmiVoiceの汎用エンジンと領域特化型エンジンの音声認識精度(音声認識率)の比較をしたところ、AmiVoice VS Google が気になるというご意見を多方面から頂きました。 というわけで、今回は AmiVoice Cloud Platform と Google Speech to Text の音声認識率を比較してみました。
-
2021.10.08
AmiVoice Cloud Platformの3種類の音声認識API(非同期HTTP音声認識APIが新たに追加されました)
AmiVoice Cloud Platformではソフトウェア開発者のためのクラウド音声認識APIを用途に応じて3種類用意しています(2021年10月現在)。今回の記事ではそれぞれの違いや用途について概要を解説します。
-
2021.10.04
AmiVoice Cloud PlatformのAppKeyの取り扱いについて
音声認識APIを提供している「AmiVoice Cloud Platform」のAPPKEYの取り扱い方法について、簡単に解説します。APPKEYの仕様を知ることで、あなたのプログラムのセキュリティレベルを一つレベルアップすることが出来ます。
-
2021.09.21
なぜAmiVoiceは高精度なのか?音声認識エンジンの種類が豊富な理由
音声認識は難しい技術なので、なかなか認識率100%にはできません。今回の記事では、なぜ音声認識は難しいのか、そしてAmiVoiceではどうやってその難しさに立ち向かっているのかを解説します。
-
2021.09.06
音声認識の「エラー改善率」と「認識精度(認識率)」の違いとは?
音声認識の認識精度(認識率)は、認識精度が上がるほど、さらに1ポイント上げるのは難しくなります。その理由を「エラー改善率」という指標を用いて説明します。また、音声認識の論文等でよく使われるWERという指標についても触れています。
-
2021.08.23
AmiVoiceの領域特化エンジンの音声認識精度を比べてみた(汎用 vs 電子カルテ)
何を喋っても正しく認識できる万能な音声認識エンジンを作るのは難しいので、AmiVoiceでは数種類の音声認識エンジンを開発者向けに提供しています。今回はその中から汎用エンジンと電子カルテ用エンジンを使って認識率を比較してみました。
-
2021.08.09
Linuxで音声認識を動かしてみた3(ACP+pulseaudio編)
「Linuxで音声認識を動かしてみた」という題材でお話していきます。今回の目標はACPのC++とPulseAudioライブラリを使ってマイク認識するまでです。