Tech Blog
-
2024.02.19
「話し方」で音声認識精度(音声認識率)が上がる。喋り方のコツとは?
音声認識精度を上げる5つのコツをお伝えします。第1回目は「適切な喋り方をする」。どのような話し方、話す内容が音声認識精度アップにつながるのか解説します。
-
-
2023.12.20
【AmiVoice API Private・SDK】簡単な「ルールグラマ」を作ってみた【基本編】
AmiVoice API Private・SDKで使用可能な「ルールグラマ」について、その書き方の基本を解説し、簡単なルールグラマが書けるようになることを目指します。
-
2023.11.30
【初心者向け】EdgeとChromeからAmiVoice APIを実行してみた Chrome拡張機能編
WebSocket音声認識APIを実行するChrome拡張機能のサンプルとその作り方を紹介します。
-
2023.10.23
【初心者向け】EdgeとChromeからAmiVoice APIを実行してみた Webページ編
Microsoft EdgeとGoogle ChromeからAmiVoice APIを実行するWebページのサンプルとその作り方を紹介します。
-
2023.09.29
【同じ発話で比較検証】音声入力エンジンと会話エンジンの認識結果の違いとは
AmiVoice APIの音声入力用音響モデルを採用したエンジンや、会話入力用音響モデルを採用したエンジンの特徴と、それぞれの合致する利用シーンなどについて解説していきます。
-
2023.08.30
ハイブリッド型音声認識とEnd-to-End音声認識の違いと特徴
ハイブリッド型音声認識とEnd-to-End音声認識の違いや特徴について解説します。また、それぞれの特徴をふまえてアドバンスト・メディアで採用している方式について説明します。
-
2023.07.31
精度検証付き!特定用途に特化した音声認識エンジンのご紹介
AmiVoice API Privateにて提供している、人名や住所などに特化した音声認識エンジンについてご紹介します。汎用エンジンと精度を比較した検証も行いました。
-
2023.07.10
AmiVoice API Private・SDKの「ルールグラマ」認識とは?
AmiVoice API Privateで提供している音声認識エンジン「ルールグラマ」について、通常のディクテーション認識との違いや、適した利用シーン、使用するメリット・デメリットなどを解説します。
-
2023.06.26
"会議"の音声でOpenAIのWhisperとAmiVoiceの音声認識率を比較してみた
会議の音声をOpenAIのWhisperとAmiVoiceで音声認識して、それぞれの音声認識精度を比べました。結果としてはAmiVoiceの方が誤認識が大幅に少なく高精度でした。Whisperの誤認識の例など出しながらこの差の要因について解説します。
-
2023.05.15
AmiVoice APIで不要語(フィラー)を表示するか除去するか選ぶ方法
AmiVoiceAPIには不要語(フィラー)を自動的に除去する機能があります。しかし音声認識を使う場面によってはフィラーを除去せず表示した方がいいこともあります。今回はフィラーの除去を制御するやり方について解説します。
-
2023.04.17
ステレオ音声ファイルをモノラル音声ファイル×2に変換するやり方
AmiVoice APIはステレオの音声ファイルを音声認識させると片方のチャネルしか認識されない仕様になっています。ステレオ音声ファイルの右チャンネルと左チャンネルに異なる音が入っている場合を想定して、今回はSoXというツールを使ったステレオ音声ファイルをモノラル音声ファイルx2に変換する方法について説明します。