ニュース
  • HOME
  • ニュース
  • [AmiVoice API] 8kHz音声のリアルタイム話者ダイアライゼーションについて

[AmiVoice API] 8kHz音声のリアルタイム話者ダイアライゼーションについて

2023.06.15 お知らせ

同期HTTP音声認識APIおよびWebSocket音声認識API において、話者ダイアライゼーションを有効にして、8kHz音声を送信した場合、話者ダイアライゼーションの精度に問題があることが判明しました。※8kHz音声を送信できるのは「会話_汎用」エンジンに対してのみです。

話者ダイアライゼーションは、非同期HTTP音声認識APIに加えて、同期HTTP音声認識APIおよびWebSocket音声認識APIでも利用することが可能です(リアルタイム話者ダイアライゼーション)が、 8kHz音声で リアルタイム話者ダイアライゼーション を利用した場合、話者ダイアライゼーションの精度が著しく低下することが判明しました。※この問題は非同期HTTP音声認識APIでは起きず、16kHz音声でも起きません。また、音声認識の精度にも影響はありません。

この問題につきましては既に改善に着手しており、近日中にアップデートを行う予定です。これまで、8kHz音声でリアルタイム話者ダイアライゼーションをご利用いただきましたユーザーの皆様にはご迷惑をおかけしておりますが、精度改善までしばらくお待ちいただきますよう、よろしくお願い申し上げます。

APIを無料で利用開始