ニュース
  • HOME
  • ニュース
  • 【AmiVoice API】End to End型の次世代音声認識エンジンの提供開始

【AmiVoice API】End to End型の次世代音声認識エンジンの提供開始

2025.03.26 アップデート

2025年3月26日より、AmiVoice APIで新たなEnd to End型の音声認識エンジンをご利用いただけるようになりました。

今回追加されたエンジンは以下の通りです。

言語エンジン名対応サンプリングレート接続エンジン名
日本語日本語E2E_汎用8k / 16k-a2-ja-general
中国語中国語E2E_汎用8k / 16k-a2-zh-general
多言語多言語E2E_汎用8k / 16k-a2-multi-general
日本語日本語E2E_汎用バッチ8k / 16k-a2b-ja-general
中国語中国語E2E_汎用バッチ8k / 16k-a2b-zh-general
多言語多言語E2E_汎用バッチ8k / 16k-a2b-multi-general

「日本語」、「中国語」の音声認識エンジンは、汎用的な文字起こしの用途でお使いいただくことができます。「多言語」の音声認識エンジンは、複数の言語が混ざった音声でも、それぞれの言語で文字起こしすることができるエンジンです。対応している言語は、日本語、英語、中国語です。

また、End to End音声認識エンジンのうち、バッチ処理用エンジン(接続エンジン名末尾が b のもの)は、リアルタイム性よりも認識精度を重視するケースに適しています。汎用的な用途において、多くの場合でバッチ処理用エンジンをご利用いただくことにより、認識精度の向上が期待できます。

一方、医療分野など、特定の業界固有の語彙への対応が重要となる場合は、引き続き従来のエンジンをご利用いただくことを推奨します。なお、従来のエンジンの精度改善も重要なミッションとして継続してまいりますので、ご安心ください。

また、今回リリースされた次世代のエンジンは、従来のエンジンに比べていくつかの制約があります。詳細はドキュメントの音声認識エンジンの「End to Endとハイブリッドの違い」を参照してください。

【重要】
これらの次世代エンジンへ自動的に切り替わることはありません。ご利用いただくには、APIリクエスト時に上記の表に記載されている「接続エンジン名」を明示的に指定していただく必要があります。

AmiVoice Cloud Platformでは、リソースを集中し、さらに優れたサービスと新たな価値をお届けする準備を進めております。引き続きご期待ください。

APIを無料で利用開始