AmiVoice API

AmiVoice APIを使えば、お客様のサービスや製品に高品質な音声認識機能を実装できます。

APIを無料で利用開始

資料ダウンロード

お知らせ

AmiVoice APIとは

音声をテキストに変換する Speech to textのAPIです。APIのエンドポイントに音声を送信すると、発話内容をテキストにした結果が得られます。会議の文字起こしや音声対話システムなどの音声対応アプリケーションを作成できます。

AmiVoice APIの特長

業界や用途に合わせて選べるエンジン

様々なシーンやビジネスで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンを用意しています。利用シーンに合わせてエンジンを選ぶことで認識率が大幅に向上します。

詳しく見る
毎月60分無料。1時間79.2円～

初期費用なく従量課金制で利用が可能。1時間79.2円～の低価格でありながら高品質な音声認識エンジンをご利用いただけます。すべてのエンジンはそれぞれ毎月60分無料でご利用いただけます。
価格を見る
自動学習で常にアップデート

会話_汎用エンジンは自動学習システム（ATS）により常に最新版に更新されています。最近出てきた新しい言葉なども認識します。
技術的なお問い合わせには無料で対応

音声認識エンジンの開発からサービス提供まですべて自社で行っており、API導入時や、運用開始後のAPIに関する個別のトラブルなど技術的なお問い合わせに対しても、技術スタッフが直接、無償でサポートを行っています。

リアルタイムでも、バッチでも

リアルタイムテキスト変換（WebSocket・同期HTTP）

音声ストリームや短い発話をスピーディに処理し、リアルタイムにテキストへ変換します。
利用シーン例
- コンタクトセンターの通話をテキスト化する
- 会議の発言をテキスト化する
- スマートフォンのアプリケーション・組み込み機器
- IoTデバイスなどを音声で操作する
- 電話の自動応答システムを音声で対応できるようにする
バッチテキスト変換（非同期HTTP）

巨大な音声ファイルをバッチ処理でテキスト化します。
　
利用シーン例
- コンタクトセンターの通話録音データの文字起こし
- 会議録音データの文字起こし
- 蓄積された映像アーカイブの文字起こし
詳細な技術情報

単語登録で固有名詞や社内用語も認識

製品名・固有名詞など、利用シーンに合わせてユーザー辞書に単語を登録することができます。これにより、社内用語や氏名など、特定の単語やフレーズの認識精度が向上します。

ユーザー辞書について
句読点・疑問符を自動的に付与

AmiVoice APIは句読点・疑問符を認識結果に自動的に付与。より正確でわかりやすい話し言葉の文章作成をサポートします。

言い淀み（フィラー）を自動削除

「えっと」「そのー」「あのー」などの言い淀み（フィラー）を自動削除（削除しない設定も可能）します。認識結果を修正する手間が軽減されます。
話者ダイアライゼーション機能

複数の話者が含まれる音声に対して、誰がいつ話したかがわかるようになる機能です。事前学習なしで、話者を特定してラベルを付与します。

話者ダイアライゼーションについて

不適切な用語は表示されない

ビジネスシーンなどオフィシャルな状況において不適切な用語（性的な言葉、差別用語等）はテキスト化されないので安心してご利用いただけます。
読み（よみがな）を表示

音声認識結果に音声から推定された「読み」が付与されます。子供向けのアプリへの表示のほか、CRMや製品データベースなど後続システムのデータ照合などにも活用いただけます。

オプション機能毎月60分無料

感情分析機能

音声から話者の感情を分析し、喜び・憤り・ストレス・不満・期待など、20個のパラメータを約2秒に1回出力します。例えば「ありがとう」という表現の裏に隠れされた感情の起伏を把握できるなど、より詳細な声の分析が可能になります。感情分析結果は、コンタクトセンターやマーケティング・人事・医療などの幅広いシーンで活用できます。イスラエルのNemesysco社が提供する最新の感情分析エンジンをベースに、ESジャパンが日本国内300万音源の検証・研究から開発した「ESAS」技術を提供します。非同期HTTP音声認識APIでご利用いただけます。毎月60分まで無料でご利用いただけますのでお気軽にお試しください。

ESASの詳細はこちら価格をみる

【資料ダウンロード】感情分析の導入メリットと活用シーン