リアルタイムテキスト変換
音声を処理しながらリアルタイムでストリーム音声認識の結果を受信します。
利用シーン例
- コンタクトセンターの通話をテキスト化する
- 会議の発言をテキスト化する
- スマートフォンのアプリケーション・組み込み機器
- IoTデバイスなどを音声で操作する
- 電話の自動応答システムを音声で対応できるようにする
AmiVoice APIを使えば、お客様のサービスや製品に高品質な音声認識機能を実装できます。
音声をテキストに変換する Speech to textのAPIです。APIのエンドポイントに音声を送信すると、発話内容をテキストにした結果が得られます。会議の文字起こしや音声対話システムなどの音声対応アプリケーションを作成できます。
会話_汎用エンジンは自動学習システム(ATS)により常に最新版に更新されています。最近出てきた新しい言葉なども認識します。
初期費用なく従量課金制で利用が可能。1時間99円~の低価格でありながら高品質な音声認識エンジンをご利用いただけます。すべてのエンジンは毎月60分無料でご利用いただけます。
様々なシーンやビジネスで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンを用意しています。利用シーンに合わせてエンジンを選ぶことで認識率が大幅に向上します。
音声認識エンジンの開発からサービス提供まですべて自社で行っており、API導入時や、運用開始後のAPIに関する個別のトラブルなど技術的なお問い合わせに対しても、技術スタッフが直接、無償でサポートを行っています。
リアルタイムテキスト変換
音声を処理しながらリアルタイムでストリーム音声認識の結果を受信します。
利用シーン例
バッチテキスト変換
巨大な音声ファイルをバッチ処理でテキスト化します。
利用シーン例
製品名・固有名詞など、利用シーンに合わせて単語を登録することができます。これにより、社内用語や氏名など、特定の単語やフレーズの認識精度が向上します。
※単語登録機能は日本語のみです。
AmiVoice APIは句読点・疑問符を認識結果に自動的に付与。より正確でわかりやすい話し言葉の文章作成をサポートします。
「えっと」「そのー」「あのー」などの言い淀み(フィラー)を自動削除(削除しない設定も可能)します。認識結果を修正する手間が軽減されます。
複数の話者が含まれる音声に対して、誰がいつ話したかがわかるようになる機能です。事前学習なしで、話者を特定してラベルを付与します。
音声から話者の感情を分析し、喜び・憤り・ストレス・不満・期待など、20個のパラメータを約2秒に1回出力します。例えば「ありがとう」という表現の裏に隠れされた感情の起伏を把握できるなど、より詳細な声の分析が可能になります。感情分析結果は、コンタクトセンターやマーケティング・人事・医療などの幅広いシーンで活用できます。イスラエルのNemesysco社が提供する最新の感情分析エンジンをベースに、ESジャパンが日本国内300万音源の検証・研究から開発した「ESAS」技術を提供します。非同期HTTP音声認識APIでご利用いただけます。毎月60分まで無料でご利用いただけますのでお気軽にお試しください。
AmiVoice APIを利用したサービスを提供する際に、サービス提供者がエンドユーザーの登録・管理を行うことができます。利用料金はサービス提供者に一括で請求されます。
※ 本機能の利用には申込が必要です。
毎月60分まで無料
音声認識APIを利用開始サービス紹介ウェビナーや、音声認識技術について学べるお役立ちウェビナー・動画をご覧いただけます。