AmiVoice SDK

5000以上のライセンス導入実績を持つAmiVoice SDKは、認識精度の高さから様々な利用シーンの音声入力・音声テキスト化に使われています。録音機能等もあわせてライブラリで提供するため、様々なOSのネイティブアプリの開発が容易に行えます。 音声認識サーバとの連携(AmiVoice API Private)でデバイススペックに左右されない運用も可能です。

AmiVoice SDKの特長

  • オフラインで利用可能
    よりセキュアな運用も

    スタンドアローンも動作可能なため、医療現場などセキュリティの観点からインターネットに接続することが難しい環境下においても、音声認識機能をご利用いただけます。
  • 単語・コマンド認識も可能
    音声入力や音声操作にも

    製品名と数の組み合わせや、数値やアルファベット、「確定」「次へ」のようなコマンドワードなどの認識(ルールグラマ認識)も得意としています。もちろん文章も高精度で認識します。
  • ノイズに強いエンジン。
    屋外や工場向けのアプリ開発に

    カスタマイズ性が高く、現場に合わせた認識パラメータの調整や単語登録による専門用語の認識が可能です。製造業の現場や屋外での点検保守業務などで利用する機器への組込みやアプリ開発でも活用されています。
  • 豊富なサポートメニューで 安心して開発できる

    SDKの利用方法についての技術的なお問い合わせに対しては①技術スタッフが直接 ②日本語でサポートしています。ご希望に応じてSDKの利用方法に関する講習も行っています。

用途に応じて選べる音声認識タイプ

  • タイプ1:ルールグラマ(単語・コマンド)認識

    あらかじめお客様で設定した定型文や単語だけを認識。音声による操作やあらかじめ用意した単語やフレーズを音声入力させたい場合に使用します。
  • タイプ2:ディクテーション(文章)認識

    ルールの範囲に収まらない「話し言葉」や「書き言葉」などの音声をテキスト化します。発話内容に最も近いと計算されたテキストを表示します。

    ※ スタンドアローンでの認識速度はデバイススペックに依存します。 ※ 認識速度優先の場合、AmiVoice API Privateの利用を推奨します。

  • エンジンを専用にカスタマイズも

    様々なシーンやビジネスで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンを用意しています。既存エンジンをベースに、お客様専用にカスタマイズも可能で、高い認識率を実現します。
  • 話者ダイアライゼーション機能

    複数の話者が含まれる音声に対して、誰がいつ話したかがわかるようになる機能です。事前学習なしで、話者を特定してラベルを付与します。

5分でわかるAmiVoice SDK

資料ダウンロード

マイクロチップでの音声認識環境も提供

  • AmiVoice Micro

    低クロックなCPU、省メモリ環境で動作する、マイクロチップ(※1)対応の音声認識エンジンです。テクノマセマティカルのノイズ低減技術「ズームボイス」により、周囲の雑音を抑えながら狙った方向からの音を強調して集音し、オフラインの環境で使える音声認識エンジンで文字化(※2)します。

    ※1 ルネサス社 RX 、RAシリーズ ※2 AmiVoice Microはスタンドアローンで動作するルールグラマ認識のみに対応しています。

AmiVoice SDKの導入事例

こんなサービスもおすすめです

APIを無料で利用開始