AmiVoice SDK

5000以上のライセンス導入実績を持つAmiVoice SDKは、認識精度の高さから様々な利用シーンの音声入力・音声テキスト化に使われています。録音機能等もあわせてライブラリで提供するため、様々なOSのネイティブアプリの開発が容易に行えます。音声認識サーバとの連携（AmiVoice API Private）でデバイススペックに左右されない運用も可能です。

サービス紹介ウェビナー

資料ダウンロード

AmiVoice SDKの特長

オフラインで利用可能
よりセキュアな運用も
スタンドアローンも動作可能なため、医療現場などセキュリティの観点からインターネットに接続することが難しい環境下においても、音声認識機能をご利用いただけます。
医療分野での活用シーン例
単語・コマンド認識も可能
音声入力や音声操作にも
製品名と数の組み合わせや、数値やアルファベット、「確定」「次へ」のようなコマンドワードなどの認識（ルールグラマ認識）も得意としています。もちろん文章も高精度で認識します。
ノイズに強いエンジン。
屋外や工場向けのアプリ開発に
カスタマイズ性が高く、現場に合わせた認識パラメータの調整や単語登録による専門用語の認識が可能です。製造業の現場や屋外での点検保守業務などで利用する機器への組込みやアプリ開発でも活用されています。
SDKの導入事例
豊富なサポートメニューで安心して開発できる
SDKの利用方法についての技術的なお問い合わせに対しては①技術スタッフが直接 ②日本語でサポートしています。ご希望に応じてSDKの利用方法に関する講習も行っています。
サポートメニューについて（資料ダウンロード）

用途に応じて選べる音声認識タイプ

タイプ1：ルールグラマ（単語・コマンド）認識
あらかじめお客様で設定した定型文や単語だけを認識。音声による操作やあらかじめ用意した単語やフレーズを音声入力させたい場合に使用します。
ルールグラマエンジンについて
タイプ2：ディクテーション（文章）認識
ルールの範囲に収まらない「話し言葉」や「書き言葉」などの音声をテキスト化します。発話内容に最も近いと計算されたテキストを表示します。
※ スタンドアローンでの認識速度はデバイススペックに依存します。 ※ 認識速度優先の場合、AmiVoice API Privateの利用を推奨します。

エンジン一覧はこちら

エンジンを専用にカスタマイズも

様々なシーンやビジネスで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンを用意しています。既存エンジンをベースに、お客様専用にカスタマイズも可能で、高い認識率を実現します。
カスタマイズについて
話者ダイアライゼーション機能

複数の話者が含まれる音声に対して、誰がいつ話したかがわかるようになる機能です。事前学習なしで、話者を特定してラベルを付与します。