タイプ1:ルールグラマ(単語・コマンド)認識
あらかじめお客様で設定した定型文や単語だけを認識。音声による操作やあらかじめ用意した単語やフレーズを音声入力させたい場合に使用します。
5000以上のライセンス導入実績を持つAmiVoice
SDKは、認識精度の高さから様々な利用シーンの音声入力・音声テキスト化に使われています。録音機能等もあわせてライブラリで提供するため、様々なOSのネイティブアプリの開発が容易に行えます。
音声認識サーバとの連携(AmiVoice API Private)でデバイススペックに左右されない運用も可能です。
スタンドアローンも動作可能なため、医療現場などセキュリティの観点からインターネットに接続することが難しい環境下においても、音声認識機能をご利用いただけます。
製品名と数の組み合わせや、数値やアルファベット、「異常なし」のようなコマンドワードなどの認識(ルールグラマ認識)も得意としています。もちろん文章も高精度で認識します。
カスタマイズ性が高く、現場に合わせた認識パラメータの調整や単語登録による専門用語の認識が可能です。製造業の現場や屋外での点検保守業務などで利用する機器への組込みやアプリ開発でも活用されています。
SDKの利用方法についての技術的なお問い合わせに対しては①技術スタッフが直接 ②日本語でサポートしています。ご希望に応じてSDKの利用方法に関する講習も行っています。
タイプ1:ルールグラマ(単語・コマンド)認識
あらかじめお客様で設定した定型文や単語だけを認識。音声による操作やあらかじめ用意した単語やフレーズを音声入力させたい場合に使用します。
タイプ2:ディクテーション(文章)認識
ルールの範囲に収まらない「話し言葉」や「書き言葉」などの音声をテキスト化します。発話内容に最も近いと計算されたテキストを表示します。
※ スタンドアローンでの認識速度はデバイススペックに依存します。
※ 認識速度優先の場合、AmiVoice API Privateの利用を推奨します。
様々なシーンやビジネスで使用できる「汎用エンジン」の他、医療分野など専門用語や業界用語に特化したエンジンを用意しています。既存エンジンをベースに、お客様専用にカスタマイズも可能で、高い認識率を実現します。
AmiVoice SDK は、開発時に必要な開発ライセンス+商用利用時に必要な商用ライセンスの構成でご提供しています。
低クロックなCPU、省メモリ環境で動作する、マイクロチップ(※1)対応の音声認識エンジンです。テクノマセマティカルのノイズ低減技術「ズームボイス」により、周囲の雑音を抑えながら狙った方向からの音を強調して集音し、オフラインの環境で使える音声認識エンジンで文字化(※2)します。
※1 ルネサス社 RX 、RAシリーズ
※2 AmiVoice Microはスタンドアローンで動作するルールグラマ認識のみに対応しています。
音声認識技術活用による業務効率化。お客さまと向き合う時間を創出。
金融業界用語の認識精度の高さからAmiVoiceを採用。CRM機能と連携し、外出先からお客さまとの面談記録の音声入力が可能になりました。営業時間の創出・生産性向上・時間外労働の削減を期待しています。
モバイル型ロボット「ロボホン」を音声コマンドで操作可能に
カーナビアプリへの容易な実装、高い認識精度、サポートの手厚さで採用
今では主要な機能の一つとなった、カーナビアプリのボイスコントロール機能にAmiVoice SDKが採用。組み込みが容易な点や高い認識精度、サポートの手厚さが決め手になりました。