よくある質問
AmiVoice APIご利用中の方向けのトラブルシューティングはこちら
お知りになりたいサービスをお選びください
AI音声認識技術 AmiVoice
AmiVoice API
AmiVoice SDK
AmiVoice API Private
AmiVoice IVR for Amazon Connect
AmiVoice MRCP Server
キーワード検索
閲覧数が多いご質問
「」の検索結果
― AI音声認識技術 AmiVoice
-
QAmiVoiceの特長は何ですか。A
AmiVoiceは様々な利用用途、分野、環境に対応可能です。
携帯電話やPCなど多くのプラットフォームに対応可能です。
サーバー型、スタンドアローン型のどちらの認識方式にも対応可能です。
音響モデルとしては、電話音声や車内音声・工場内などの騒音下での音声など、言語モデルとしては、医療ドキュメント作成やコールセンター通話記録・日報作成などがあり、多くの業界や利用シーンに対応できます。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q誰の声でも認識しますか?A
誰の声でも認識します。発音の明瞭度、喋り方、声の大きさ等によって認識率は多少左右されます。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Qイントネーションの違いや方言は大丈夫ですか?A
イントネーションの違いや発話スピードの緩急に対応しています。ただし、辞書に入っていない方言については新たに登録をする必要があります。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q単語ごとに発話すると誤認識が多いのですが…A
AmiVoiceは前後の単語を見ながら認識結果を出していますので、文の途中で発話を区切ると誤認識の原因となります。できるだけ一文単位で発話するように心がけてください。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q音声入力時の認識率を上げる方法を知りたいです。A
以下のヒントを参考にしてください。
- 明瞭な声ではっきりと発話する
- 1文もしくは句読点を目安に発話する
- 複数の文節で発話する
※ 複数の文節が入力されたとき、日本語文脈の解析がより効果的に働きます。
※ マイクから入力されるすべての音が日本語の文章として解析されます。
※ 途中で言い直したり、”えーと”や”んー”等の発言は、文脈の中での単語と見なされます。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q漢字変換はどういうしくみですか。A
音響的モデルと言語的モデルで計算した確率の最も高い単語列を認識結果としており、音声から直接漢字仮名まじりの認識結果を得ています。 音声認識では、平仮名を認識してから漢字に変換していません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q平仮名で一文字ずつでもよいので入力させたいです。A
平仮名一文字ずつの認識は、誤認識が多く発生するため実用化していません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ
― AmiVoice API
-
Q他社のクラウド音声認識サービスとの違いを教えてください。A
他社のクラウド音声認識サービスとの主な違いは以下の通りです。
- 「日本語」と「専門用語」に強い音声認識エンジンを提供しています。
- BtoBでの利用を想定した設計となっており、ビジネスで使われることのない不適切な言葉を省いて学習させています。
- 音声認識対象となった発話区間のみ課金されます。無音の時間も課金対象となっている他社と比べてコストを抑えることができます。
- 技術的なご質問に関しては、専任の技術者が日本語で丁寧に対応します。
また、他社のクラウド音声認識サービスとの違いをまとめた資料音声認識API選定に使える!「主要5社の価格・機能比較表」付き AmiVoice API のご紹介に詳細を掲載しておりますのでぜひご覧ください。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q「会話_汎用」と「音声入力_汎用」の違いを教えてください。A
会話は対面の会議や打ち合わせ、Web会議など、人同士の自然発話音声に強いエンジンです。
音声入力は音声操作やメール作成など、PCやスマートフォンに対して行う音声入力に強いエンジンです。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q汎用エンジンと各業界向けのエンジン(領域特化エンジン)の違いを教えてください。A
汎用エンジンは一般的に使われる言葉を広く学習させており、様々な用途で使用できる音声認識エンジンです。
医療・製薬・保険・金融など各業界向けのエンジン(領域特化エンジン)は、それぞれの業界ならではの言葉に特化して学習しているエンジンで、主に業界内での専門用語やフレーズを中心に学習させています。汎用エンジンでは認識できない業界ならではの用語を高い精度で認識します。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q音声認識の処理時間はどれぐらいですか?A
リアルタイムに認識処理され、発話終了と共に認識結果が返ります。
※ネットワークの影響や混雑度合いにより遅延が発生する可能性はあります。
同期HTTP音声認識APIや非同期HTTP音声認識APIの場合は、遅くとも、送った音声の時間×1倍以内でテキスト化が完了します。
例えば、1時間の音声であれば、1時間以内でテキスト化が完了します。
※非同期HTTP音声認識APIの場合は、リクエストを受けてから、音声認識サーバーが個別に立ち上がる仕組みになっており、認識処理がスタートするまでに約1分を要します。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q自動的に精度がよくなっていくものでしょうか?A
AmiVoice API では、 会話_汎用エンジンについては毎日新しい言葉を学習しています。
それ以外のエンジンについては半年に一回のペースでアップデートしています。
※ユーザー別にエンジンが学習されていくものではありません。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q認識結果が返ってきましたがあんまり精度がよくありません。何が原因でしょうか。A
環境騒音や話者の滑舌、マイク性能、録音ボリューム、発話した言葉がエンジンに学習されていない、など様々な原因が考えられます。
精度が悪いと感じられる場合は、録音された音声をご確認ください。
音質がよいのにもかかわらず、誤認識してしまう場合には、単語登録をお試しください。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q音声認識精度は音声フォーマットによって変わりますか?A
非可逆圧縮コーデックで圧縮された音声は、非圧縮の音声よりも認識精度が下がります。
認識率低下の度合いは、コーデックの種類や圧縮率に依存します。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Qどの言語に対応していますか?
-
Q中国語のエンジンは「中国本土の標準語を対象としたモデル」とありますが、どの種類の話し言葉で、出力される表記文字は何ですか?A
北京語に対応しており、簡体字の認識結果を出力します。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ
-
Q3種類あるAPIの違いや、それぞれの特徴を教えてください。A
違いや特徴は以下の通りです。
1.同期HTTP音声認識API
短い音声ファイルをアップロードするのに適しています。一度に送れる音声データの上限は16MBです。
2.非同期HTTP音声認識API
長時間の音声ファイルをアップロードするのに適しています。一度に送れる音声データの上限は2.14GBです。長時間の音声ファイルでも素早くテキスト化ができます。話者ダイアライゼーション機能が利用可能です。
3.WebSocket音声認識API
リアルタイムでテキスト化ができます。
詳しくは、AmiVoice API マニュアル「概要」をご確認ください。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
QJSON形式で返ってくるレスポンスには、具体的にどんな情報が書いてありますか?A
AmiVoice API では、表記(written)、読み(spoken)、発話開始時間(starttime)、発話終了時間(endtime)、信頼度(confidence)などが含まれています。
詳しくは、以下のページをご確認ください。
・同期HTTP音声認識APIのレスポンスの場合
・非同期HTTP音声認識APIのレスポンスの場合こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
QWebSocket接続のセッション維持時間に制限はありますか?
-
Qアップロードするデータのサイズに制限はありますか?
-
Qアップロードするデータ形式に制限はありますか?動画形式でも大丈夫ですか?
-
Q音声データのフォーマット名の指定は必須でしょうか?
-
Qインターネットが繋がっていない環境では、音声認識はできないのですか?
-
Q音声認識エンジンの種類を切り替えて接続するには、どうしたらよいですか?A
AmiVoice API では、音声を送るときにどのエンジンに送るかを指定する必要があります。
例えば、会話_汎用エンジンを利用する場合は「-a-general」、英語_汎用エンジンの場合は「-a-general-en」をdパラメータの中「grammarFileNames=」の後に指定してください。
使用可能な接続エンジン名の一覧は、マイページに表示されています。
詳しくは、接続エンジン名(grammarFileNames)をご確認ください。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q「単語登録」で登録できる単語数の上限はありますか。
-
QユーザーIDが1つでも、複数人が利用するサービスに使ってよいですか?A
問題ありません。
ただし、ユーザーIDが1つで、複数人が利用するような用途の場合、弊社側では、各利用者の利用時間を個別に集計することはできませんのでご留意ください。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q同時に複数の音声を認識させたい場合、同じAppKeyを使ってもよいのですか?A
AmiVoice API では、同時接続数に制限を設けていませんので同じAppKeyを使用して同時に複数の音声を送っていただいても問題ありません。
※同時に複数の音声が送られた場合でも並列で認識する仕様になっていますが、サーバーの混雑具合によっては遅延が発生する可能性があるので、同時に大量の音声を送る場合は事前にお知らせください。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ
-
Q登録せずにテスト利用を行いたいのですが、どうすればよいですか?
-
Q毎月60分無料とのことですが、60分を超えた際には通知が来ますか?A
利用量についての通知はされませんので、マイページの「今月の使用量」をご覧ください。
集計は6時間ごとに行われます。
※ 6時間の間隔は変更になる場合がありますので予めご了承ください。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q試しに使ってみたいです。どのように契約をすればよいのか、教えてください。
-
Q登録したメールアドレス・ユーザーID・パスワードを全て忘れてしまいました。
-
QユーザーIDを変更したいのですが、どうすればよいですか?A
ユーザーIDの変更はできません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q利用申し込みを行ったのに、ユーザー登録用のメールが届きません。
-
Q個人事業主でも利用登録可能でしょうか?
-
Q退会したいのですが、どのように手続きをすれば良いですか?
-
Q完全定額制プランはありますか?
-
Q課金対象となる音声部分について教えてください。A
AmiVoice API では、音声データから声が検出された部分、音声認識対象となった発話区間だけを課金対象としています。
人の声が検出されなかった部分には料金がかかりませんが、BGMやテレビ音声、隣席の話し声、その他一部の雑音は発話区間として検出される場合があります。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q電話の保留音が音声データに入っていた場合は、課金対象になりますか?A
AmiVoice API では、電話の保留音は基本的には課金の対象外となります。
※ 案内ガイダンスなどが、人の声として認定された区間は課金の対象となります。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q100時間分の音声データを認識させる場合、料金はいくらになりますか?A
100時間分のご利用料金は以下の通りです。
・AmiVoice API ログありの場合
汎用エンジンをご利用の場合:99.0円×100時間=9,900円(税込)
保険・金融業界向けエンジンをご利用の場合:148.5円×100時間=14,850円(税込)
医療業界向けエンジンをご利用の場合:297.0円×100時間=29,700円(税込)
・AmiVoice API ログなしの場合
汎用エンジンをご利用の場合:158.4円×100時間=15,840円(税込)
保険・金融業界向けエンジンをご利用の場合:237.6円×100時間=23,760円(税込)
医療業界向けエンジンをご利用の場合:475.2円×100時間=47,520円(税込)ただし、課金対象は発話部分のみなので、実際の金額は上記よりも お安くなることが想定されます。
利用料金の詳細は、こちらの料金表をご確認ください。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q課金対象となった発話区間の秒数をプログラム側で集計する方法はありますか?
-
Q1リクエスト単位の最低利用料金はありますか?A
AmiVoice API では、1リクエスト単位の最低利用料金はありません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q先月少しだけ利用しましたが、請求はありませんでした。なぜですか?A
AmiVoice API では、当月の「使用量」が、各エンジンごとの無料時間範囲以内の場合や、各エンジンごとの利用料が10円未満の場合、請求はありません。
※「使用量」は、サーバーに送信された音声データのうち、「発話区間」の累計時間となります(1秒未満切り捨て)。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ
-
Q「ログあり」と「ログなし」の違いについて教えてください。A
ログとは音声データと認識結果を意味しています。
「ログあり」は、これらのログを、当社製品及びサービスの研究開発、及び品質向上のために利用することに同意いただける場合、「ログなし」よりも低価格でご提供するものです。
「ログなし」でご利用の場合、音声データや認識結果はサーバー側にファイルとして残りません。すべてメモリ上で処理され、処理完了時にはメモリ上からも消えます。
なお、ログが残る場合の詳細については、Q「サーバー側に音声データや認識結果が保存されるケースを教えてください。」をご覧ください。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Qサーバー側に音声データや認識結果が保存されるケースを教えてください。A
1.非同期HTTP音声認識APIの場合
ジョブ受付時から認識処理完了するまでの間、音声ファイルが一時的にストレージ上に保存されます。この音声ファイルは、認識処理完了時に即時自動削除されます。また、認識結果は1週間ストレージ上に保管され、ユーザーによる取得が可能です。この音声認識結果へのアクセスは、AppKeyとsessionidによって保護されています。
2.WebSocket音声認識APIまたは同期HTTP音声認識APIを、「ログあり」でご利用いただく場合
音声データと認識結果文字列は一時的にサーバー上に保管されたのち、深夜バッチ処理により安全で堅牢なストレージに移動されます。この音声データの一部は、当社の音声認識エンジンの機械学習の素材として使用される場合があります。学習に使用されないデータは、一定期間経過後に、自動削除されます。
3.WebSocket音声認識APIまたは同期HTTP音声認識APIを「ログなし」でご利用いただく場合
音声データも認識結果文字列もサーバー側には全く保存されません。すべてメモリ上で処理され、認識結果を返却すればメモリ上からも消えます。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q送信した音声データは、日本国内のサーバーで認識処理していますか?A
はい。すべて国内のサーバーで行っています。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Qサービスの稼働率について教えてください。
-
Qサービスの障害発生時はどのように通知されますか?
-
Qシステムメンテナンス中でもサービスは利用できますか。
-
Qセキュリティに関して第三者からの認証を受けていますか?A
プライバシーマークを取得しています。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ
― AmiVoice SDK
-
Qネットワークが繋がっていない時でも認識できますか?A
サーバー上で認識を行う方式と、端末内で認識を行う方式、ご利用状況に応じて使い分ける方式(ハイブリッド認識)の3パターンがあります。端末内で認識を行う場合は、ネットワークにつながっていなくても認識できます。端末内で認識を行う場合、辞書・言語モデル内に登録する語彙数は端末スペックに依存します。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q領域特化エンジンは利用できますか?
-
Qエンジンをカスタマイズできますか?
-
Q多言語対応はしていますか?
-
Q価格を知りたいです。
-
Q開発事例を知りたいです。
-
Q音声合成の機能はありますか?A
ありません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ
-
Q音声認識の開発経験がなくても開発可能ですか?A
開発可能です。
音声認識に必要なライブラリと、ライブラリの使い方サンプルをご提供しております。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q音声認識アプリの開発を行うにあたり、サポートを受けることは可能ですか?
-
Q複数端末での開発は可能ですか?A
可能です。開発するアプリケーションの範囲内であれば複数端末でのご利用も可能です。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q開発したアプリケーション・サービスを自社で利用したり販売する場合に費用は発生しますか?
-
Q対象プラットフォーム/開発言語は何ですか?
-
QWebブラウザでも利用できますか?A
ご利用いただけません。
Windowsはデスクトップアプリ、Android・iOSはネイティブアプリが対象です。
※ Webブラウザでの音声認識はAmiVoice APIをご利用ください。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
QSDKには何が含まれていますか?A
AmiVoice SDKはライブラリ・ドキュメント・サンプルソースコードで構成されています。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
QSDKの入手方法を知りたいです。A
専用サイトからダウンロードいただけます。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ
― AmiVoice API Private
-
QAmiVoice APIとの違いはなんですか?A
AmiVoice API Privateは、AmiVoice APIを、専用クラウド環境もしくはオンプレミスにてご提供します。
専用環境のため、安定したレスポンスを実現し、お客様の利用用途に合わせた設定やエンジンをご利用いただけます。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Qオンプレミスとはなんですか?A
お客様のネットワーク内にてAmiVoice APIを提供します。
運用企業のセキュリティに準じながら、環境・目的・サービスに応じた音声認識システムを企業自身で構築・運営をすることができるため、情報セキュリティが重視される金融機関や、社外にデータを置くことができない企業機密の高い情報なども安心して音声入力を行うことができます。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Qオンプレミスの動作要件を知りたいです。
-
Qルールグラマは利用できますか?
-
Q領域特化エンジンは利用できますか?
-
Qエンジンをカスタマイズできますか?
-
Q価格を知りたいです。
― AmiVoice IVR for Amazon Connect
-
Q利用用途を知りたいです。A
Amazon Connectを利用した、音声認識IVRの開発/構築を実現します。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q音声認識の特徴を知りたいです。A
領域特化型の音声認識エンジンに加え、IVRフローに応じた認識語句をオリジナルでカスタマイズ可能です。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
QAmazon Connect以外でも利用できますか?
-
Q音声データは保存されますか?A
音声ファイルと音声認識結果ファイルをユーザ様のAWS S3に格納します。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q申込方法を知りたいです。
-
Q料金体系/支払い方法について教えてください。
-
Q音声認識をする上で必要な環境について知りたいです。A
お客様側のAmazon Connect環境および、音声認識連携用にAWS Lambda、 Kinesis Video Streams、 Kinesis Data Streams、 Dynamo DBのご準備が必要です。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q音声認識の開発経験がなくても開発可能ですか?A
ドキュメントとサンプルプログラムをご提供します。音声認識を用いない標準的な開発と比べ、必要とされるスキル面で大きな差はございません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q開発サポートはありますか?A
メールでのお問い合わせによる開発サポートを実施しています。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q使用可能な音声認識エンジンについて知りたいです。A
コールセンターの通話内容に特化したAmiVoice音声認識エンジンを自由に選択できます。
※ 選択可能なエンジンは、汎用、金融、証券、通信、製薬、製造の6種類ですこちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q単語登録機能はありますか?A
登録する単語の読みと表記を登録することで辞書単語の登録が可能です。また、音声認識IVR向けにカスタマイズした単語リストを用いることが可能です。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q利用実績の確認方法を知りたいです。A
毎月の利用実績に応じてご請求します。2022年4月現在、利用実績を都度確認することはできません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ
― AmiVoice MRCP Server
-
Q利用用途を知りたいです。A
MRCP (Media Resource Control Protocol) に対応した音声認識サーバーシステムです。MRCPに対応した、音声認識IVRを開発/構築することが可能です。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
QMRCPの対応バージョンについて知りたいです。A
MRCP version 1 とMRCP version 2 の両方に対応しています。
上記に対応したIVR であれば、IVR からシステムを利用することでAmiVoice 音声認識エンジンが利用可能です。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
QNAT変換には対応していますか?A
対応していません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q申込方法を知りたいです。
-
Q料金体系を知りたいです。
-
Q音声認識をする上で必要な環境について知りたいです。A
お客様側のMRCPシステムと接続可能なサーバー環境に、AmiVoice MRCP Server のシステム一式を構築いただく必要があります。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q音声認識の開発経験がなくても開発可能ですか?A
開発に関するドキュメントを提供しています。
MRCP IVR側ではスクラッチ開発が必要です。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q開発サポートはありますか?A
メールでのお問い合わせによる開発サポートを提供しています。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q使用可能な音声認識エンジンについて知りたいです。A
各種音声認識エンジンを利用可能です。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q単語登録機能はありますか?A
システムから単語登録を利用することが可能です。
また、IVRに特化した認識語句をオリジナルでカスタマイズしたルールグラマを使用することも可能です。こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ -
Q感情分析を行うことはできますか?A
できません。
こちらの回答で解決できない場合はお問い合わせください。
お問い合わせ