よくある質問

  • HOME
  • よくある質問

AI音声認識技術 AmiVoice

AmiVoiceの音声認識技術について

  • Q
    AmiVoiceの特長は?
    A
    AmiVoiceは様々な利用用途、分野、環境に対応可能です。
    携帯電話やPCなど多くのプラットフォームに対応可能です。
    サーバー型、スタンドアローン型のどちらの認識方式にも対応可能です。
    音響モデルとしては、電話音声や車内音声・工場内などの騒音下での音声など、言語モデルとしては、医療ドキュメント作成やコールセンター通話記録・日報作成などがあり、多くの業界や利用シーンに対応できます。
  • Q
    誰の声でも認識しますか?
    A
    誰の声でも認識します。発音の明瞭度、喋り方、声の大きさ等によって認識率は多少左右されます。
  • Q
    イントネーションの違いや方言は大丈夫ですか?
    A
    イントネーションの違いや発話スピードの緩急に対応しています。ただし、辞書に入っていない方言については新たに登録をする必要があります。
  • Q
    単語ごとに発話すると誤認識が多いのですが…
    A
    AmiVoiceは前後の単語を見ながら認識結果を出していますので、文の途中で発話を区切ると誤認識の原因となります。できるだけ一文単位で発話するように心がけてください。
  • Q
    音声入力時の認識率を上げる方法を知りたい
    A
    以下のヒントを参考にしてください。
    • 明瞭な声ではっきりと発話する
    • 1文もしくは句読点を目安に発話する
    • 複数の文節で発話する
    ※ 複数の文節が入力されたとき、日本語文脈の解析がより効果的に働きます。
    ※ マイクから入力されるすべての音が日本語の文章として解析されます。
    ※ 途中で言い直したり、”えーと”や”んー”等の発言は、文脈の中での単語と見なされます。
  • Q
    漢字変換の仕組みは?
    A
    音響的モデルと言語的モデルで計算した確率の最も高い単語列を認識結果としており、音声から直接漢字仮名まじりの認識結果を得ています。 音声認識では、平仮名を認識してから漢字に変換していません。
  • Q
    平仮名で一文字ずつでもよいので入力させたい
    A
    平仮名一文字ずつの認識は、誤認識が多く発生するため実用化していません。

AmiVoice API

利用方法

  • Q
    パスワードを忘れてしまった
    A
    ログイン画面で新パスワード設定の手続きを行ってください。 登録されているメールアドレスに、パスワード再設定用のURLををお送りします。
  • Q
    ユーザーIDを変更したい
    A
    ユーザーIDの変更はできません。
  • Q
    ユーザーIDを忘れてしまった
    A
    ログイン画面でユーザーID確認の手続きを行ってください。 登録されているメールアドレスに、ユーザーIDをお送りします。
  • Q
    一つのユーザーIDで複数人が利用できるサービスを作成できますか?
    A
    可能です。ひとつのユーザーIDに対してひとつのAppKeyが発行されますが、このAppKeyは、複数人の使用するサービス(アプリケーション)に共通して設定できます。
  • Q
    利用を止めたいので、必要な手続きが知りたい
    A
    マイページより、退会手続きを行ってください。
  • Q
    登録のメールアドレス、ID、パスワードも忘れてしまった
    A
    こちらのお問い合わせからご連絡ください。本人確認の上ご対応します。
  • Q
    利用申込みを行ったがメールが届かない
    A
    ご利用のプロバイダやフリーメールサービスの設定で迷惑メールのフォルダへ届いている場合があります。
    迷惑メールのフォルダに振り分けられていないかご確認ください。
    ※メールが振り分けられてしまっている際には「acp-info@amivoice.com」からのメールを受信できるようご設定ください。
  • Q
    体験デモで制限がかかってしまった
    A
    短時間に利用が集中すると制限がかかります。1時間ほど待ってから再度お試しください。

料金・お支払い

  • Q
    少しだけ利用したが、請求されなかった
    A
    対象月を通して、ごく少量しか利用されなかった場合、お支払いが発生しない場合があります。
    ※ 認識対象は音声部分のみです。無音箇所は認識対象外のため、利用料金に含まれません。
    ※ 詳細はマイページの「利用料金履歴」をご確認ください。
  • Q
    支払い方法が知りたい
    A
    基本的にはクレジットカードによるお支払いです。法人の場合、請求書発行も可能ですのでお問い合わせください。
    ※ 請求書でのお支払いには審査が必要です。
  • Q
    料金体系について知りたい
    A
    音声認識時間による従量課金です。詳しくは価格をご覧ください。
  • Q
    毎月60分無料とのことですが、60分を超える際に通知する機能はありますか?
    A
    ありません。
    マイページの「今月の使用量」から、使用量をご確認ください。
    ※ 使用量は6時間ごとに集計されます。
    ※ 集計間隔は変更される可能性があります。

用語

  • Q
    AppKeyとは?
    A
    AppKeyは、音声認識APIを利用するために必要な認証Keyです。API利用時に必ず指定してください。
    AppKeyごとに使用量が計算されるため、機密情報としてお取り扱いください。
  • Q
    サービスID、サービスパスワードとは?
    A
    ワンタイムAppKeyを発行するために必要なID/パスワードです。ユーザー登録時に自動生成され、マイページの接続情報に記載されています。ワンタイムAppKeyの発行についてはドキュメントのチュートリアルにある「ワンタイムAppKeyについて」を参照してください。
  • Q
    プロファイルとは?
    A
    プロファイルとは、追加単語の情報を格納しておくためのデータベースです。
    APIの利用時にプロファイルIDを指定することで、そのセッションにおける認識処理に利用することができます。
  • Q
    発話区間とは?
    A
    音声認識サービスでは、送信されてきた音声データの中の「音声がある部分」を検出して切り出し、切り出された一塊を処理単位として認識処理を行います。この一塊を発話区間(Uttrance)と呼んでいます。
  • Q
    発話区間検出(セグメンター)とは?
    A
    送信されてきた音声データの中の「音声がある部分」を検出して切り出す処理を発話区間検出と呼びます。また、その処理を行うモジュールを当社ではセグメンターと呼んでいます。

音声認識について

  • Q
    ネットワークが繋がっていない時でも認識できますか?
    A
    AmiVoiceAPIでは、ネットワークが接続されていない場合は音声認識できません。
    ※ AmiVoice SDKは、ネットワーク接続なしで音声認識が可能です。
    詳しくはAmiVoice SDKのページをご確認ください。
  • Q
    単語登録した単語が認識されない
    A
    profieIdが指定されていない、もしくは間違っている可能性があります。プロファイルの利用につきましては、マニュアルのチュートリアルにある「プロファイルと単語登録について」をご確認ください。
  • Q
    対応している音声フォーマットが知りたい
    A
    マニュアルのチュートリアル にある「音声フォーマットについて」 をご覧ください。
    ※ 動画ファイルには対応していません。音声データを抽出し、適切な音声フォーマットに変換してご利用ください。
  • Q
    接続が切断される
    A
    接続後、600秒間にわたって音声がセグメントできない状態が続いた場合は、サーバーからセッションを切断しています。
    WebSocketの場合、最大接続可能時間は24時間です。24時間を超える場合は、再度接続を行ってください。
  • Q
    発話がうまく認識されない
    A
    録音音声の品質に問題がある可能性があります。
    ログありの場合は、マイページの音声再生ページで発話音声を再生できます。正しく認識できそうな音質かどうかをご確認ください。
  • Q
    音声再生ページで、発話した音声が保存されてない
    A
    ログなしの場合、音声は保存されません。
    ※ 入力レベルが低い場合や、ノイズが強い場合、接続時のコーデック指定が間違っている場合などには、発話区間の検出に失敗し認識処理が行われていない可能性があります。
  • Q
    認識されない単語を認識させるようにしたい
    A
    音声認識エンジンに登録されていない固有名詞や新出単語などは、認識されません。このような場合は「単語登録」をすることで、認識させることが可能です。
    ※ 一部の音声認識エンジンは自動更新されています。
    ※ 自動更新によって認識されなかった単語も認識されるようになる可能性があります。
  • Q
    音声の保存期間はどの位ですか?
    A
    ログありの場合の、音声の保存期間は2日間(前日まで)です。
  • Q
    音声認識サーバに接続できない
    A
    下記の点について確認をお願いします。
    • AppKey が指定されていない、もしくは間違っている可能性があります。
      マイページ記載のAppKeyをご確認ください。
    • 接続エンジンモードが指定されていない、もしくは間違っている可能性があります。マイページに記載の接続エンジン名をご確認ください。
    • ワンタイムAppKeyを使用している場合、期限切れになっていないかご確認ください。
    • クレジットカードの有効期限切れなどにより、クレジットカードが無効となっている場合は接続ができません。マイページより、利用可能なクレジットカードを再度ご登録ください。
  • Q
    ログなしの場合でも、音声データは認識処理のために一時的に保存されますか?
    A
    ログなしの場合、一時的にも保存されません。
    送信されてきた音声データは、サーバのメモリ上にバッファされながら認識処理され、認識処理が進むとにメモリ上のバッファから削除します。

AmiVoice API Private

サービスについて

  • Q
    AmiVoice APIとの違いは?
    A
    AmiVoice API Privateは、AmiVoice APIを、専用クラウド環境もしくはオンプレミスにてご提供します。
    専用環境のため、安定したレスポンスを実現し、お客様の利用用途に合わせた設定やエンジンをご利用いただけます。
  • Q
    オンプレミスとはなんですか?
    A
    お客様のネットワーク内にてAmiVoice APIを提供します。
    運用企業のセキュリティに準じながら、環境・目的・サービスに応じた音声認識システムを企業自身で構築・運営をすることができるため、情報セキュリティが重視される金融機関や、社外にデータを置くことができない企業機密の高い情報なども安心して音声入力を行うことができます。
  • Q
    オンプレミスの動作要件を知りたい
    A
    こちらをご確認ください。
  • Q
    ルールグラマは利用できますか?
    A
    ルールグラマを利用できます。サーバに配置したグラマファイルを利用し、認識が可能です。
  • Q
    領域特化エンジンは利用できますか?
    A
    領域特化エンジンをご利用いただけます。
  • Q
    エンジンをカスタマイズできますか?
    A
    可能です。詳細や価格についてはこちらからお問い合わせください。
  • Q
    価格を知りたい
    A
    こちらからお問い合わせください。

AmiVoice SDK

サービスについて

  • Q
    ネットワークが繋がっていない時でも認識できますか?
    A
    サーバー上で認識を行う方式と、端末内で認識を行う方式、ご利用状況に応じて使い分ける方式(ハイブリッド認識)の3パターンがあります。端末内で認識を行う場合は、ネットワークにつながっていなくても認識できます。端末内で認識を行う場合、辞書・言語モデル内に登録する語彙数は端末スペックに依存します。
  • Q
    領域特化エンジンは利用できますか?
    A
    領域特化エンジンをご利用いただけます。
  • Q
    エンジンをカスタマイズできますか?
    A
    可能です。詳細や価格についてはこちらからお問い合わせください。
  • Q
    多言語対応はしていますか?
    A
    日本語、英語、中国語、韓国語、タイ語への対応が可能です(2022年4月現在)。
    それぞれの言語について対応範囲が異なりますので、こちらからお問い合わせください。
    ※ パッケージ製品は日本語対応のみとなり、多言語対応は個別対応です。
  • Q
    費用が知りたい
    A
    こちらからお問い合わせください。
  • Q
    開発事例を知りたい
    A
    こちらをご確認ください。
  • Q
    音声合成の機能はありますか?
    A
    ありません。

開発について

  • Q
    音声認識の開発経験がなくても開発可能ですか?
    A
    開発可能です。
    音声認識に必要なライブラリと、ライブラリの使い方サンプルをご提供しております。
  • Q
    音声認識アプリの開発を行うにあたり、サポートを受けることは可能ですか?
    A
    音声認識に必要なライブラリの使用方法などをメールでご案内する開発サポートのサービスがあります。開発サポートについてはこちらからお問い合わせください。
  • Q
    複数端末での開発は可能ですか?
    A
    はい。開発するアプリケーションの範囲内であれば複数端末でのご利用も可能です。
  • Q
    開発したアプリケーション・サービスを自社で利用したり販売する場合に費用は発生しますか?
    A
    開発を終え、音声認識アプリを自社利用または、販売する場合は「商用ライセンス」が必要です。費用はこちらからお問い合わせください。
  • Q
    対象プラットフォーム/開発言語を知りたい
    A
    こちらをご確認ください。
  • Q
    Webブラウザでも利用できますか?
    A
    利用できません。
    Windowsはデスクトップアプリ、Android・iOSはネイティブアプリが対象です。
    ※Webブラウザでの音声認識はAmiVoice APIをご利用ください。
  • Q
    SDKには何が含まれていますか?
    A
    AmiVoice SDKはライブラリ・ドキュメント・サンプルソースコードで構成されています。
  • Q
    SDKの入手方法を知りたい
    A
    専用サイトからダウンロードいただけます。

AmiVoice TextStream

利用方法

  • Q
    Amazon Connect以外でも利用できますか?
    A
    TextStreamではAmazonConnect以外の音声認識を行うことはできません。
  • Q
    申込方法を知りたい
    A
    こちらからお問い合わせください。
  • Q
    料金体系を知りたい
    A
    こちらをご確認ください。
  • Q
    支払い方法について知りたい
    A
    お支払方法は、指定の銀行口座への振り込みです。
    ご利用料金は、毎月1日から月末までの1ヵ月分を課金対象とし、翌月上旬にご請求いたします。
  • Q
    クレジットカードでの支払いは可能ですか?
    A
    クレジットカードの利用はできません。

サービスについて

  • Q
    音声認識をする上で必要な環境について知りたい
    A
    お客様側のAmazon Connect環境および、音声認識連携用にAWS Lambda, Kinesis Video Streams, Kinesis Data Streamsの準備が必要です。
  • Q
    音声認識の開発経験がなくても開発可能ですか?
    A
    ドキュメントとサンプルプログラムを提供します。音声認識を用いない標準的な開発と比べ、必要とされるスキル面で大きな差はありません。
  • Q
    開発サポートはありますか?
    A
    メールでのお問い合わせによる開発サポートを提供しています。
  • Q
    使用可能な音声認識エンジンについて知りたい
    A
    コールセンターの通話内容に特化したAmiVoice音声認識エンジンを自由に選択できます。
    ※ 選択可能なエンジンは、汎用、金融、証券、通信、製薬、製造の6種類です。
  • Q
    単語登録機能はありますか?
    A
    辞書単語登録APIから、登録する単語の読みと表記を登録できます。
  • Q
    利用実績の確認方法が知りたい
    A
    マイページまたは利用実績確認APIから、指定した月の利用実績時間を確認できます。
  • Q
    感情解析を行うことはできますか?
    A
    できません。

AmiVoice IVR

サービスについて

  • Q
    利用用途を知りたい
    A
    Amazon Connectを利用した、音声認識IVRの開発/構築を実現します。
  • Q
    音声認識の特徴を知りたい
    A
    領域特化型の音声認識エンジンに加え、IVRフローに応じた認識語句をオリジナルでカスタマイズ可能です。
  • Q
    Amazon Connect以外でも利用できますか?
    A
    Amazon Connect以外には対応しておりません。
    Amazon Connect以外で音声認識IVRを開発したい場合、AmiVoice SDKを用いて、個別に開発を行っていただく必要があります。
    こちらからお問い合わせください。
  • Q
    音声データは保存されますか?
    A
    音声ファイルと音声認識結果ファイルをユーザ様のAWS S3に格納します。
  • Q
    申込方法を知りたい
    A
    こちらからお問い合わせください。 お打ち合わせを実施し、申込書への記入・設定が完了した後にご利用を開始いただけます。
  • Q
    料金体系/支払い方法について教えてください。
    A
    こちらからお問い合わせください。
  • Q
    音声認識をする上で必要な環境について知りたい
    A
    お客様側のAmazon Connect環境および、音声認識連携用にAWS Lambda, Kinesis Video Streams, Kinesis Data Streams, Dynamo DBのご準備が必要です。
  • Q
    音声認識の開発経験がなくても開発可能ですか?
    A
    ドキュメントとサンプルプログラムをご提供します。音声認識を用いない標準的な開発と比べ、必要とされるスキル面で大きな差はございません。
  • Q
    開発サポートはありますか?
    A
    メールでのお問い合わせによる開発サポートを実施しています。
  • Q
    使用可能な音声認識エンジンについて知りたい
    A
    コールセンターの通話内容に特化したAmiVoice音声認識エンジンを自由に選択できます。
    ※ 選択可能なエンジンは、汎用、金融、証券、通信、製薬、製造の6種類です
  • Q
    単語登録機能はありますか?
    A
    登録する単語の読みと表記を登録することで辞書単語の登録が可能です。また、音声認識IVR向けにカスタマイズした単語リストを用いることが可能です。
  • Q
    利用実績の確認方法を知りたい
    A
    毎月の利用実績に応じてご請求します。2022年4月現在、利用実績を都度確認することはできません。

AmiVoice MRCP Server

サービスについて

  • Q
    利用用途が知りたい
    A
    MRCP (Media Resource Control Protocol) に対応した音声認識サーバシ ステムです。MRCPに対応した、音声認識IVRを開発/構築することが可能です。
  • Q
    MRCPの対応バージョンについて知りたい
    A
    MRCP version 1 とMRCP version 2 の両方に対応しています。
    上記に対応したIVR であれば、IVR からシステムを利用することでAmiVoice 音声認識エンジンが利用可能です。
  • Q
    NAT変換には対応していますか?
    A
    対応していません。
  • Q
    申込方法を知りたい
    A
    こちらからお問い合わせください。
  • Q
    料金体系を知りたい
    A
    こちらからお問い合わせください。
  • Q
    音声認識をする上で必要な環境について知りたい
    A
    お客様側のMRCPシステムと接続可能なサーバ環境に、AmiVoice MRCP Server のシステム一式を構築いただく必要があります。
  • Q
    音声認識の開発経験がなくても開発可能ですか?
    A
    開発に関するドキュメントを提供しています。
    MRCP IVR側ではスクラッチ開発が必要です。
  • Q
    開発サポートはありますか?
    A
    メールでのお問い合わせによる開発サポートを提供しています。
  • Q
    使用可能な音声認識エンジンについて知りたい
    A
    各種音声認識エンジンを利用可能です。
  • Q
    単語登録機能はありますか?
    A
    システムから単語登録を利用することが可能です。
    また、IVRに特化した認識語句をオリジナルでカスタマイズしたルールグラマを使用することも可能です。
  • Q
    感情解析を行うことはできますか?
    A
    できません。
お役立ち資料