AmiVoice APIが選ばれる理由
こんにちは!営業社員の「ととのい侍」です。
音声認識APIを提供している企業は大手の海外企業を中心に複数存在しており、各企業のAPIに特徴があるかと思います。アドバンスト・メディアの音声認識エンジンである「AmiVoice API」は、25年以上の音声認識事業を通じて蓄積されたノウハウとデータを活かして提供しています。特に日本語の認識には自信を持っております。今回は「AmiVoice API」の強みや他社と差別化している点をご紹介し、お客様から選ばれている理由をお伝えします。さっそく結論から言うと以下の点が挙げられます。
1つずつ解説していきます!
お客様の用途に合わせたエンジンのご提供
AmiVoice APIでは用途ごとにエンジンを複数ご用意しています。例えば電子カルテや製薬など医療系に特化したエンジンを利用することで、病名・薬品名・医療機器の名称など、医療業界の専門用語が含まれた音声を高精度に認識できます。
また、お客様の要件に合わせて柔軟に音声認識サーバーを構築可能な「AmiVoice API Private」というサービスでは氏名・住所専用のエンジンやお客様側で設定した定型文や単語だけを認識するエンジン(ルールグラマ)が利用できるので、音声自動応答システムや製造業などのデータ入力等の利用シーンが合致します。お客様特有の表現が多く既存のエンジンで精度が出ない場合は、お客様専用のカスタムエンジンを作成することも可能です。
▼領域特化エンジンは特定の利用シーンにおいてどれほど優れているのか検証しました。
▼音響モデルは音声入力、会話の2種類からお選びいただけます。
▼ルールグラマエンジンの概要はこちら。
お客様の環境やご要望に合わせたご提供
AmiVoice APIは共用サーバーでご利用いただくクラウドサービスですが、お客様側でセキュリティポリシーに合致しない場合や他ユーザーの利用状況に影響されることなく安定したレスポンスを重視したいという声もいただきます。その場合はAmiVoice API Privateにてお客様専用に音声認識サーバーをクラウド or オンプレミスで提供しています。オフラインでの認識を希望する場合はAmiVoice SDKを利用して音声認識エンジンを端末に組み込むことも可能です。
見やすい認識結果
見やすくする工夫として句読点・疑問符を認識結果に自動的に付与しているので、より正確でわかりやすい話し言葉の文章作成をサポートしています。また、「えっと」「あのー」などの言い淀みを自動削除(削除しない設定も可能)しているので認識結果を修正する手間が軽減されます。
▼言い淀み(フィラー)の表示可否の選択について紹介しています。
課金対象が発話時間のみ
他社APIのほとんどが課金対象=音声時間となっていますが、AmiVoice APIでは課金対象=発話時間となっています。そのため無音の区間や雑音などの人の声と判定されない区間には料金がかかりません。これは音声認識を行う時に音声の波形などの特徴から発話区間検出(実際に人が喋った音声区間を抜き出す技術)を行って実現しています。
読みの取得
音声認識結果には単語ごとの読み(ひらがな)が含まれています。そのため、アプリケーション側で漢字の上に「ふりがな」を表示させることも可能です。ただし、この「読み」は、発音通りのものになりますので正確な「ふりがな」とは異なる場合があります。例えば「私 は」という表記に対する読みは「わたくし わ」となります。
「spoken」が各単語の読みとなります
単語登録
製品名や固有名詞などを事前に単語登録することで登録した単語が認識できるようになります。当社のエンジンは学習されていない言葉でも単語登録をすることで認識が可能です。一方他社のエンジンでは単語登録機能が無いものや、単語の重み付けを変えるだけで未知の単語には対応できないものもあります。また、単語帳を複数作成できる点も強みです。サービス提供者様からするとエンドユーザーごとに単語帳を持てることは重要だと思います。アプリケーション側でUIを作成いただければエンドユーザー自身が単語登録を行うということも可能です。
▼実は単語登録はいくつかコツがあります。
技術サポート
音声認識の開発経験がある企業はまだ多くないと思いますので、技術サポートがあることで安心して開発できると考えています。他社の大手海外企業だとサポートを行っていなかったり、日本語での対応が難しいケースがあるようです。弊社ではAmiVoice APIを利用中の方に無償で技術的なサポートを行っています。技術的なお問い合わせのページからご相談内容を入力して送っていただければ、弊社専任の日本人技術者からメールでご回答させていただきます。希望があればお打ち合わせも可能です。
最後に
その他、同時リクエスト数の制限がなかったり等ここではご紹介できないほど魅力があるAmiVoice APIですが、他社と比較した時の弱点があります。それは対応言語が他社と比較して少ない点です。
(AmiVoice APIでは3言語のみ公開していますが、実は他言語のエンジンも個別に提供可能です。)
弊社ではそのような点も含めた主要6社の音声認識API比較表を公開しています。以下にて内容を少しチラ見せします。
興味がありましたら下記からダウンロードできるので、ぜひご覧ください。
それでは、これにて御免。
主要6社の価格・機能比較表ー失敗しないサービス選びのポイントー
この記事を書いた人
-
ととのい侍
新卒3年目の営業社員です。
最近は地方のサウナに行くことが多く、
サウナ後にご当地グルメを喰らうのが幸せです。