精度検証付き!特定用途に特化した音声認識エンジンのご紹介
ととのい侍
こんにちは!営業社員の「ととのい侍」です。
突然ですが、お客様とのお打ち合わせで
「提供中のIVR *1で氏名や住所を音声認識できるようにしたい」
「データ入力アプリに特定の数字や言葉だけを音声認識させたい」
という声をよくいただきます。
今回はそのようなシーンに効果を発揮する音声認識エンジンをご紹介します!
特定用途に特化した4つのエンジン
これからご紹介する以下4つのエンジンはお客様専用のサーバーを構築してご利用いただくAmiVoice API Privateにてご提供可能なエンジンとなります。
➀氏名エンジン
- 苗字と名前がカタカナで認識可能(苗字と名前はセットで発話)
例:ヤマダタロウ - 主に日本人の苗字・名前を学習しています(一部外国人名も学習済み)
- 利用シーンはコールセンターやIVR、ボイスボットなど
②住所エンジン
- 日本全国の都道府県、市町村名、番地まで認識可能
例:東京都豊島区東池袋3-1-1 - 利用シーンはコールセンターやIVR、ボイスボットなど
③ナビ用エンジン
- ナビなどの入力に必要なランドマーク、駐車場、交差点、小売店、道路施設、住所などが認識可能
例:東京タワー、ファミリマート - 全国の市区町村名や番地のほか、一部のマンション名までも認識できる
- 利用シーンはカーナビやタクシーの配車アプリ、動態管理システムなど
④ルールグラマエンジン
- ユーザー側で設定した定型文や単語だけを認識可能
例:数字のみを認識するように設定して「いちご」と発話すると「15」と認識 - 音声コマンドや、予め用意した単語やフレーズに一致するかどうかを判断できる
- 利用シーンは製造業や点検保守などのデータ入力、ボイスボットなど
- 下記の記事で既に詳しく解説しておりますのでぜひご覧ください。
AmiVoice Cloud Platform-Tech Blog
精度検証
エンジンの内容は理解したが認識率はどうなんだろう?と気になりますよね。
ということで、実際に各エンジンを使って精度を検証してみました!
検証の際は汎用エンジンと比較もしています。
見慣れている単語は汎用エンジンでも学習されており精度の比較が難しいため、検証する単語は見慣れないワードにしています。
➀太田豊太郎(「舞姫」[著:森鴎外]の主人公)
エンジン | 音声認識結果 |
---|---|
音声入力_汎用 | 太田と与太郎 |
音声入力_氏名 | オオタトヨタロウ |
汎用エンジンでは謎の与太郎さんが登場してしまっているのに対して、氏名エンジンはカタカナでしっかりと認識されています。漢字だと表記ゆれする場合がありますがカタカナであればその心配がなく安心ですね。
②埼玉県南埼玉郡宮代町和戸横町2丁目(2023年3月に更新された住所)
エンジン | 音声認識結果 |
---|---|
音声入力_汎用 | 埼玉県南埼玉郡宮代町は豊子町2丁目 |
音声入力_住所 | 埼玉県南埼玉郡宮代町和戸横町2丁目 |
汎用エンジンは完璧に認識できていないのに対して、
住所エンジンは最近更新された住所でも網羅している可能性が高いです。
③エディオンあなんきだでんき駐車場(徳島県阿南市にある駐車場)
エンジン | 音声認識結果 |
---|---|
音声入力_汎用 | エディオン阿南木田電機駐車場 |
音声入力_ナビ用 | エディオンあなんきだでんき駐車場 |
汎用エンジンでは発話した言葉をそれっぽい漢字で認識しているのに対し、
ナビ用エンジンでは正式名称のひらがな表記でしっかりと認識されています。
☟導入いただいた企業様からも認識率の高さについてコメントをいただいております。
さいごに
今回は、AmiVoice API Privateにて提供している4つのエンジンについて解説しました。
もしもこの記事を見て上記のエンジンに興味を持った方は、下記のお問い合わせページからご連絡下さい。無償で試行環境のご提供も可能です。
お問い合わせ – AmiVoice Cloud Platform
それでは、これにて御免。
この記事を書いた人
-
ととのい侍
新卒3年目の営業社員です。
最近は地方のサウナに行くことが多く、
サウナ後にご当地グルメを喰らうのが幸せです。
*1:IVRとは電話の音声自動応答システムです。