商業施設や観光施設、空港などで、外国語のアナウンスができるアプリ「USENおもてなしキャスト」を提供する株式会社USEN様。どのように音声認識を使っているのか、また、当初使っていたSiriからAmiVoiceに変更した理由や効果などを株式会社U-NEXT HOLDINGS グループアライアンス推進統括部 Universal Design Tech Lab. 所長の北澤 伸二様に伺いました。
課題・背景
多言語でアナウンスを作成し・放送が可能なアプリ
「USENおもてなしキャスト」は、特に人手不足が課題となっている施設や、インバウンド顧客への対応が求められる場所、商業施設、ホテル、空港などで利用されているアプリです。これらの施設では、国内外から訪れるお客様に対して、迅速かつ正確な情報提供が求められるため、多言語対応が非常に重要です。
本アプリでは、館内アナウンスを作成してすぐに多言語で放送できるほか、タブレット端末で外国人のお客様へのご案内を翻訳して外国語で表示したり、聴覚障がい者の方へのご案内をテキスト表示したりすることも可能です。アナウンスの作成時やタブレットを使ってお客様にテキストを見せながらご案内する際に、キーボードを打つのではなく、音声で素早く入力をしたいというユーザー様からの強いニーズがあり音声入力機能を搭載しました。
導入の決め手
固有名詞を高精度で認識できる点を評価しSiriから変更
音声入力ではもともとSiriを使っていたのですが、より高い音声認識の精度が求められていました。商業施設や観光施設、空港などのような場所では、特に、固有名詞や専門用語への対応、フレーズの認識精度、新しい固有名詞への対応速度などが重視されています。
Siriでは固有名詞や専門用語の認識が難しいことも多く他のエンジンへの切り替えを検討することになりました。
AmiVoice APIは一般固有名詞の認識精度が高く、そのバリエーションも豊富です。音声認識エンジンが常に最新の状態にアップデートされているため最近出てきた新しい言葉なども認識し、その対応速度が速い点を評価しています。
実装の難易度は
特に問題もなくスムーズに対応できました。提供されているマニュアルや技術ドキュメント、よくある質問などのコンテンツが分かりやすく、実装作業において大きな支援となりました。
導入の効果と今後の展望
誤認識が減少し、スムーズなご案内が可能に
AmiVoice APIの導入によって、長めの音声であっても誤認識が少なくなり、漢字変換の正答率が向上するなど、顕著な効果が見られました。その結果、現場でより快適でスムーズなサービス提供が可能になりました。
今後に関しては、「USENおもてなしキャスト」の翻訳機能の強化、特に日韓同時聞き取りへの対応を期待しています(現在AmiVoice APIでは韓国語エンジンに対応しております)。
また、多言語アナウンスや対面翻訳だけでなく、遠隔での多言語翻訳に対応できるリモート接客ツール「USENモバイルインターフォン」もリリースしました。
今後も音声認識の精度や固有名詞への対応、漢字変換の正答率など、さらなる改善と強化を期待しており、将来的にはAmiVoice APIの更なる利用を検討しています。
サービス概要
「USENおもてなしキャスト」は、施設の省人化促進、外国語のアナウンスができる人手不足、インバウンド対策に向けたiPadアプリです。インフォメーション向けの「INFO」プラン、防災センター/管理事務所向けの「防災」プラン、対面接客時の翻訳ツールとして使える「対面トーク」の3つのプランをご用意しています。
施設でよく利用される定型文の選択肢を組み合わせて放送できるほか、オリジナルのアナウンスもキーボード入力、音声入力、iPadのカメラを使ったテキストスキャン機能を使って作成できます。リアルタイム翻訳機能もあるので外国語のアナウンスもすぐに作成して流すことができます。また、翻訳機能を使って日本語が話せないお客様との対面接客時にもiPadの大きな文字で対応可能です。透明ディスプレイへ接続し表示することも可能です。
社名 | 株式会社USEN |
---|---|
事業内容 | 店舗サービス/通信/業務用システム/エネルギー/コンテンツ配信事業ほか |
URL | https://usen.com/ |