AmiVoiceの単語登録APIで音声認識をもっと自由に!

みなさま、はじめまして。
AmiVoice Cloud Platform担当営業のクワノキ(桑の木)と申します。配属されてから気になっていたこのTechblog、ついに初執筆です!
今回は、「単語登録API」についてご紹介します。
これまでにも単語登録に関する記事は公開してきましたが、API版についてはまだ触れていませんでした。
お客さまから単語登録について質問をいただくことがしばしばあります。この記事が「単語登録API、気になる!」「もっと柔軟に単語登録機能を使ってみたい」という方のヒントになれば嬉しいです。
※本記事は2025年10月時点の情報です。今後音声認識エンジンのバージョンアップなどによって一部内容が変更されていく可能性がありますので、ご了承ください。
単語登録APIってなに?
AmiVoice APIでは「単語登録API」の提供をしています。
「そもそも単語登録はどのような機能?」という方は以下の記事の「単語登録について」をぜひご覧ください。
音声認識されない単語は単語登録!AmiVoiceの単語登録のコツ – AmiVoice Techblog
<この記事を読んで分かること>
・単語登録APIって何?使うと何がいいの?
単語登録の方法
現在、単語登録の方法には、(主に)以下の3つの方法があります。
A. マイページからの単語登録
B. 単語登録APIでの単語登録
C. リクエスト毎に設定する方法
AとB は事前に単語登録を設定しておく方法です。
一方、C は音声認識のリクエスト時にパラメータとして単語を渡すことで、”そのセッションだけ”有効にする方法です。
本記事では、AとB にフォーカスします。
どちらも「プロファイル(=単語を保存する辞書)」に単語を事前登録する仕組みですが、APIを使うことでより柔軟な運用が可能になります。
単語を登録する際には「プロファイルID」を指定します。これは、プロファイル(辞書)を識別するための名前です。
ここで少し「プロファイルID」について補足しておきます。
マイページからの単語登録(A)の場合、操作できるプロファイルはアカウント登録時に発行されるサービスIDと同じ名前のプロファイルIDのみに限られています。つまり、1つの辞書しか持てないという制約があります。
一方、単語登録API(B)を利用すれば、任意の文字列でプロファイルIDを指定して複数のプロファイル(辞書)を作成・管理することが可能です。
例えば、部署ごとにdepartment_A と department_B のようなプロファイルIDを作って切り替えたり、アプリケーションのユーザーIDをそのままプロファイルIDにして利用者ごとの辞書を作成することができます。
もし、企業向けにアプリケーションを提供しているのであれば、企業ごとに会社名や製品名を単語登録して認識させることができるわけです。
このように、持てる辞書の数や柔軟性の違いも、両者の大きな違いのひとつです。
ここで、両者の違いを表に整理します。各項目の詳細は、後ほど紹介しますね。
【表1:”ざっくり”とした比較表】

表の通り、マイページからの単語登録は、GUI上での操作ができます。そのため、非エンジニアの方でも簡単に登録可能です。たとえば、AmiVoice APIを使って開発したサービスを提供する際、エンドユーザー自身がマイページから単語を登録してほしい場合に適しています。
一方、単語登録APIは、開発者が自社サービスに単語登録機能を組み込みたいときに有効です。マイページを介さず、自社サービスの画面上で単語登録ができるため、UXを損なわずに音声認識精度を高めることができます。
単語登録APIはどんな場面で使える?
さて、この単語登録APIですが、具体的にはどのようなシーンで活躍するのでしょうか?
例えば、コールセンターシステムにおいて通話の文字起こし機能を実装する場合、ユーザー企業ごとに単語登録機能が実装できます。
単語登録APIを活用したアプリケーションを開発いただくことで、(ACPのマイページを介さずとも)そのアプリケーションの中で、単語登録機能を実装することができます。
さらに、企業ごとに専用の辞書(プロファイル)を持てるため、ユーザー企業の業界用語や社内用語に合わせて、より柔軟でカスタマイズ性の高い音声認識アプリケーションを開発することができます。
単語登録APIを有効活用することで、アプリケーションのUXを損なうことなく、音声認識精度の向上に繋げることが可能です。
次の段落からは、2つの単語登録の概要や特徴について、紹介します。
マイページからの単語登録
マイページへログインし、「認識率の調整」タブから、直接入力もしくはファイルをアップロードすることで登録が可能です(図1)。マイページを介して、プロファイル(=事前に単語を保存しておく場所)に保存することができます。GUI上で操作できるので、非エンジニアの方でも使いやすいのが特長です。


【図1:マイページからの単語登録】
マイページからの単語登録を図で表すと、以下のようになります(図2)。
ユーザーがマイページを通して、プロファイルに単語を登録するイメージですね。

【図2:マイページから単語を登録する仕組みのイメージ】
ただし、以下の注意点が挙げられます。
- 1,000単語までしか登録ができない
- 日本語以外の単語登録ができない
- 1つのプロファイルにしか保存できない=1つの辞書しか持つことができない
3点目の「1つのプロファイルにしか保存できない」という点については、前述の通り、マイページではサービスIDと同じ名前のプロファイルIDのプロファイルしか操作できません。
これらの制限が課題となる場合やアプリケーションに単語登録機能を実装したい場合、単語登録APIのご利用をおすすめします。
単語登録APIでの単語登録
マイページからの単語登録は「UI付きの単語登録機能」といった感じで、開発せずとも直感的に操作ができる点が特長でした。
一方、単語登録APIは、サービス開発者様が「アプリに単語登録機能を実装する」ことを可能にしたものです。
単語登録APIでは、登録単語を任意のプロファイルに保存することができます(図3)。複数のプロファイル=辞書を持つことができます。プロファイルは音声認識エンジン毎に保存されます。

【図3:単語登録APIを活用して登録する仕組みのイメージ】
プロファイルIDは任意の文字列を指定してください。半角英数文字、および、「-」(半角マイナス)、「_」(半角アンダーライン) で構成される文字列が利用できます。ただし、「__」(半角アンダーライン 2 文字)ではじまる文字列は、 指定しないようにしてください。
単語登録APIのメリットとして、以下が挙げられます。
- 複数かつ任意のプロファイルに保存できる=複数の辞書を持つことが可能
- 1,000語以上登録ができる
- 日本語のほか、中国語、韓国語の単語登録が可能
※中国語の場合はピンイン、韓国語の場合はハングルで「読み」を登録してください
以前の記事では「最大1,000語まで」と紹介していましたが、APIを使えばそれ以上の語数を登録可能です。
ただし、登録語数が多くなると、似た読みの単語との誤認識リスクが高まります。これを避けるには、十分に長くユニークな単語を登録するのがおすすめです。特に短い読みの単語は、同音異義語や類似発音の単語と混同されやすいため注意が必要です。
以下は、以前の記事で紹介されている単語登録のコツを簡単に紹介したものです!単語登録の際に、参考になれば幸いです。
<単語登録のコツまとめ>
※詳細について知りたい方は記事本文をご覧ください
- 登録単語数は必要最小限に
登録数が多いほど誤認識のリスクが高まるため、必要な単語だけを登録しましょう。 - 同じ「表記」の単語は複数登録してもOK
例えば、「雰囲気」を登録する際に、「表記:雰囲気 読み:ふんいき」「表記:雰囲気 読み:ふいんき」と登録してもOKです。ただし、同じ「読み」の単語を複数登録しても意味はありません。 - 「クラス」を活用する
単語登録時に「駅名」「人名」などのクラスを指定すると、文脈に応じた認識精度が向上します。 - 「読み」はふりがなではなく“どう読むか”を意識
「洗濯機」という単語、「せんたくき」と読む方もいれば「せんたっき」と読む方もいると思いますが、もしも「せんたっき」と読むのなら読みは「せんたっき」と登録する方が好ましいです。両方を登録してもいいでしょう。
ユースケース
まとめとして、2つの方法のユースケースをご紹介します。特に、単語登録APIでは複数辞書が作成できるので、より柔軟で機能性の高いアプリを開発することが可能です。
目的に合わせて、最適な方法を選択いただければと思います。
- マイページからの単語登録
- 非エンジニアが操作をするとき
音声認識アプリやサービスを運用しているものの、単語登録機能までは組み込んでいないケースでは、マイページからの登録が便利です。
例えば、専門用語や固有名詞を追加したいとなった際、現場の運用担当者(非エンジニア)が開発者を介さずGUIで簡単に単語登録ができます。 - 開発・検証フェーズでの動作確認
API連携を実装する前に、まずは管理画面で単語登録を試し、認識精度の変化を確認することで、導入判断や辞書設計の参考になります。
- 非エンジニアが操作をするとき
- 単語登録API
- アプリケーションのユーザーごとに自由に単語登録できるように設計する
- ボイスボットサービスで、シーンごとに単語登録しておき、誤認識を避ける
- コールセンターの部署ごとに異なる辞書を管理する
利用シーンやユーザーの業務によって、発話される固有名詞・専門用語が異なることがあるでしょう。その場合は、単語登録APIを活用して複数の辞書を作成し、使い分けられるようにしておくと良いと思います。
さいごに
単語登録APIを使えば、あなたのアプリやサービスに柔軟な単語登録機能を組み込むことができます!「もっと認識精度を上げたい」「ユーザーごとに辞書を分けたい」そんなニーズにぴったりです。
詳しい使い方は、以下のドキュメントをご覧ください。
ユーザー単語登録API | AmiVoice Cloud Platform
ここまでご覧いただき、ありがとうございました!
この記事を書いた人
-

クワノキ
新卒でアドバンスト・メディアに入社。もともと「音声」に興味があり、大学でも音声知覚について学んでいました。趣味はラジオ、声劇、演劇、映画鑑賞など。最近は、観劇のために遠出することも厭わなくなってきました。
