Tech Blog

2023.03.13
比較・検証

OpenAIのWhisperの音声認識率を計測してみた（AmiVoice VS Whisper）

2022年の9月にOpenAIからWhisperという音声認識エンジンが公開されました。このWhisperとAmiVoiceの音声認識精度を比較してみました。
2023.03.06
音声認識入門

音声認識の仕組みをざっくり解説！

どのように音声を文字にするのか音声認識の仕組みや種類、それぞれの特長や適切なエンジンの選び方を、音声認識の研究に携わっているエンジニアがざっくりと、かつ分かりやすく解説します。
2023.02.06
音声認識精度アップの方法

マイク選びが音声認識活用の決め手。マイク利用と発話のポイント

誤認識を防ぎ、認識率を上げるためには、音声認識に適したマイクを選ぶことが大切です。マイクの選び方や利用方法、発話のポイントについてご紹介します。
2023.01.16
音声認識入門

コンタクトセンターの通話を音声認識で文字化する仕組み SIP編

コンタクトセンターで音声認識を活用し、通話を自動で文字化する仕組みをご紹介します。SIPプロトコルを利用して通話の音声を取得する方法です。
2022.12.20
AmiVoiceAPIの使い方

【中級者向け】AmiVoice の単語の読みの自動変換について

日本語では「先生（せんせい）」を時として「せんせー」と発音するケースがあるように、読み仮名と実際の発音が少し変化することがあります。AmiVoiceではその変化に対応するために指定された読みを自動的に変化させていますが、読みを厳密に指定したい時には少しコツが必要になります。今回はその読みの指定について詳細に説明をします。
2022.11.29
音声認識入門

音声認識に必要なサンプリングレートはどのくらいか？

音声認識をする時の最適なサンプリングレートの解説をします。また、AmiVoice APIでのサンプリングレートの扱いについても細かく解説します。
2022.11.24
その他

NPCの実現間近！？VRChat 向け音声対話アバター「AIアバターAOI」開発者インタビュー

メタバース空間上での対応を自動化する音声対話アバター「AIアバターAOI」の開発者インタビューです。NPC（ノンプレイヤーキャラクター）が実現するかも！と各所で話題になりました。
2022.10.31
AmiVoiceAPIの使い方

AmiVoice APIの単語登録機能で選択可能な「クラス」の解説（汎用エンジン）

AmiVoiceの単語登録では「クラス」を指定することで、より適切な音声認識が出来るようになります。今回はAmiVoice APIで最もよく使われている汎用エンジンの「会話_汎用」と「音声入力_汎用」の２つのエンジンについてどのようなクラスを指定できるかを解説します。
2022.10.18
開発してみた

【RPA】請求書PDFをPADでテキスト化。JavaScriptと正規表現のハマりポイントも回避。

PADで請求書PDFをテキスト化する方法と、JavaScriptを実行する時のハマりポイントを紹介します！
2022.09.30
開発してみた

【Swift】AmiVoice APIとAlamofireでつくる感情分析アプリ

AmiVoice APIを利用して感情分析と音声認識ができるiOSアプリの作り方についてご紹介します。
2022.08.29
開発してみた

【OBS】リアルタイム字幕配信の遅延対策してみた時の話

OBSにリアルタイム字幕を付けるためのプラグインをオンラインセミナーでの利用を想定して実際に使ってみたので、どんな感じに仕上がったのかを紹介したいと思います。
2022.08.16
その他

AmiVoiceのテレビCMでテックブログのアクセスは増えたのか？

2021年11月末頃にAmiVoiceのテレビCMが放送されました（知ってました？）。テレビCMが放送されるとテックブログのアクセスにどのような影響があるのか調べてみました。

よく見られている記事

新着記事

カテゴリ一覧

アーカイブ

2026年
- 1月 (2)
- 2月 (1)
- 3月 (1)
- 4月 (1)
- 5月 (3)
- 6月 (2)
- 7月 (1)
2025年
- 1月 (1)
- 3月 (2)
- 5月 (1)
- 7月 (2)
- 8月 (1)
- 9月 (1)
- 10月 (1)
- 12月 (2)
2024年
- 1月 (1)
- 2月 (1)
- 3月 (1)
- 4月 (3)
- 6月 (1)
- 7月 (3)
- 8月 (1)
- 10月 (2)
- 12月 (1)
2023年
- 1月 (1)
- 2月 (1)
- 3月 (2)
- 4月 (2)
- 5月 (2)
- 6月 (1)
- 7月 (2)
- 8月 (1)
- 9月 (1)
- 10月 (1)
- 11月 (1)
- 12月 (1)
2022年
- 1月 (2)
- 2月 (3)
- 3月 (2)
- 4月 (2)
- 5月 (2)
- 6月 (2)
- 7月 (4)
- 8月 (2)
- 9月 (1)
- 10月 (2)
- 11月 (2)
- 12月 (1)
2021年
- 3月 (3)
- 4月 (3)
- 5月 (1)
- 6月 (2)
- 7月 (2)
- 8月 (3)
- 9月 (2)
- 10月 (3)
- 11月 (2)
- 12月 (3)

APIを無料で利用開始

認識精度を試す

エンジンは、まず最新のEnd to End をお試しください。医療、保険、金融などの業界専門のエンジンをご希望の場合はハイブリッドを選択し、言語モデル、音響モデルをお選びください。

エンジン

言語

言語モデル

音響モデル

例文が表示されます。

こちらはサンプルテキストです。ここに音声入力された文章が入ります。

残り 30秒

AmiVoice 音声認識デモ利用規約

お試しになりたい言語、言語モデル、音響モデルを選択し、「音声認識スタート」ボタンを押してお話しください。
ご自由にお話しいただくか、例文を読み上げると認識結果が表示されます。

※言語、言語モデル、音響モデルや用途を変更した場合は、新たに「音声認識スタート」ボタンを押してください。

注意事項