Blog - AmiVoice Cloud Platform

2023.08.30

音声認識入門

ハイブリッド型音声認識とEnd-to-End音声認識の違いと特徴

ハイブリッド型音声認識とEnd-to-End音声認識の違いや特徴について解説します。また、それぞれの特徴をふまえてアドバンスト・メディアで採用している方式について説明します。

2023.07.31

AmiVoiceAPIの使い方

精度検証付き！特定用途に特化した音声認識エンジンのご紹介

AmiVoice API Privateにて提供している、人名や住所などに特化した音声認識エンジンについてご紹介します。汎用エンジンと精度を比較した検証も行いました。

2023.07.10

AmiVoiceAPIの使い方

AmiVoice API Private・SDKの「ルールグラマ」認識とは？

AmiVoice API Privateで提供している音声認識エンジン「ルールグラマ」について、通常のディクテーション認識との違いや、適した利用シーン、使用するメリット・デメリットなどを解説します。

2023.06.26

比較・検証

"会議"の音声でOpenAIのWhisperとAmiVoiceの音声認識率を比較してみた

会議の音声をOpenAIのWhisperとAmiVoiceで音声認識して、それぞれの音声認識精度を比べました。結果としてはAmiVoiceの方が誤認識が大幅に少なく高精度でした。Whisperの誤認識の例など出しながらこの差の要因について解説します。

2023.05.29

開発してみた

Windowsアプリにマイク録音を実装してみた。音声認識アプリ開発の第一歩！

C#を用いてWindowsアプリでマイク録音を実装します。録音した音声をAmiVoice APIを使用して音声認識を行い、ストリーミング処理で認識内容を表示する方法について解説します。

2023.05.15

AmiVoiceAPIの使い方

AmiVoice APIで不要語（フィラー）を表示するか除去するか選ぶ方法

AmiVoiceAPIには不要語（フィラー）を自動的に除去する機能があります。しかし音声認識を使う場面によってはフィラーを除去せず表示した方がいいこともあります。今回はフィラーの除去を制御するやり方について解説します。

2023.04.17

AmiVoiceAPIの使い方

ステレオ音声ファイルをモノラル音声ファイル×2に変換するやり方

AmiVoice APIはステレオの音声ファイルを音声認識させると片方のチャネルしか認識されない仕様になっています。ステレオ音声ファイルの右チャンネルと左チャンネルに異なる音が入っている場合を想定して、今回はSoXというツールを使ったステレオ音声ファイルをモノラル音声ファイルx2に変換する方法について説明します。