フィラーの自動削除
ここでは、フィラーの自動削除とその抑制方法について学びます。
1. フィラーの入った音声を認識する
filler.wavは、以下のようにフィラーが含まれた音声データです。
えーっと、会議があるので、えー、それまでに、あのー、資料を作成しておきます。
まずは、必須パラメータのみで音声認識を実行し、どのような音声認識結果が返ってくるか確認します。使用するインターフェースは、同期・非同期どちらでも構いません。
リクエストの条件
音声認識エンジン:日本語・会話_汎用
使用する音声ファイル:filler.wav
リクエストと音声認識結果例
同期HTTPインターフェース リクエスト
Linux・Mac
curl https://acp-api.amivoice.com/v1/recognize \
-F u=$APP_KEY \
-F d=-a-general \
-F a=@filler.wav
Windows
curl https://acp-api.amivoice.com/v1/recognize -F u=%APP_KEY% -F d=-a-general -F a=@filler.wav
非同期HTTPインターフェース リクエスト
Linux・Mac
curl https://acp-api-async.amivoice.com/v1/recognitions \
-F u=$APP_KEY \
-F d=-a-general \
-F a=@filler.wav
curl -H "Authorization: Bearer $APP_KEY" \
https://acp-api-async.amivoice.com/v1/recognitions/{セッションID}
Windows
curl https://acp-api-async.amivoice.com/v1/recognitions -F u=%APP_KEY% -F d=-a-general -F a=@filler.wav
curl -H "Authorization: Bearer %APP_KEY%" https://acp-api-async.amivoice.com/v1/recognitions/{セッションID}
音声認識結果
フィラー部分が自動で削除されています。
会議があるのでそれまでに資料を作成しておきます。
2. フィラーの自動削除を無効にする
フィラーの自動削除を無効にするパラメータを設定して音声認識を実行し、どのような音声認識結果が返ってくるか確認します。
リクエストの条件
音声認識エンジン:日本語・会話_汎用
使用する音声ファイル:filler.wav
フィラー単語の自動削除の抑制についてはこちらを参照してください。
リクエストと音声認識結果例
フィラーの自動削除を抑制する場合は、keepFillerToken=1を設定します。
同期HTTPインターフェース リクエスト
Linux・Mac
curl https://acp-api.amivoice.com/v1/recognize \
-F u=$APP_KEY \
-F d="grammarFileNames=-a-general keepFillerToken=1" \
-F a=@filler.wav
Windows
curl https://acp-api.amivoice.com/v1/recognize -F u=%APP_KEY% -F d="grammarFileNames=-a-general keepFillerToken=1" -F a=@filler.wav
非同期HTTPインターフェース リクエスト
Linux・Mac
curl https://acp-api-async.amivoice.com/v1/recognitions \
-F u=$APP_KEY \
-F d="grammarFileNames=-a-general keepFillerToken=1" \
-F a=@filler.wav
curl -H "Authorization: Bearer $APP_KEY" \
https://acp-api-async.amivoice.com/v1/recognitions/{セッションID}
Windows
curl https://acp-api-async.amivoice.com/v1/recognitions -F u=%APP_KEY% -F d="grammarFileNames=-a-general keepFillerToken=1" -F a=@filler.wav
curl -H "Authorization: Bearer %APP_KEY%" https://acp-api-async.amivoice.com/v1/recognitions/{セッションID}
音声認識結果
フィラー部分は削除されません。前後に%が付いているため、どの単語がフィラーか判別できるようになっています。
%えーっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。