フィラーの自動削除

ここでは、フィラーの自動削除とその抑制方法について学びます。

1. フィラーの入った音声を認識する

filler.wavは、以下のようにフィラーが含まれた音声データです。

えーっと、会議があるので、えー、それまでに、あのー、資料を作成しておきます。

まずは、必須パラメータのみで音声認識を実行し、どのような音声認識結果が返ってくるか確認します。使用するインターフェースは、同期・非同期どちらでも構いません。

リクエストの条件

音声認識エンジン:日本語・会話_汎用

使用する音声ファイル:filler.wav

リクエストと音声認識結果例

同期HTTPインターフェース リクエスト

Linux・Mac

curl https://acp-api.amivoice.com/v1/recognize \
-F u=$APP_KEY \
-F d=-a-general \
-F a=@filler.wav

Windows

curl https://acp-api.amivoice.com/v1/recognize -F u=%APP_KEY% -F d=-a-general -F a=@filler.wav

非同期HTTPインターフェース リクエスト

Linux・Mac

curl https://acp-api-async.amivoice.com/v1/recognitions \
-F u=$APP_KEY \
-F d=-a-general \
-F a=@filler.wav
curl -H "Authorization: Bearer $APP_KEY" \
https://acp-api-async.amivoice.com/v1/recognitions/{セッションID}

Windows

curl https://acp-api-async.amivoice.com/v1/recognitions -F u=%APP_KEY% -F d=-a-general -F a=@filler.wav
curl -H "Authorization: Bearer %APP_KEY%" https://acp-api-async.amivoice.com/v1/recognitions/{セッションID}

音声認識結果

フィラー部分が自動で削除されています。

会議があるのでそれまでに資料を作成しておきます。

2. フィラーの自動削除を無効にする

フィラーの自動削除を無効にするパラメータを設定して音声認識を実行し、どのような音声認識結果が返ってくるか確認します。

リクエストの条件

音声認識エンジン:日本語・会話_汎用

使用する音声ファイル:filler.wav

フィラー単語の自動削除の抑制についてはこちらを参照してください。
リクエストと音声認識結果例

フィラーの自動削除を抑制する場合は、keepFillerToken=1を設定します。

同期HTTPインターフェース リクエスト

Linux・Mac

curl https://acp-api.amivoice.com/v1/recognize \
-F u=$APP_KEY \
-F d="grammarFileNames=-a-general keepFillerToken=1" \
-F a=@filler.wav

Windows

curl https://acp-api.amivoice.com/v1/recognize -F u=%APP_KEY% -F d="grammarFileNames=-a-general keepFillerToken=1" -F a=@filler.wav

非同期HTTPインターフェース リクエスト

Linux・Mac

curl https://acp-api-async.amivoice.com/v1/recognitions \
-F u=$APP_KEY \
-F d="grammarFileNames=-a-general keepFillerToken=1" \
-F a=@filler.wav
curl -H "Authorization: Bearer $APP_KEY" \
https://acp-api-async.amivoice.com/v1/recognitions/{セッションID}

Windows

curl https://acp-api-async.amivoice.com/v1/recognitions -F u=%APP_KEY% -F d="grammarFileNames=-a-general keepFillerToken=1" -F a=@filler.wav
curl -H "Authorization: Bearer %APP_KEY%" https://acp-api-async.amivoice.com/v1/recognitions/{セッションID}

音声認識結果

フィラー部分は削除されません。前後に%が付いているため、どの単語がフィラーか判別できるようになっています。

%えーっと%会議があるので%えー%それまでに%あのー%資料を作成しておきます。