音声認識処理後の音声データはどこへ行く?
ととのい侍
お初にお目にかかります。
営業社員のととのい侍です。
今回はAmiVoice APIで認識処理をした後の音声データの行方について解説していきます。AmiVoice APIの利用については下記記事からご確認ください。
AmiVoice Cloud Platform-Tech Blog
早速ですが、お客様との打ち合わせで
「認識処理した音声はその後どのように扱われるのか教えてください。」
「音声データには個人情報が入っているので、サービス上に残るのが不安です。」
という声をよくいただきます。
皆様、安心してください。
結論から申し上げると、AmiVoice APIで認識処理した音声は厳重に管理しています。
ご要望に応じて、よりセキュアに音声認識をすることも可能です。
これから詳しく解説していきます。
音声データの行方を左右するエンジン選択
AmiVoice APIではログあり、ログなしのプランを選択できます。
ここでの「ログ」とは音声データと認識結果のことを意味します。
このログあり、ログなしのエンジン選択によって、音声データの行方が左右されます。
それでは、双方の特徴について、解説していきます。
■ログあり
<概要>
当社への音声データと認識結果の提供に同意したことになります。ログをサービス品質改善のために利用させていただくことで、「ログなし」よりも低価格(税込99円~/1h)でご提供します。
<音声の行方>
認識処理後、AWS(国内リージョン)のストレージに一旦保管を行い、
最終的には当社のローカルストレージに移管します。その後ストレージからデータがランダムにピックアップされて、音声認識エンジンの学習に利用されます。
■ログなし
<概要>
音声データ及び認識結果が当社のサーバー内やストレージに保存されることは一切ありません。より厳重に音声認識を行いたい方向けのプランです。(税込158.4円~/1h)
<音声の行方>
送られてきた音声データがメモリ上のバッファから認識処理され、処理が進むのと同時進行でメモリ上のバッファから消えていきます。
一時的にもファイルになったり、人がアクセスができる状態にはなりません。
認識結果はメモリ上のテキストがそのままレスポンスとしてクライアント側に返却され、サーバー側で認識結果が保存されることはなく当社側も見ることができません。
補記
上記はWebSocket API、同期HTTP APIを利用した場合の内容です。
非同期HTTP APIを利用した場合はジョブ受付時から認識処理完了するまでの間、音声ファイルが一時的にストレージ上に保存されます。この音声ファイルは、認識処理完了時に即時自動削除されます。
また、認識結果は1週間、安全なストレージ上に暗号化されて保管されます。この間、認証を経たユーザー本人のみによる取得が可能です。保管期間の経過後は、取得の有無にかかわらず自動削除されます。
「ログあり」で保管されたデータは秘密情報として厳重に扱っています。サービス開始以来無事故で運用していますので、ご安心してご利用頂きたいです。
ログを残すことがNGである業界や企業もあるかと思いますが、その場合は「ログなし」をご選択ください。
また、ログありとログなしのエンジンではサーバーの接続先が異なりますので、エンドユーザー様ごとに自由に選択いただくことも可能です。
最後に
今回はAmiVoice APIで認識処理する音声データの行方について解説させていただきました。音声データの管理やセキュリティについての懸念は解決されましたでしょうか。
ログありとログなしについてはそれぞれのプライバシーポリシーに合わせて自由にご選択いただければと思います。
それでは、これにて御免。
この記事を書いた人
-
ととのい侍
新卒3年目の営業社員です。
毎週どこかのサウナ施設に出現します。
90℃でロウリュありのサウナ室が一番好きです。