Tech Blog
  • HOME
  • Blog
  • 【小ネタ】最速!?音声認識の体感速度を上げる裏技!!

【小ネタ】最速!?音声認識の体感速度を上げる裏技!!

公開日:2022.03.28 最終更新日:2024.03.22

ワオキツネザルワオキツネザル

こんにちは!TECHブログお笑い担当のワオキツネザルです。

私の発信が一人でも多くの方の役に立ったらなと思ってます。

この記事を書こうとしたきっかけ

こんなようなことがありました。(脚色あり)

U-イベント解説漫画

解説

メガネザル先輩が言っているUイベントとはなんなのでしょうか。

公式マニュアルに書いてある情報をコピペします。

U イベントパケット

サーバ内で検出した発話区間に対する認識処理中に、認識途中結果を知らせるために、サーバからクライアントに向けて送信されます。

U イベントパケット – AmiVoice Cloud Platform

難しいので要約すると、Uイベントとは「認識途中の音声認識の結果」です。

こちらを出せば、体感早く感じることができます。

上が結果だけ出したバージョンで、下がUイベントを出力しているバージョンです。

Uイベントを出力しているバージョン

いかがでしょうか。

認識途中の結果をピコピコ出すとリアルタイムで音声認識している感が出てくると思います。

小細工と思いきや、出すのと出さないのとではアプリの評価が変わってきます。

音声認識でしゃべっている最中に、処理の進行度が見れるので体感の待っている感覚が薄れるのかもしれません。

お客さんに出すアプリで音声認識を使うときはUイベントを使っていきましょう

注意

こちらのテクニックによって最終的な音声認識結果が早くなるわけではありません。

あくまで体感早く感じるという感性の問題です。

まとめ

resultupdate(認識途中の結果)を出すと早く見える気がする

みんなも使ってみよう!

この記事を書いた人

    • ワオキツネザル

      そろそろ新卒を名乗れないのでは?と思い始めた開発の人。ネットの中だけではワオキツネザルの皮を被って新卒と主張し続けます。
      アイコンだけは自分で描いてます。

この記事のマンガを描いた人

  • 星BANされた宇宙子

    絵を描いている人。

APIを無料で利用開始