WebSocket音声認識APIは、WebSocket接続上に確立される双方向通信プロトコルです。

クライアント⇔サーバ間では継続的に、コマンドパケット、コマンド応答パケット、イベントパケットがやりとりされます。また、内部には、3個の並行した状態遷移系が存在します。音声供給に関する状態遷移系、発話区間検出に関する状態遷移系、音声認識処理に関する状態遷移系です。各遷移系はいくつかの状態を持ち、固有のトリガーにもとづいて状態遷移を繰り返します。

これらを理解すれば、クライアントアプリ用に提供しているWrpライブラリ(サンプルプログラムに同梱)を使用することなく、本APIを利用することも可能です。

接続先URL

ログ保存あり

wss://acp-api.amivoice.com/v1/

ログ保存なし

wss://acp-api.amivoice.com/v1/nolog/