ニュース
領域特化型エンジンに双方向型のディープラーニング技術「Bi-LSTM」を実装しました
2020.09.17
アップデート
双方向型のディープラーニング技術「Bi-LSTM(Bidirectional Long Short-Term Memory)」を、領域特化型のAmiVoice 音声認識APIに実装しました。
Bi-LSTMは、ディープラーニングの発展技術の一つです。従来の音声認識エンジンAmiVoiceに実装していた、リカレントニューラルネットワーク技術の「LSTM(Long Short-Term Memory)」は、過去の情報を加味しながら処理を行いますが、「Bi-LSTM」は未来の情報を予測し加える事で、双方向の時間軸から処理を行います。その為、更に高い認識率を実現する事が可能になりました。
「LSTM」を実装したこれまでの音声認識エンジンと比較し、リアルタイム認識で最大20%、バッチ認識で最大25%のエラー改善率となり、認識率が大幅に向上しました。
※汎用エンジンは4月1日にBi-LSTMを実装済みです。