Tech Blog
-
2023.01.16
コンタクトセンターの通話を音声認識で文字化する仕組み SIP編
コンタクトセンターで音声認識を活用し、通話を自動で文字化する仕組みをご紹介します。SIPプロトコルを利用して通話の音声を取得する方法です。
-
2022.12.20
【中級者向け】AmiVoice の単語の読みの自動変換について
日本語では「先生(せんせい)」を時として「せんせー」と発音するケースがあるように、読み仮名と実際の発音が少し変化することがあります。AmiVoiceではその変化に対応するために指定された読みを自動的に変化させていますが、読みを厳密に指定したい時には少しコツが必要になります。今回はその読みの指定について詳細に説明をします。
-
2022.11.29
音声認識に必要なサンプリングレートはどのくらいか?
音声認識をする時の最適なサンプリングレートの解説をします。また、AmiVoice APIでのサンプリングレートの扱いについても細かく解説します。
-
2022.11.24
NPCの実現間近!?VRChat 向け音声対話アバター「AIアバターAOI」開発者インタビュー
メタバース空間上での対応を自動化する音声対話アバター「AIアバターAOI」の開発者インタビューです。NPC(ノンプレイヤーキャラクター)が実現するかも!と各所で話題になりました。
-
2022.10.31
AmiVoice APIの単語登録機能で選択可能な「クラス」の解説(汎用エンジン)
AmiVoiceの単語登録では「クラス」を指定することで、より適切な音声認識が出来るようになります。今回はAmiVoice APIで最もよく使われている汎用エンジンの「会話_汎用」と「音声入力_汎用」の2つのエンジンについてどのようなクラスを指定できるかを解説します。
-
2022.10.18
【RPA】請求書PDFをPADでテキスト化。JavaScriptと正規表現のハマりポイントも回避。
PADで請求書PDFをテキスト化する方法と、JavaScriptを実行する時のハマりポイントを紹介します!
-
2022.09.30
【Swift】AmiVoice APIとAlamofireでつくる感情分析アプリ
AmiVoice APIを利用して感情分析と音声認識ができるiOSアプリの作り方についてご紹介します。
-
2022.08.29
【OBS】リアルタイム字幕配信の遅延対策してみた時の話
OBSにリアルタイム字幕を付けるためのプラグインをオンラインセミナーでの利用を想定して実際に使ってみたので、どんな感じに仕上がったのかを紹介したいと思います。
-
2022.08.16
AmiVoiceのテレビCMでテックブログのアクセスは増えたのか?
2021年11月末頃にAmiVoiceのテレビCMが放送されました(知ってました?)。テレビCMが放送されるとテックブログのアクセスにどのような影響があるのか調べてみました。
-
2022.07.27
音声認識API 「AmiVoice API」を使ってみよう
ソフトウェア開発のための音声認識APIであるAmiVoiceAPIを使い、音声認識を使ってみる方法について説明します。サンプルプログラムを使って実際に自分の音声で認識結果を表示してみるところまでの手順をまとめました。
-
2022.07.26
7/28(水)、オンラインセミナー「『声に隠れた感情』を可視化する~感情解析活用シーンと音声認識技術の選び方~」を開催
7月28日(水)、AmiVoice Cloud Platform主催のウェビナー 「『声に隠れた感情』を可視化する~感情解析活用シーンと音声認識技術の選び方~」を開催します。
-
2022.07.19
Pythonでマイク入力の音声認識してみた
pythonで音声認識をする方法を記述しました。gitからソースを持ってきて起動できるような簡単なものです。AmiVoiceとpyaudioを使用しています。