Tech Blog
-
2026.06.01音声認識API「AmiVoice API」を使ってみよう
ソフトウェア開発のための音声認識APIであるAmiVoiceAPIを使い、音声認識を使ってみる方法について説明します。サンプルプログラムを使って実際に自分の音声で認識結果を表示してみるところまでの手順をまとめました。
-
2026.05.26リアルタイムアプリケーションでレスポンス時間を調整する方法
「音声認識の待ち時間をもっと短くしたい」―そんな場面で役立つのが、AmiVoice APIの認識時間制御パラメータです。本記事では、5つの時間制御パラメータを中心に、アプリケーションでの実装における音声認識の「精度」と「レスポンス速度」のバランスの考え方を解説。リアルタイム認識とバッチ処理の違いや、雑音・低音量音声への影響、生成AI連携時の実践的なチューニング方法まで、開発者視点で詳しく解説します。
-
2026.05.11Zenn Spring 2026、クーポン利用の方法について
こんにちは!今回は現在アドバンスト・メディアがZennで行っているキャンペーンで利用できる音声認識APIサービス「AmiVoice API」の無料利用クーポンの使い方についてご説明します。
-
2026.04.24運用データで見る「発話区間割合」
「音声認識の費用、実際どのくらいかかるの?」——発話区間のみに課金されるAmiVoice APIのコストをなるべく正確に把握するには、実際の「発話割合」を知ることが重要です。本記事では実運用データをもとに「発話区間割合」の分布を分析。コールセンター、スマホアプリ、会議録音など利用形態ごとの目安を具体的な数値で紹介します。導入前の費用試算にぜひお役立てください。
-
2026.03.27AmiVoice API アップデート解説 ボイスボット向け新パラメータで応答待ち時間を短縮
お客様の声からできた、AmiVoice API の新パラメータ「recognitionTimeout」と「noInputTimeout」をご存知でしょうか。これらを活用することで、不要な音声データの処理の打ち切りや、無発話時の待機時間の制御が可能になり、ボイスボットの応答品質を大きく改善できます。各パラメータの動きや具体的な使い方を解説します。
-
2026.02.19AmiVoice APIアップデート解説 End-to-End対応の「単語強調」機能
End-to-End音声認識で利用可能になった「単語強調」の仕組みと実践的な使い方を解説。ハイブリッド型との挙動差、設定パラメータの勘所、精度向上のためのTIPSまで、E2Eをもっと使いこなしたい方必見のアップデート内容がまとまっています。
-
2026.01.30動画に字幕を簡単合成!音声認識APIで作る字幕ワークフロー
動画に字幕を手軽に追加したい方必見!音声抽出から字幕合成、視聴までをわずか4ステップで効率よく実現する方法を紹介します。実際の総理大臣会見を題材に、音声認識APIを活用した字幕生成の流れを丁寧に解説します。
-
2026.01.16AmiVoiceの単語登録APIで音声認識をもっと自由に!
AmiVoiceAPIの特長の一つである「単語登録機能」。この機能のAPIがあるのをご存じでしたか?単語登録APIによってアプリへの組み込みや複数のプロファイル(辞書)管理など柔軟な単語登録が可能になります。記事では単語登録APIの使い方と便利な活用シーンをわかりやすくご紹介しています。
-
2025.12.22Dify × AmiVoice API で音声認識アプリを手軽に開発しよう
ローコード環境Difyを使って複雑なコード不要で、効率的に音声認識アプリを実装してみませんか?「AmiVoice API」を使って長時間音声の認識やSlack通知、LLM連携まで直感的に構築する方法をお伝えします。開発者ではない方にも参考にしていただける内容です。
-
2025.12.01発話区間検出ってなんぞや?!
「人が話しているところ」だけを見つける「発話区間検出」という仕組みをご存じですか?雑音や保留音を除外し、認識精度を高めるだけでなく「話している時間だけ課金」というメリットもあります。音声認識サービス選びの新しい視点を、わかりやすく解説します。
-
2025.10.28AWSでサーバーレスなWebアプリを作ってみた話
サーバーレスに憧れたAWSインフラ担当者が、AWSサービス、Vue3、社内GPTを駆使してログイン機能付きWebアプリを構築。ランニング費月額3円という低コストを実現。レガシー構成との比較や実際の費用も公開し、サーバーレスの魅力と課題をリアルに描いた実践記です。
