Easily develop speech recognition apps with Dify x AmiVoice API


Hello. I'm Rookie from the AmiVoiceAPI development team.
This may be a bit sudden, but do you use any no-code/low-code platforms in your work?
What is a no-code/low-code platform?
A no-code/low-code platform is a development tool that allows you to create apps and systems without any programming knowledge.
By simply using drag-and-drop and templates, you can quickly create business applications and web services. This is extremely useful for resolving the engineer shortage and improving work efficiency.
In this article, we will explain how to efficiently recognize long audio files using the Asynchronous v2 of the AmiVoice API.
When using the AmiVoice API Asynchronous v2 to recognize large audio files, from the perspective of low-code platform developers and users, using a low-code platform offers the following advantages:
For developers,
- By simply combining components on the low-code platform, you can easily integrate AmiVoice's speech recognition capabilities into your workflow.
- AmiVoice API is easy to use, and the speech recognition function of AmiVoice API can be used easily without complex implementation, significantly reducing the hurdles to implementation and operation.
- Configuration is simple as the necessary parameters are made public. Once the developer publishes the parameters required for recognition, users can start using the service by simply entering the minimum parameters required for authentication.
For users,
- Simply call the workflow URL of the low-code platform and it can be used on both PC and smartphone.
- Preparation is easy, just save the audio file to cloud storage.
For example, if you are having trouble processing large amounts of audio data, how about this solution?

Designing workflows with the low-code platform Dify
The low-code platform Dify is a platform that allows users to create applications even without specialized programming knowledge.
It is a development support platform that enables you to quickly build advanced AI applications and business tools.
It has an intuitive UI that allows you to visually configure the following settings:
- API integration
- Workflow automation
- Data management
This can significantly improve development efficiency.
How to connect Dify with AmiVoice API
The advantage of Dify is that you can freely combine functional parts called blocks to create a "workflow" that suits your business and its purpose. Below is a diagram showing some of Dify's most common blocks and their purpose categories.
| Block | Application categories |
|---|---|
| Plug-ins (external service integration) | Slack: Webhook, Google Drive:datasource |
| LLM | AI processing system: LLM call |
| Knowledge Search | AI processing system: information search, knowledge exploration |
| Logic | Conditional and control: IF/ELSE, iteration, loop |
| HTTP request | External service integration: API |
| Plug-ins (file operations) | File Tools: Save As File |
| Code execution | Program code execution: Python/Javascript |
In Dify, these blocks are connected with lines on the workflow screen, and data is passed along as processing progresses.
The main blocks used in this article are shown below. The speech recognition workflow is realized by connecting these seven "blocks" with "lines." Each plugin can be obtained from the Dify Marketplace.

- HTTP request: Speech recognition processing with AmiVoice API
- JSON: JSON Process Plugin
- Social media integration: Slack plugin
- Code execution: Python code
- File operations: File Tools plugin
- Logic: IF/ELSE
- LLM: Text to HTML
Advance preparation
These are items that must be prepared outside of Dify. If you use email instead of Slack, you can change the items you need to prepare.
1. AmiVoice API authentication application key
→ Used for HTTP requests in developer flows.
2. Result acquisition notification destination: Slack WEBHOOK_URL
→ Incorporate it into the external service integration of the developer flow.
With all of this in place, users can perform speech recognition tasks with a single click in the Verify flow.

In Dify's workflow, you upload the audio file to be recognized locally, and then orchestrate it on Dify's low-code platform to easily obtain the session ID result. In this case, Slack is used as a notification method to inform the user of the result.
Of course, by taking advantage of the characteristics of low-code platforms, you can also store files on Google Drive or OneDrive and add work units for each Drive to your workflow to share (exchange) data.
What will be notified to speech recognition users via Slack?
Once speech recognition begins, users will receive a message in Slack similar to the one below.

Users who receive this notification can access the URL in the message and enter the obtained session ID to obtain the text of the speech recognition results. If the processing is not yet complete due to reasons such as the audio file being large, a "Processing" response will be returned, so users should wait a while and access the URL again.

Dify Implementation - Creating a Workflow -
Now it's time to become a developer and create a workflow for Dify. Below is the workflow to be created.
All you have to do is follow the wizard and enter the information you prepared in advance, but I'll explain it a little bit.
Workflow 1 - Start speech recognition
Send the target file to AmiVoice to start speech recognition.
START (File selection):
This block inputs the audio file to be recognized. The type of speech recognition to be used is also set here.
First, the developer obtains the app_key for speech recognition from the AmiVoice Cloud Platform and prepares the slack_api for notifications in advance.
On the other hand, what the user needs to do is very simple; they just need to prepare the audio file they want to recognize and the type of AmiVoice API engine they want to use.
HTTP REQUEST (HTTP request):
Use the HTTP node to send a speech recognition request to the AmiVoice API. Refer to the AmiVoice API user manual and enter the required parameters specified in the CURL command directly into the HTTP card. For example, in the following CURL command:
curl https://acp-api-async.amivoice.com/v2/recognitions \
-F u={APP_KEY} \
-F d="grammarFileNames=-a-general" \
-F a=@test.wavEnter the three key parameters u, d, and a in the CURL command into the body of the HTTP card.
Select POST as the method and specify the variables inside Define.

GET FILENAME (Code Execution):
The name of the uploaded audio file can be obtained using a simple function:

JSON Decoding (JSON Process):
The response from the AmiVoice API is a string containing the session ID in JSON format, so we will place it here to decode it.

SLACK:
Use the slack_url you set up beforehand as the destination. Send the session ID and the name of the audio file used for speech recognition as a message.

The overall flow diagram is as follows:

Workflow 2 - Obtaining text from speech recognition results
The recognition result text is obtained based on the session ID.
START (user input):
Developers must set an app_key in advance to be used for authentication of the AmiVoice API.
All the user needs to do is obtain the recognition result based on the session ID sent to Slack.
HTTP REQUEST (HTTP request):
You can get the recognition results by sending a request to the specified endpoint using the HTTP GET method along with the session ID.

IF / ELSE (logic):
Depending on the returned status code, the workflow will let you know whether it is processing or not, and once processing is complete, a downloadable txt file of the recognition results will be generated.

SAVE AS FILE (File Tools):
The acquired text is saved as a file. It contains not only the speech recognition string but also meta information such as the time of speech.

Furthermore, the resulting text can be fed directly into the "useful cards" in Dify's low-code environment, allowing it to be flexibly incorporated into a variety of applications, such as automatic summarization, entity extraction, and monitoring report generation.
The overall flow diagram is as follows:



Application -Attaching LLM to the flow-
Dify comes with a number of "convenient cards" that can be used for business by default.
I'll try using the hottest card right now, "LLM".
By directly passing the recognized text to the LLM node, it is possible to automate summary generation and content analysis, which is expected to significantly improve the efficiency of organizing meeting minutes and generating business reports.
Below are the audio files used and the recognition results.
Audio used:
Audio data (limited distribution until the minutes are released) | Ministry of the Environment
Recognized text files
時代においては、このあり方も見直すべきですので、引き続き、アスベスト被害者救済の観点から議論を開始すべきです。もう一点、事務局が頑なに後ろ向きな姿勢を示している。患者家族への患者団体支援団体に関する情報提供に関してですが、制度利用アンケートでも、患者のネットワークに関する情報提供について一定の要望がでているにも関わらず、環境再生保全機構や労働基準監督者から監督署から直接の情報提供を検討しようとしない姿勢は理解に苦しみます。理解に苦しむと報告には書いてください。この点、神奈川県の中沢委員からもご意見を伺いたいと思います。神奈川県は県のホームページに、私どもの会をきちんと案内してくださっています。先月、先日3月28日に閣議決定された第4期がん対策推進基本計画でも、国は相談支援の一層の充実を図るため、患者団体社会人人材リソースを活用するとの方針が示されています。環境省はもちろんですが、環境最善保険機構と患者団体がより一層連携して、情報提供のあり方患者団体等への支援を検討することも必要ですので、記載していただきたいと思っております。以上でございます。この点に関して他にご意見ございますでしょうか?浅野先生、岸本ですどうぞ、木本先生失礼いたします。石綿関連疾患に関しましてはですね、ある一定のやはりあの診断基準という認定基準というのがございますので、医学的な資料をやはり提出していただかないと、死亡診断書だけをそれを丸呑みにするというのはやはり日本においてのこういう制度の根幹に私は変わっ変わると思いますので、我々日夜一生懸命努力をしておりますので、胸部レントゲン画像だとか病理組織、そういうものを出していただいて、それに合致したものは認定をするという。あの現行の制度というのは私は非常に重要だというふうに思っております。それから厚労省の方がんセンターがですね、がん対策基本法の改定をされて新しい案がでておりまして、がん拠点病院には患者相談センターなるものができますし、ピアサポート活動というのも今がん患者さんを中心としてですね、かなり全国で広がってきております。ですから中止の患者さんもこういうがん相談センターやピアサポートセンターとコラボレートしてですね、より良い治療をより良い生活のためのtoorの勉強をされたらいいというふうに思います。以上です。はい。ありがとうございました。他にございませんでしょうか?小菅委員、さらにご発言ご希望でしたらどうぞ。ありがとうございます。先ほどのご意見に対してですけれども、労災では子音と暴露歴で認定することもありますので一言申し上げさせていただきます。よろしゅうございましょうか他にございますか。労災の場合は労働災害であるという勤務歴日のあの確たるデータがあるということがかなり大きなの特徴ですよね。そのことはあの、事務局の整理中にもありましてそれがない方がかなり多数に上る。こちらの制度のガードの違いということがあるというのが事務局の考え方だと思いますので、労災との関係についてもちろん全く切り離してということではない部分がありますから関連性については十分考えなきゃいけない面がありますけれども、この制度自体は直ちに労災救済と全く同じということにはなりにくいというのが一応今のところの整理になっていますから、それも踏まえた上で、ご意見をどのように報告書にまとめるかということについては検討させていただきたいと思います。他の先生方から何かご発言ございますでしょうか?岸本先生に対してちょっと一言お尋ねしたいことがございます。はい。先ほどの発言に対してなんですけれども岸本先生はがん相談センターに紹介されておられますでしょうか?どういうご趣旨ですかはいよくわかりませんが私は今臨床医をしてませんので外来でがん患者さんを見ていませんのでそういう方がいらっしゃったらそういう相談センターに紹介したいと思ってます以上です。よろしいですね。はいそれに対してはですね、10%しか含嗽相談センターに紹介されていないということでございますのでちょっとあの質問させていただいたところでございました。他にございますかよろしゅうございましょうか?はい。それでは次のテーマにとりあえず移らせていただきます。健康管理についてということでございますこの点についてはいかがでございましょうか?8ページでございますね。の部分ですいかがですか。この点については特に高田委員どうぞお願いいたします。高田委員どうぞご発言ください。方でございますご指名いただきましてありがとうございます。どうぞどうぞ。はい。あの健康管理についてですね指摘された論点および今後の方向性に書かれておりますように、この石綿読影の精度確保確保等に関する検討会で健康管理のあり方について、引き続き必要な検討を行うべきであると書かれておりますが非常に重要なことだと思っております。今対策型の検診で胸部レントゲンを用いて行われておりますけれども、さらにですね、ここから精度を高めていってですねいくっていうことは必要なことだと思いますのでぜひ進めていただきたいと思いますよろしくお願いいたします。はい。ありがとうございました。柘植委員どうぞはいありがとうございますまず治療研究の問題についてちょっとあの発言させていただきます。治療研究については次のテーマに申し訳ございませんでした。健康管理に関すること、はい。そうですそうなさい。はい申し訳ございません。この件につきましては、石綿に曝露した建設作業等に従事した1人親方自営業者等の健康管理は、厚労省の石綿健康管理制度、環境省が実施している健診制度のいずれでもカバーされておりません。尼崎市など9市調査実施地域以外の非職業性暴露者も同様でございます。このような方々の健康管理をどうしていくのか、厚労省と連携して議論を開始すべきですので、そのように記載していただくようにお願いしたいと思っております。はいご要望として承りましたどのように手術かまた事務局と相談いたします。他にございませんでしょうか?よろしゅうございますか。それでは、最後になりますが調査研究ですね。どうぞ小菅委員、お願いいたします。はい。それでは治療研究の問題についてちょっと発言させていただきます。はいどうぞ。この問題については、小委員会の議論の日、主要なテーマでしたので、調査研究の中の一部のように記載される話ではないと思うのです。3月17日の参議院環境委員会でも、西村環境大臣は、中皮腫なる治る病気にしたいということは、私個人としても大変強く思っているところですと表明されております。治療研究を項目として設定し、注意書を治せる病気にしていく姿勢を明確にすべきです。その上で、ヒアリングで挙げられた治療研究の現状と課題3億円程度の追加的な予算で状況は変えられるということについて確認されたので、木瀬記載すべきです。現在、基金へ拠出していただいている企業の皆様から、あと100円ずつのご協力をいただければ可能であることを、先日の参議院環境委員会でも指摘されているものですので、記載しをお願いしたいと思います。本小委員会ではでは治療研究に関して、大塚委員から研究開発に充てていくことが望ましいという話をしまして、今でもそう思って思ってます。最終的には国会が決めることになりますので改正をすれば、研究開発のように充てるということも不可能ではない。将来的な道というのは、さらに後ご検討いただければありがたい。とのご意見があったので、必ず記載してください。また、岩村委員から治療研究に関しては、費用負担のあり方も含めて別途議論する必要が、議論を進める必要があるのかなというふうに考えてございますとのご意見がありましたので、これも必ず記載お願いいたします。岸本委員からも、中皮腫に対する国の研究費を新たに設立して、それでやっていけばいいのではないかなというふうに思いますとのご意見がありましたので、必ず記載してください。中沢委員からも、基金の性格から考えると、基金の外で考える方がより研究開発に資することができるのであるならば、そういう可能性があるのならばそういうことを検討するということも必要なのではないかというふうに考えますとも意見がありましたので、必ず記載してください。報告書案の9ページの26、6行目からの記載では、環境省の姿勢が消極的に移りますので、治療研究の重要性について、厚生労働省等の関係省庁と必要な連携を加速すべきであると記載していただくようにお願いいたします。なお、昨年10月21日の以上関係者からのヒアリングで提案のあった一部の胸膜中皮腫なし胸膜中皮腫にしか使用が認められていない。オプジーボと野暮医の2剤併用療法について関係会社で、関係会社である小野薬品工業は、適用拡大のための臨床試験に当たって、日産の試験所恐縮一切の基金拠出はしないと判断したと問う方の関係者から伺っております。現行の労災科研費とメイドの2000万円程度の支援の枠組みでは、2億円程度の費用が必要な医師主導治験は実施できませんので、これらの事実もご記載いただきまして、現行の支援の枠組みでは5.9以上がなる病気にはならないと記載してください。38行目の記載は終始、中皮腫を治せる病気にするためゲノム情報の収集活用も含めて、中皮腫登録の更なる充実について、関係する省庁独立行政法人、学会、医療機関と早急に必要な検討を行うべきであると記載していただくようにお願いいたします。なお、11行目から、基金の残高に関する記載がありますが、私達は基金の使途について運用益の活用を含めて、命の救済のために治療研究の支援に活用すべきであり、現行の基金は明らかに余裕があること第2回小委員会で事務局事務局が示した将来推計は、明らかに過大な見積もりであるとの意見は今でも変わっておりませんので、その点について記載をしてください。今回の資料にもありますが、昨年の認定件数を下回った状況があります。8%ずつ支出が増加し、増加していく推計とは全く異なります。以上でございます。他の委員のご発言を報告書の中に具体的にどこまで書き込むかということについてはもう少し検討する必要があろうかと思いますが、こういう趣旨のというぐらいのことはあるかもしれませんがそこもちょっと検討させていただきます。岩村委員どうぞお願いいたします。はい。ありがとうございます。調査研究についてご意見申し上げたいと思います。個別通のですね、石綿健康被害者の経済的な負担を軽減するという救済制度の目的のもとでですねこれまでも事業者はですね、これすべからくということでございますけれども、教室を継続してきたところでございますこうした資金をですね、拠出率と別の目的に支出するということは拠出し、拠出者としてですね、4人はできません。また基金のですね、人拡大を行うことで、個別の石綿健康被害Eの患者さんのですね。経済的負担軽減という本来の目的をですね果たせなくなるということになるとこれはちょっと本末転倒かなというふうに考えております。またですねこれ報告書案にですね記載がございますけれども、救済制度が安定的に運用されるとその必要があることはこれは当然でございますけれども、今後収支のですね推移を注視していく中でですね、余剰が生じるようであればですね、これは一般拠出率を下げるということが適切だというふうに考えてございます。ただ中小ですね治る病気とするってのはこれは重要な課題だろうということでございますのでこの点に関してですね、厚生労働省との連携であるとか抽出登録の拡充といった方向性が今回の報告書で示されておりますので、ここは私どもとしても賛成するところであります。環境省におかれましてはですね、今後こういった取り組みを着実に実行に移していただきたいというふうに思います。以上です。はいありがとうございました。他にございませんでしょうか?はい。岸本委員どうぞ。はい。我々はですね石綿関連疾患の認定業務にあたっております大林先生も協力していただいております。まだまだ肺がんの認定を含めてですね、抽出までですね、決定的な診断根拠というのがなかなか見つからないということでですね。我々の基準も変わってきております。最近ではバックは外務タップというような特別な遺伝子変異があれば、腫瘍性の胸膜肥厚がなくてもですね、これは中止として認めようということで我々も最先端の医学について行っているつもりでございますが、わからないところを調査するという、そういう調査研究費というのは1人でも多くの患者さんを認定する道に繋がると思いますので、これぜひ重要視していただきたいというふうに思っております。以上です。はい。ありがとうございました。他にご発言ございませんでしょうか?はいどうぞ。失礼いたしました。大林はい。よろしくお願いいたします。報告書案と直接関係していることではないんですけれども、ちょっと診断面のことで少し小委員会判定小委員会のことをご紹介しながらご説明をちょっとさせていただきたいと思います。はい。僕救済制度が始まった当初ですねこの抽出っていうのは非常に診断の難しい難易度の高い病気でございました。ここ数年ですね先ほど岸本先生からもご紹介ありましたようにバップはMタップと言った分子診断に基づく抗体ができまして診断精度が非常に上がっております。それとですね、セルブロックという手法ですね。胸水に溜まっている腫瘍細胞を固めてそれでもって免疫染色をして診断をするという方法これがですね、全国的に普及いたしました。この免疫染色ですとか、セルブロックを作るということは一気に広まったんですが、これには非常に大きなですね、おそらく環境省と厚労省の連携があったというふうに私はあの拝察しておりますという申しますのは明生塾っていうのはそもそもあの1種類400点、診療報酬で400点だったわけですねこれはもう病理学会としてはもう10年間のいくら要求してもそれ以上上がらなかった診療報酬だったわけです。ところがこの救済制度ができまして、病理の判定小委員会の方でどうしてもこれ4種類いるんだと、こういうことを強く要望いたしまして調査研究でもそのような結果が出ましてどうしてもこれは必要だということで診療報酬として4種類の免疫染色が1600点ついたという経緯がございます。それから、あせるブロックも診療報酬がつきました。この診療報酬がつくということはですね、医療関係者の方はよくご存知だと思うんですが、大変なことでございます。私達病理はですね、このことには非常に驚いたというところが正直なところでございまして、これは中種だけではなく、他のですね全ての悪性腫瘍を対象といたしまして4種類の免疫染色が承認されたような状況になったわけです。これはですね、私達病理診断を担当する者にとっては大変大きな進歩でございました。このことはぜひご理解いただきたいと思っております。判定小委員会はもうすぐ450回を迎えようとしております。私どもコロナの中でですね、リモートでバーチャルスライドにされた画像を見て診断をして参りましたこれは我々診断する側もですね、担当の環境省の担当の方も大変な努力といいますか、あの苦労をいたしまして進行しているというようなことでございますんで、もう一つですねぜひこれも知っていただきたいと思うのは、あの抽出っていうのは希少がんとして認められておりますので、現在ですね網羅的な遺伝子診断の対象になります。これは保険診療としてされるものです。このことをですね、意外と臨床の先生でご存知ない先生がおられます。これ押していただきますとですねその中種の遺伝的な細かいことがいろいろわかってまいりますそれによってですね、例えばそれが積み重なりますと創薬お薬を作るということにも結びつくわけでございます。もしもですねなかなかその可能性は低いわけですけれども、既に他の疾患で使っているお薬が、その方の遺伝子異常がそれと同じ遺伝子異常がその方にあった場合ですね、適応適用をですね広げるということも検討できるわけであって、やはりそういった今使われているいろいろなそのシステム制度をぜひフル活用して、やはりあの診療にも創薬にも一歩一歩進んでいきたいいただきたいというかいきたいというふうに思っております。以上でございます。はい。どうもありがとうございます。岡根委員の方からのご発言ございますでしょうか?小菅委員ご発言ご希望でしたらどうぞお願いします。はいありがとうございます。あの今後の拠出金率に関する議論をする場合には、必ず小委員会にを開催して議論をしていただくようにお願いしたいと思っております。はい。よろしゅうございましょうか?本日は事務局からたたき台が出されましてそれについていろいろとご意見いただきました。ご要望も承りましたがその全てを網羅することができるかどうか、ちょっとまたいろいろ考えなきゃいけないと思いますが、事務局にお願いしたいのは本日ご欠席の委員がいらっしゃいますので本日ご欠席の委員からも意見をしっかり聴取していただければと思います。よろしゅうございましょうか?お願いいたします。はいありがとうございます本日様々なされた意見ちょっとあの流れもありますけれどもどのように反映ができるか検討してまいりたいと思います委員長から御指摘のありました欠席の委員の先生方からのご意見というのもですねきちんと聴取をしてまいりたいと思います。ありがとうございます。はい。それではよろしゅうございましょうか他に続けたらよろしいでしょうか?はい、どうぞ。はい。本日は報告書案の取りまとめのための議論しておりますけれども、今回は1次答申であり、取りまとめの後、早急に議事答申の取りまとめについて、各論点の議論を開始すべきだと考えております。終わりでは、そのような記載をしていただくようにお願いいたします。先ほど触れましたが、がん対策基本計画では、国民本位のがん対策を推進するためには、国や地方公共団体と患者団体等の関係団体やがん患者を含めた国民が協力して取り組みを進めていくことが必要であります。また、その際には、多様な患者市民が参画できる仕組みを整備するとともに、患者市民参画に関わる啓発育成も併せて推進することが必要であると示されています。今後の議論、議論において、本委員会も多様な患者が参画できる仕組みを整備することを検討すべき旨の記載をするようにお願いいたします。また、これまでの議事録、配付資料関係委員などから提出された資料は、報告書の添付資料として一体のものとして完成させていただくようにお願いいたします。これは皆様のご意見を伺えればと思いますけれども、次回6月はリアルで開催するようにしてはどうかと思っておりますが、いかがでしょうか?他によろしゅうございましょうか?大林委員何かご発言ございますか。今、挙手上がっております忘れておりました。すいません失礼いたしました。次回の会議をどのような形で行うかということについても事務局と相談をした上で考えさせていただきます。それから参考資料としてどこまで載せるかということについてもですね、これもこれまでの答申の報告書のとの関係もございますので、少し検討させてください。他に特にご発言ご希望がないようでしたら、本日まだ予定の時間よりおはようございますが、これにて閉会ということでよろしゅうございましょうか?はい、ありがとうございますご要望いただきましたので、その点についてはどこまでの報告書の中に盛り込むかということについては検討させていただきたいと思います。事務局から何かございましたらどうぞお願いいたします。渡辺先生ありがとうございました。うん。次回の事務事務局の方から事務的な連絡をさせていただきます。次回の小委員会日程については現在調整中でございますので決まりましたら追ってご連絡をいたします。また本日の議事録につきましては、事務局で原案を作成し、委員の皆様にご確認いただいた後、環境省のホームページに掲載する予定ですので、よろしくお願いいたします。それまでの間につきましては本委員会の運営方針に基づき、会議の音声を環境省のホームページで掲載する予定でございます。それでは、以上で令和4年度第5回石綿健康被害救済小委員会を終了いたします。ありがとうございました。それでは皆さんどうもありがとうございました
By passing this speech recognition result along with the prompt to LLM, result analysis can be automatically generated from the LLM node in Dify.
LLM Prompt:"Please analyze and organize the speech recognition results and output them in HTML format. Do not output any unnecessary content."

This is the execution result. If you use generative AI on a daily basis, you probably have a general idea of what it looks like.

Conclusion
What did you think of creating a speech recognition workflow using a no-code tool?
This was my first attempt at speech recognition with Dify, and I was able to create something that was practical.
- I have an idea, but development is a pain
- I want to create a convenient tool to save time, but it's difficult to set up a platform.
I realized that this is truly recommended for those who think the same way.
So, if you have any questions about the workflow, please contact us and we'll work together.
We are also always looking for ideas for no-code apps.
AmiVoiceAPI has developed and released a new "Asynchronous API Version 2" that is suitable for large audio files.
Depending on the file, you can expect much faster processing, so please try it out. The manual is here.
In addition to the free tier of 60 minutes of audio per month, AmiVoiceAPI is currently running a limited-time campaign where you can use AmiVoice API for 1,000 hours free of charge.
Please take a look at our website when you have time.
Person who wrote this article

Rookie
I studied computer science at university, particularly image processing. I am currently working at a speech recognition company, where I am trying to catch up on cloud infrastructure and AI application technology.
Most viewed articles
- A quick explanation of how speech recognition works!
- Comparing the speech recognition rates of OpenAI's Whisper and AmiVoice for "conference" audio
- How to use the AmiVoice API free coupon
New articles
- How to use coupons for Zenn Spring 2026
- "Speech segment ratio" as seen in operational data
- AmiVoice API Update Explanation: New Parameters for Voicebots Reduce Response Wait Times
Category list
- Introduction to Speech Recognition (15)
- How to improve voice recognition accuracy (12)
- I tried developing it (27)
- How to use AmiVoiceAPI(27)
- Comparison and Verification (6)
- Others(10)
