2025年03月25日
Agoraの文字起こし機能の精度を検証してみる(在宅・カフェ店内・駅のホーム)
AIを活用したリアルタイム音声認識(Speech-to-Text: STT)は、カスタマーサポート、字幕生成、多言語会議、ライブ配信、通話記録、など多くのユースケースで活用されています。 そしてAgoraが提供するクラウドベースの文字起こし機能(Real-Time Speech to Text)も、低遅延かつ高精度なSTT機能を提供します。 Real-Time Speech to Textの公式ドキュメントこちら また、LLMを併用した応用的なアーキテクチャを構成する際にも、文字起こしの精度が非常に重要となります。 そこで本記事では、Agoraの文字起こしがどの程度の精度であるか、発話音声に対して意図的にノイズを混入させ、Agoraの文字起こし精度を確認していきます。
続きを読む
2025年02月25日
WebRTCの商用サービスまとめ|Amazon Chime, Agora, twilio, SkyWay など
(2025/2/25更新) LINEやSkypeなど、ビデオ通話サービスの浸透によって、遠方と顔を見てやりとりするのが一般的になっています。最近では5Gの登場によって、ますますこうしたサービスへの需要が高まってきました。 そこで注目されているのが、WebRTCというビデオ通話機能を簡単に開発できる技術です。WebRTCを利用して行えるサービスには、オンライン会議、ビデオ通話、音声通話、ライブ配信、カスタマーサポート、オンライン教育、遠隔医療、金融相談などの大規模なビジネス用途から、ライブコマース、オンラインクレーンゲーム、ボイスチャットアプリ、ライブチャット、マルチプレイヤーゲームなどのエンタメ・個人向けサービスまで、幅広いリアルタイムコミュニケーションが可能なサービスがあります。 この記事では上記のようなWebRTCを使って実現できることだけでなく、代表的なWebRTC用プラットフォームの商用サービスとそのメリットを含めてご紹介します。これから迎える5G通信時代、さらに活用機会が増えていく可能性の高いWebRTCを知って、ぜひ自社のサービス開発にお役立てください。
続きを読む
2025年02月02日
会話型AIとRTCを活用したリアルタイム・マルチモーダル・エージェントでIoTを革新する
「会話型 AI」がIoTの新たな可能性を切り開きます。最新の大規模言語モデル(LLM)を活用したマルチモーダル通信により、複雑なリクエストを理解し、自然な会話を行い、さらにはライブ映像を解析してアクションを実行することが可能になります。 Agora の 会話型 AI SDK は、自動化・通信・リアルタイムの意思決定 を進化させるのに重要な役割を担っています。 本記事では、こうした技術がさまざまな業界でどのように活用されているのか、注目の事例を詳しく紹介し、IoT の未来がどのように変わっていくのか を探ります。
続きを読む
2025年01月21日
超低遅延で自然な会話AIを簡単に実装!AgoraとRealtime APIでリアルタイムチャットを実現
OpenAIとの提携により、AgoraはOpenAI向けの新しい会話型AI SDKをリリースしました。 公式ドキュメント:Conversational AI powered by Agora and OpenAI このSDKはOpenAIの最新Realtime APIと統合されており、超低遅延で自然な音声対話が可能となります。 以下、本記事ではこちらのSDKを「統合SDK」と表現します。 AIがリアルな会話を通して感情の理解もできるように設計されており、Agoraの超低遅延のリアルタイム音声機能と会話型AIの連携を活かして、「カスタマーサポート」や「教育分野」、「言語学習」などの分野で、よりリアルなAIとの会話を提供できるようになりました。 その他のユースケースなど、細かい情報は以下の記事をご覧ください。 AgoraとOpenAI : リアルタイムで自然な会話型AIを可能にする 本記事では、実際にこの統合SDKを実行して挙動を検証していきます。
続きを読む
2024年12月11日
遠隔授業やオンライン会議に最適な Flexible Classroomソリューション —豊富な機能をパッケージ化—
リモートワーク、遠隔授業やハイブリッドイベントが普及し、オンライン会議やウェビナーへのニーズが高くなっています。ビデオ会議ツールとしてzoom, Google Meet, Microsoft Teams, Skypeなどいくつかが挙げられますが、これらのアプリはSaaSとしてのUIが出来上がっているので、お客様の利用シーンに応じて機能を自由にカスタマイズできません。また、自社ブランドとして音声/ビデオ通話アプリを立ち上げたいが、ゼロから構築するには開発リソースが足りず大変と感じるお客様も少なくないのが現状です。このような課題を解決するためにAgoraはFlexible Classroomソリューションを提供しています。今回は、このソリューションの特徴や用途、利用方法について紹介いたします。
続きを読む