“ブイキューブ” 記事一覧
2025年05月30日
WebRTCの商用サービスまとめ|Agora, Amazon Chime, twilio, SkyWay, Live kit など
(2025/5/30更新) オンライン会議やビデオ通話は、今やビジネスや個人のコミュニケーションに欠かせないツールとなりました。遠隔地にいる相手とも、まるでその場にいるかのようにリアルタイムで繋がれるこれらの体験は、私たちの働き方や暮らしを大きく変えています。 このようなリアルタイムコミュニケーションをWebブラウザ上で実現する中核技術がWebRTCです。特別なソフトウェアのインストールを必要とせず、Webサイトにアクセスするだけで利用できる手軽さが大きな特徴です。長年にわたり開発と仕様策定が進められてきましたが、2021年にはW3CとIETFによって正式に標準化されました。これにより、技術的な安定性やブラウザ間の互換性がさらに向上し、開発者はより安心してWebRTCを様々なサービスへ組み込めるようになりました。 現在、WebRTCはオンライン会議システム、ビデオ/音声通話サービス、ライブ配信プラットフォーム、オンライン教育、遠隔医療、さらにはライブコマース、オンラインゲーム、メタバース空間での交流といった多種多様なサービスで活用され、その重要性はますます高まっています。 この記事では上記のようなWebRTCを使って実現できることだけでなく、代表的なWebRTC用プラットフォームの商用サービスとそのメリットを含めてご紹介します。今後も様々なサービスで活用が進むWebRTCを知って、ぜひ自社のサービス開発にお役立てください。
続きを読む
2025年03月25日
Agoraの文字起こし機能の精度を検証してみる(在宅・カフェ店内・駅のホーム)
AIを活用したリアルタイム音声認識(Speech-to-Text: STT)は、カスタマーサポート、字幕生成、多言語会議、ライブ配信、通話記録、など多くのユースケースで活用されています。 そしてAgoraが提供するクラウドベースの文字起こし機能(Real-Time Speech to Text)も、低遅延かつ高精度なSTT機能を提供します。 Real-Time Speech to Textの公式ドキュメントこちら また、LLMを併用した応用的なアーキテクチャを構成する際にも、文字起こしの精度が非常に重要となります。 そこで本記事では、Agoraの文字起こしがどの程度の精度であるか、発話音声に対して意図的にノイズを混入させ、Agoraの文字起こし精度を確認していきます。
続きを読む
2025年03月07日
Agoraのライブビデオ配信にリアルタイムの3Dアバターを加える
※この投稿は、Agoraの日本代理店であるブイキューブが、Agoraブログを翻訳した記事です。 急速に進化する現在のデジタル社会では、ライブストリーム動画がトレンドになっています。今までの配信形式よりユーザーがもっと没入的な機能でカスタマイズできるストリーミングオプションを期待しています。コンテンツの作成者は独創性をもつ形式でのライブ配信を求めており、配信者の動きや表情を反映するダイナミックな3Dアバターへのニーズが生まれました。
続きを読む
2025年02月08日
拡張現実でリアルタイム遠隔医療コラボレーションを実現する
【AR/VRを活用したリアルタイム遠隔医療コラボレーション】 オンラインコラボレーションとは、通信技術を活用して、遠隔地の個人やグループが共同作業を行うことです。 この概念には、ビデオ会議、インスタントメッセージング、コラボレーションソフトウェアなど、さまざまなデジタルコミュニケーションツールやプラットフォームが含まれます。目的は、地理的な制約を超えてリアルタイムでやり取りを行い、情報を共有し、共同で問題を解決できる環境を促進することです。
続きを読む
2025年02月02日
会話型AIとRTCを活用したリアルタイム・マルチモーダル・エージェントでIoTを革新する
「会話型 AI」がIoTの新たな可能性を切り開きます。最新の大規模言語モデル(LLM)を活用したマルチモーダル通信により、複雑なリクエストを理解し、自然な会話を行い、さらにはライブ映像を解析してアクションを実行することが可能になります。 Agora の 会話型 AI SDK は、自動化・通信・リアルタイムの意思決定 を進化させるのに重要な役割を担っています。 本記事では、こうした技術がさまざまな業界でどのように活用されているのか、注目の事例を詳しく紹介し、IoT の未来がどのように変わっていくのか を探ります。
続きを読む
2025年01月28日
TEN framework とは? 映像音声を扱う柔軟なAIアプリケーションを作成する
TENはTransformative Extensions Networkの略で、会話型AIを作るための音声エージェントフレームワークです。 2024 年後半に登場したものであり、オーディオフレーム及びビデオフレームの処理にAgoraが採用されています。 この記事では、TEN framework の紹介とローカルビルドの手順を簡単に紹介します。 TEN framework 公式サイト:https://www.theten.ai/
続きを読む
2025年01月21日
超低遅延で自然な会話AIを簡単に実装!AgoraとRealtime APIでリアルタイムチャットを実現
OpenAIとの提携により、AgoraはOpenAI向けの新しい会話型AI SDKをリリースしました。 公式ドキュメント:Conversational AI powered by Agora and OpenAI このSDKはOpenAIの最新Realtime APIと統合されており、超低遅延で自然な音声対話が可能となります。 以下、本記事ではこちらのSDKを「統合SDK」と表現します。 AIがリアルな会話を通して感情の理解もできるように設計されており、Agoraの超低遅延のリアルタイム音声機能と会話型AIの連携を活かして、「カスタマーサポート」や「教育分野」、「言語学習」などの分野で、よりリアルなAIとの会話を提供できるようになりました。 その他のユースケースなど、細かい情報は以下の記事をご覧ください。 AgoraとOpenAI : リアルタイムで自然な会話型AIを可能にする 本記事では、実際にこの統合SDKを実行して挙動を検証していきます。
続きを読む
2025年01月14日
Astroを用いた文字起こし機能の構築
※この投稿は、Agoraの日本代理店であるブイキューブが、Agoraブログを翻訳した記事です。 この記事は、高速なWebサイトを構築するためのWebフレームワークであるAstroを用いたバックエンド構築に関するシリーズのパート3です。 パート1 Astroを用いたトークン生成システムの構築 パート2 Astroを用いたクラウドレコーディングの実装
続きを読む
2024年12月11日
遠隔授業やオンライン会議に最適な Flexible Classroomソリューション —豊富な機能をパッケージ化—
リモートワーク、遠隔授業やハイブリッドイベントが普及し、オンライン会議やウェビナーへのニーズが高くなっています。ビデオ会議ツールとしてzoom, Google Meet, Microsoft Teams, Skypeなどいくつかが挙げられますが、これらのアプリはSaaSとしてのUIが出来上がっているので、お客様の利用シーンに応じて機能を自由にカスタマイズできません。また、自社ブランドとして音声/ビデオ通話アプリを立ち上げたいが、ゼロから構築するには開発リソースが足りず大変と感じるお客様も少なくないのが現状です。このような課題を解決するためにAgoraはFlexible Classroomソリューションを提供しています。今回は、このソリューションの特徴や用途、利用方法について紹介いたします。
続きを読む