2024年08月22日

【入門】WebRTCとは？一般的な仕組み・サーバー構成を解説（シグナリング/TURN/SFU）

webrtc-general-server-configuration-signaling-turn-sfu

2024/8/22更新

近年、ブラウザやアプリを介してのダイレクトに動画や音声のやり取り（リアルタイム通信技術）が急速に進化しています。

ビジネスシーンでも、Web会議・ビデオ会議を通じて、物理的に離れている相手とやり取りができるようになり、リモートワークの促進につながりました。

Web会議・ビデオ会議を実現する技術の1つに「WebRTC」という仕組みがあります。今回はこのWebRTCの基礎知識としてWebRTCの仕組みからサーバー構成などをわかりやすくお伝えします。

ガイドブックダウンロード

超低遅延API/SDK「Agora」ガイドブック

通話・配信遅延30-200ms！100万人の視聴対応！未経験者から専門家まで、誰でも読みやすいAgoraのガイドブックをダウンロードしませんか。

無料ダウンロード

WebRTCとは

WebRTCとは、「Web Real-Time Communication」の略称で、APIを経由して、ウェブブラウザやモバイルアプリでリアルタイム通信を実現する技術のこと。WebRTCのプロジェクトに参画しているのは、Apple、Google、Microsoftなど名だたるIT企業ばかりです。

対応ブラウザ

対応しているブラウザは、PCでは、Google Chrome、Microsoft Edge、Mozilla Firefox、Safari、Operaになります。多くの人が日常的に使っている主要なブラウザでは、ほぼ対応していると言ってよいでしょう。

またスマートフォンなどモバイル環境で使用するOSでは、AndroidはGoogle Chrome、Mozilla Firefox、Opera Mobile、iOSはSafariです。

利用シーン

WebRTCは様々なシーンで利用されています。例えば、Web会議、Web面接、オンライン営業などのビジネスシーンではもちろん、オンライン教育、ボイスチャット、オンラインクレーンゲームなどでもWebRTCの仕組みが利用されています。

また、遠隔医療（オンライン診療）、オンラインフィットネス、IoT映像配信、VRライブ配信などにもその活用が広がってきています。

シグナリングサーバーとは

WebRTCは、様々なサーバーなどを組み合わせ、利用できるようにしています。

その1つに「シグナリングサーバー」があります。シグナリングサーバーは「通信相手に関する情報を得る」のが役割で、WebRTCにおいて欠かせないサーバーです。

そもそも相手とやり取りをしようにも、相手が誰でどこにいるのか判別できなければ、やりようがありません。そこで、シグナリングサーバーは相手のユーザー名を伝えることで、その他通信に必要な情報を収拾できるようにしているのです。

P2Pとは

WebRTCを理解するうえで、とても重要な概念があります。それが「P2P」です。P2PはPeer to Peerの略になります。

P2Pの基本的な概念は「サーバーを介さず、端末同士が直接通信できるようにする」というものです。

STUNサーバーとは

"P2Pのような"やり取りを実現するために、必要となるのはシグナリングサーバーだけではありません。その他にも「STUNサーバー」や「TURNサーバー」などを利用します。

なぜ、これらのサーバーが必要となるのか。その理由は「NAT(=Network Address Translation)」の存在があります。

NATとは

NATは、ネットワークアドレスを変換する機能です。

例えば、自宅でWi-Fiをつないだ際、端末にグローバルIPアドレスが付与されていないケースがあります。これは、プロバイダーから割り振られるIPアドレスが一つのため、複数の端末がインターネットに接続できるよう、ルーターがIPをLANの端末へ振り分けているためです。

そのため、端末で表示されるIPアドレスがグローバルIPアドレスと異なることがあります。しかし、これでは情報を送りたい側は困ってしまいます。なぜなら、通信したい先の本当のIPアドレスが変換されているため、わからないからです。

そこで、NATによって変換されたアドレスをセキュアに関連づける「NAT超え」が必要となります。その際に必要となるのが、STUNサーバーとTURNサーバーです。

STUNサーバーの役割

STUNサーバーは外部ネットワークから見た際の自身のIPアドレスを教えてくれます。そのアドレスと自身のPCのアドレスを比較してNAT越えが必要かを判断します。

TURNサーバーとは

STUNサーバーを使えば、NAT超えが必要かどうかがわかります。実際に企業で導入しているネットワークにはNAT越えが必要な場合が多く、且つ、Firewallを超える必要もでてきます。

Firewallを超える

Firewallは、ほとんどのパソコンに組み込まれた基本的なセキュリティ対策の1つです。特に、企業においては、サイバー攻撃などのリスクを防ぐため、ポート制御やウイルス感染を防ぐ役割を担います。

しかし、Firewallをセキュアに超えられる仕組みがなければ、ビジネスシーンでP2Pのような通信ができません。そこで、考えられたのが「TURNサーバー」です。

TURNサーバーの仕組み

TURNサーバーは、もともとVoIPやオンラインゲームで使用されていた仕組みです。TURNサーバーでは、通信の際に発生するストリームデータの受け渡しをするブリッジの役割を担います。

SFUサーバーとは

SFU(Selective Forwarding Unit)サーバーは、音声や映像をP2Pではなく、サーバー経由で行う技術です。配信者が直接相手に通信するのではなく、サーバーを間に挟むことで、動画の視聴者増加などによる、端末への負荷軽減を可能にします。これにより、リアルタイムで多くの視聴者に音声や動画を配信できます。

多拠点で接続する

現代では、多拠点に同時に動画を届ける必要があります。YouTubeなどの動画サイトでもライブ配信が行われ、大量のユーザーが同時に視聴するケースが多々あります。

このような処理を行うには、一般ユーザーが使用する端末では不可能です。よりハイスペックで、大量の同時接続にも耐えうるような強力なサーバーが求められ、その傾向は今後もさらに続くでしょう。

MCUとの違い

多拠点同時配信を行う技術として、MCU（Multipoint Control Unit）があります。MCUは、SFUで用いるサーバーよりさらにハイスペックなマシンを用いて、音声や映像を合成したり、回線が細いユーザーに対してはビットレートを落として映像を送るなどができます。

しかしその分、処理の負荷がかかり、特にCPUのコア数が必要です。

仮想広域ネットワーク

SFUやMCUよりもさらに多くの拠点と接続できる仕組みとして、「仮想広域ネットワーク」を使ったサービスも存在します。

例えば、ライブ配信・ビデオ通話・音声通話API/SDKのAgoraは、HLSやFlashを使用せず、独自のプロトコルで超低遅延を実現。世界中のデータセンターにノードを構築し、自動で最適な経路を選択するアルゴリズムを備えています。

またWebRTCとも互換性を持ち、SFU型よりさらに規模が大きい通話などにも対応。P2Pより安定した通信を実現しています。

Agoraの無料トライアルを見る

SDKを用いて開発する

上記の通り、WebRTCを利用したシステムを自社開発するには、様々なサーバーの構築・管理が必要です。しかし、最近ではSDKを使って自社開発を極力少なくすることができます。

とはいえ、SDKにも様々な種類があり、選ぶのに迷うケースもあるでしょう。その際は、WebRTCの商用サービスについてまとめた記事がありますので、こちらをご覧ください。

WebRTCの商用サービスまとめ｜Twilio, SkyWay, Agora.io,Amazon Chime SDK など

まとめ

ここまで、WebRTCの基本的な仕組みからサーバーの構成までお伝えしました。

動画・音声サービスは今後さらに発展していくと予想されます。

単なる1:Nの配信だけでなく、参加型ライブ配信などに代表される双方向性の高い映像配信や、ウォッチパーティのような仲間同士で楽しめるサービス、また、パフォーマー側にもオーディエンスの気持ちが伝わる熱量可視化のサービスなど、オンラインならではの体験が加速していくでしょう。その際、WebRTCが必要になりましたら参考にしていただければ幸いです。

ガイドブックダウンロード

超低遅延API/SDK「Agora」ガイドブック

通話・配信遅延30-200ms！100万人の視聴対応！未経験者から専門家まで、誰でも読みやすいAgoraのガイドブックをダウンロードしませんか。

無料ダウンロード

執筆者ブイキューブ

Agoraの日本総代理店として、配信/通話SDKの提供だけでなく、導入支援から行い幅広いコミュニケーションサービスに携わっている。

2025年05月30日

WebRTCの商用サービスまとめ｜Agora, Amazon Chime, twilio, SkyWay, Live kit など

WebRTC
基礎知識

(2025/5/30更新) オンライン会議やビデオ通話は、今やビジネスや個人のコミュニケーションに欠かせないツールとなりました。遠隔地にいる相手とも、まるでその場にいるかのようにリアルタイムで繋がれるこれらの体験は、私たちの働き方や暮らしを大きく変えています。このようなリアルタイムコミュニケーションをWebブラウザ上で実現する中核技術がWebRTCです。特別なソフトウェアのインストールを必要とせず、Webサイトにアクセスするだけで利用できる手軽さが大きな特徴です。長年にわたり開発と仕様策定が進められてきましたが、2021年にはW3CとIETFによって正式に標準化されました。これにより、技術的な安定性やブラウザ間の互換性がさらに向上し、開発者はより安心してWebRTCを様々なサービスへ組み込めるようになりました。現在、WebRTCはオンライン会議システム、ビデオ/音声通話サービス、ライブ配信プラットフォーム、オンライン教育、遠隔医療、さらにはライブコマース、オンラインゲーム、メタバース空間での交流といった多種多様なサービスで活用され、その重要性はますます高まっています。この記事では上記のようなWebRTCを使って実現できることだけでなく、代表的なWebRTC用プラットフォームの商用サービスとそのメリットを含めてご紹介します。今後も様々なサービスで活用が進むWebRTCを知って、ぜひ自社のサービス開発にお役立てください。

2022年05月10日

WebRTCとWebViewの組み合わせについて

実装例・サンプルコード
Agora
WebRTC

※2020年の記事です。 Android/iOS共にWebViewでWebRTCの映像が受信できるか検証してみました。 WebRTCの配信基盤にはagora.ioを利用します。

2022年06月27日

通話・配信アプリケーションの設計・実装・運用で気を付ける5つの事

Agora
WebRTC
HLS
基礎知識

近年、ZoomのようなWeb会議ツールや17Liveのようなライブ配信アプリケーションが多くリリースされています。基本的には映像音声を利用したサービスですが、それぞれの利用シーンに特化したアプリケーションの作り込みがされているように感じます。この記事ではこれからWeb会議やライブ配信アプリケーションを開発する方向けに、設計や実装の際に気を付ける5つのポイントをまとめました。

2022年05月20日

WebRTCでの開発時に役立つツールやサイトまとめ。開発環境やテストサイトなど

WebRTC
基礎知識

※2020年3月の記事です。 WebRTCを利用したアプリケーション開発で活用できるツールやサイトをまとめてみました。あくまで個人的な所感にもとづくものではあります。

2024年08月19日

HLS（HTTP Live Streaming）とは？概要・仕組み・課題など

HLS
基礎知識

2024年8月19日更新インターネットによる動画配信のコア技術と言われているHLS。マルチビットレートへの対応やユーザー側の環境に依存しない配信が可能となるなど、多くのメリットを持つHTTPベースのメディアストリーミングプロトコルです。今回は、オンデマンド配信やライブ配信を手掛けるユーザーなら知っておきたいHLSの概要や課題などについて詳しく解説いたします。

【入門】WebRTCとは？一般的な仕組み・サーバー構成を解説（シグナリング/TURN/SFU）