2022年12月26日

スケーラビリティテスト（負荷試験）ガイド

agora_go_real_scalability

※この投稿は、Agoraの日本総代理店であるブイキューブが、Agoraブログを翻訳した記事です。

開発者が直面する主な課題の1つは、アプリケーションが開発中に発生しない問題に遭遇することです。これは、ソフトウェアが実際の使用状況に対して適切にテストされていない場合に発生します。負荷が高くなるとシステムに大きな負担がかかり、不具合が入り始める可能性があるためです。

そのため、アプリケーションのリリース前とリリース後に定期的にスケーラビリティテストを実行することが重要です。これにより、アプリケーションは、増加する顧客や作業量の増加に確実に対応できます。

このガイドでは、スケーラビリティテスト (コンピューターサイエンスの専門家は負荷試験またはパフォーマンステストとも呼んでいます) の要点と、ユーザーエクスペリエンスへの影響を防ぐためのテストを適切に行う方法について説明します。

お役立ち資料ダウンロード

【図解】システム開発のお手伝い

ブイキューブのソリューションアーキテクトが、寄り添います！
各種ライブ配信システムのアーキテクチャについてわかりやすい構成図にてご紹介！

無料ダウンロード

スケーラビリティとは

スケーラビリティとは、増加する負荷にソフトウェアが適応する能力を指します。システムが処理できる同時ユーザー数とリクエスト数を決定します。リアルタイムの音声、ビデオ、またはチャットアプリケーションをスケーリングするには、スケーラブルなソフトウェアが不可欠です。スケーラビリティがなければ、運用が制限され、その結果、収益も制限されます。それはまた、企業が貴重な機会を失うことを意味します。

たとえば、eコマースサイトが大規模なセール中に100,000人の同時ユーザーに対応するように拡張できないとします。その場合、スケーラビリティの欠如は、システムのスローダウンによる売上の損失や顧客体験の低下につながります。さらに重要なことに、スケーラブルなソフトウェアアーキテクチャは、システムのスローダウンによるセキュリティ上の欠陥や悪用を防ぐのに役立ちます。

垂直と水平のスケーラビリティ

スケーラビリティには、水平スケーラビリティと垂直スケーラビリティの2種類があります。

水平スケーラビリティ(スケールアウト) は、より多くのコンポーネントまたはリソースをシステムに追加して、より大きな需要に対応するアプローチです。たとえば、企業は既存のサーバーと一緒にサーバーを追加して、システムの負荷を共有することができます。水平方向のスケーリングは、アプリケーションをスケーリングする最も簡単な方法ですが、最もコストがかかります。また、ハードウェアを追加することはより困難であり、維持するためのコストも高くなります。

もう1つのタイプのスケーラビリティは垂直スケーリングと呼ばれ、アプリの既存のコンポーネントの容量またはパフォーマンスを向上させます。垂直方向のスケーリングは、ハードウェアへの大きな投資を必要としないため、水平方向のスケーリングよりも安価です。ただし、垂直スケーリングは複雑になる可能性があります。さらに、互換性の問題や積み重なったコンポーネントがシステムのパフォーマンスに影響を与え、出力がより遅くなる可能性があります.

このように、スケーラビリティは主にハードウェアの問題です。サーバーを追加したり、コンポーネントをアップグレードしたりすることで、アプリケーションをスケーラブルにすることができます。ただし、ソフトウェアで解決することもできます。優れたプログラミング手法を使用してコードを最適化し、コードをより効率的に実行して、消費するリソースを減らし、同時により多くのユーザーに対応することができます。

もう1つの適切なアプローチは、クラウドベースのソリューションを使用することです。これらのプラットフォームでは、必要に応じてリソース (CPU やストレージなど) を割り当てるだけで垂直方向のスケーリングが容易になるからです。また、アプリケーションを柔軟かつスケーラブルにすることもできます。しかし、2つの違いは何でしょうか？

弾力性とスケーラビリティ

スケーラビリティの議論は、弾力性に言及せずには完了しません。これは同様の指標ですが、意味が少し異なります。

スケーラビリティは、時間の経過とともに徐々に増加するシステムの負荷に関係しています。たとえば、企業が着実に顧客を増やしている場合、追加された需要に対応するために Webサイトをスケールアップする必要があります。多くの点で、スケーラビリティは、システムが対応できるワークロードのしきい値を設定します。また、本質的にプロアクティブです。中断のない運用を確保するために、実際に必要になる前に、スケールアップして将来の需要を考慮する必要があります。

一方、弾力性は、動的ワークロードを考慮してリソースを増減するシステムの能力です。言い換えれば、需要の急激な急増や急落に適応するシステムの柔軟性を指します。たとえば、eコマースアプリでは、ブラックフライデーやクリスマスなどのピーク時には50,000人の同時ユーザーがいるかもしれませんが、それ以外の時期には 5,000 ユーザーしかいません。この場合、柔軟なシステムは、需要が高いときにリソースを割り当て、需要が低いときにそれらを解放できます。

使用ごとに課金されるクラウドベースのシステムを使用する場合、弾力性は不可欠です。これにより、負荷が低い期間にアイドル状態のリソースに過大な支払いが発生しないことが保証されます。また、より多くのリソースを必要とするアプリケーションにリソースを割り当てるのにも役立ちます。

弾力性とスケーラビリティの違い (およびそれが適用される場合) を知ることは非常に重要です。それらに対処するには2つの異なるソリューションが必要だからです。

スケーラブルなアーキテクチャには、サーバーの追加や既存のマシンの仕様の改善など、「従来の」スケーリング方法が必要です。いずれの場合も、システムの負荷容量を永続的に増やします。

エラスティックアーキテクチャには、リソースのリアルタイム割り当てが必要ですが、これは特定のソリューションで実現できます。すべてのクラウドサービスがそれをサポートしているわけではありません。多くの場合、最初にサポートするものを構成して、弾力性を持たせる必要があります。

最後の比較として、弾力性のあるシステムはスケーラブルでなければなりませんが、スケーラブルなアーキテクチャは必ずしも弾力性があるとは限りません。

スケーラビリティテストとは

スケーラビリティテストは、さまざまなユーザー負荷でアプリケーションまたはシステムがどの程度うまく機能するかを測定する非機能ソフトウェアテストです。その目標は、システムが予測された負荷で壊れるかどうかを調べ、それを修正できるように洞察を明らかにすることです。

多くの場合、スケーラビリティテストは、ユーザー、トランザクション、プロセス、およびその他のシステム負荷の追加による拡張の増加を見越して行われます。ウェブサイトやアプリが中断されずに実行されるようにするために、改善点を特定するのに役立ちます。

スケーラビリティテストは、負荷容量に基づいてアプリケーションのパフォーマンスを評価する負荷テストに似ています。ただし、両者には重要な違いがあります。

負荷テストとは、システムに一度に最大負荷をかけることで、システムの限界点を見つけることです。その主な関心事は、パフォーマンスの問題を特定することです。

一方、スケーラビリティテストは段階的に行います。システムが特定の負荷レベルでそのように動作する理由を理解し、それを改善するための洞察を提供したいと考えています。主な関心事は、システムが目標数のユーザーまたはトランザクションにどのように対応できるかを調べることです。

上向きと下向きのスケーラビリティテスト

スケーラビリティテストには、上向きと下向きの2種類があります。

アップワードテストでは、アプリケーションが限界点に達するまで仮想ワークロードをアプリケーションに追加します。これは、システムが処理できる最大容量を決定するのに役立ちます。

ダウンワードテストはその逆です。最初は高いワークロードで開始し、最適な負荷レベルに達するまで徐々に減らします。多くの場合、下方テストは上方テストの後、またはアプリケーションが最初のスケーラビリティテストに失敗した場合に実行されます。

スケーラビリティテストの長所と短所

長所

このプロセスがビジネスの成功にとって非常に重要なのはなぜでしょうか? 定期的なスケーラビリティテストのビジネス上の利点のいくつかを見てみましょう。

ソフトウェアを起動したり、より多くのユーザーに対応するために拡張したりする前に、バグを早期に検出して修正するのに役立ちます。これにより、より洗練された製品が得られるだけでなく、コストの削減にも役立ちます。1-10-100 ルールによると、エラーを修正するための価格は、開発中は10 倍、ソフトウェアの起動後は最大で100倍になります。

スケーラビリティテストは、予測される需要を満たすために必要な正確なコンピューティングリソースを決定するのにも役立ちます。これにより、新しいハードウェアやインフラストラクチャへの投資に対する過剰な支出を防ぐことができます。

最終的に、スケーラビリティテストは、最高のユーザーエクスペリエンスを提供することがすべてです。負荷が高すぎるシステムによるクラッシュ、無応答、速度低下は、顧客に悪影響を及ぼす可能性があります。その結果、顧客はあなたの製品を完全に放棄する可能性があります.

スケーラビリティテストは、システムをテストし、その応答性を確認するのに役立ちます。これにより、積極的にパフォーマンスのボトルネックを即座に特定できるため、ピークシーズンの前に解決できます。

短所

スケーラビリティテストには、特に大規模なアプリケーションの場合、より多くの時間と費用がかかります。詳細なテストは完了するまでに長い時間がかかる可能性があり、アプリケーションの起動が遅れたり、予算を超えたりする可能性があります。これらの短所があるため、スケーラビリティをテストする前に確固たる理由があることをお勧めします。何十万もの同時ユーザーを獲得するエンタープライズソフトウェアは良い候補ですが、ユーザーが限定された単純なアプリはそうではないかもしれません。

注意点

スケーラビリティテストは完全なソリューションではないことに注意してください。テスト環境は、運用環境を 100% ミラーリングすることはできません。事前にわからない、または完全に再現できない現実の状況が常に存在します。

いずれの場合も、これらの「未知の」負荷により、実際よりも優れたテスト結果が得られる可能性があります。これは、スコープが限定されているスケーラビリティテストや、間違ったメトリックを測定している場合にも当てはまります。これらは、長期的にはより多くの害を引き起こす誤った結果をもたらす可能性があります。

スケーラビリティテストの内容

スケーラビリティテストで評価できるさまざまな項目があります。何を選択するかは、アプリケーションとインフラストラクチャの性質によって異なります。一般的な指標には次のものがあります。

応答時間

応答時間は、ユーザーがアクション (ボタンのクリックやフォームの送信など) を実行してから、アプリケーションから応答を受け取るまでの遅延です。

応答時間の最も基本的な尺度は、ユーザーがリンクをクリックしたり、ブラウザにURLを入力したりしてから、Web ページが読み込まれるまでの時間です。これは、ユーザーエクスペリエンスに大きな影響を与える応答性を測定するため、おそらくスケーラビリティテストで最も重要な指標の1つです。応答時間が長いと、アプリケーションの動作が遅くなり、「バグがある」ように見えます。

応答時間が長くなる最も一般的な原因はサーバーの遅延であるため、通常、スケーラビリティテストではこれを調査します。具体的には、応答時間が短くなりすぎる前に、ネットワークが耐えられる最大ユーザー数を決定することが目標です。

一般に、ユーザー数が多いほど、応答時間は長くなります。サーバーは大量の同時ユーザー要求を処理するのに苦労しているため、これは理解できます。ユーザーが地理的にサーバーから離れた場所にいる場合も、応答時間の遅延が発生する可能性があります。

通常、ワークロードは複数のサーバー間で分散されるため、クラウドまたはハイブリッド環境では応答時間がわずかに異なります。このような場合、スケーラビリティテストでは、ロードバランサーの有効性を測定して、サーバーが過多のリクエストで過負荷にならないようにします。

このような分散アーキテクチャで各サーバーコンポーネントの応答時間を測定することも価値があります。そうすれば、アプリケーションの負荷に関係なく、全体的な応答時間を測定できます。

高い応答時間を改善する最善の方法は、コンテンツ配信ネットワーク (CDN) を使用するなど、ネットワークを最適化することです。これは、データを世界中に分散させることで機能し、ユーザーとサーバーの間の地理的な距離が大きいことによる遅延を軽減します。

不必要に長く複雑なコードも、応答時間を長くする可能性があります。数秒の遅延でさえ、何千人ものユーザーが乗算され、大幅な速度低下を引き起こす可能性があります。コードとスクリプトを最適化および縮小すると、サーバーの処理と応答時間が短縮されます。

スループット

スループットは、アプリケーションが設定された期間に処理できる要求またはプロセスの数を測定します。これは、アプリケーションの性質によって異なります。

たとえば、Web サイトでは、サーバーが 1時間に処理できる Web ページ要求の数としてスループットを参照する場合があります。一方、データベースは、1分間に処理できる
SQLクエリの数としてスループットを測定できます。

一般に、システムにかかるサーバーの負荷に関係なく、スループットは変化しません。例えば、1分間に10人の顧客にサービスを提供できるファーストフードレストランです。何千人もの顧客が外に並んでいても、安定した速度で「処理」できる必要があります。したがって、スケーラビリティテストを行う際、開発者は多くの場合、アプリケーションがさまざまな負荷で満たす必要があるスループットの目標を定義します。

スケーラビリティテストは、アプリケーションの上限または最大スループット制限を見つけるためによく使用されます。ここでは、スループットが均等になり安定するまで、仮想ユーザーが着実に追加されます。しかし、低下し始めた場合は、より深刻な問題またはアプリケーションのボトルネックを示している可能性があります。

例を挙げます。スケーラビリティテストを行っていて、ある時点でスループットが劇的に低下したとします。さらに調査を進めると、ドロップ時にシステムのデータベースレイヤーでスローダウンが発生していたことが明らかになりました。このシナリオでは、データベースがスループットレベルを低下させるボトルネックです。

このように、不安定なスループットは、多くの場合、注意が必要な根本的な問題の兆候にすぎません。

メモリ使用量

メモリ使用量は、アプリケーションがタスクごとにユーザーごとに消費するRAMの量を測定し、ギガバイトやテラバイトなどのバイト単位で測定されます。これは、アプリケーションがシステムリソース (RAM) をどの程度効率的に使用しているかを測定するための、リソース使用率のメトリックです。

メモリ使用量は、アプリケーションの速度と応答性を判断できる重要な指標です。システムのメモリが不足すると、プログラム全体の速度が低下したり、クラッシュしたりする可能性があります。メモリ使用量がわずかに増加しただけでも、複数のユーザーで増加すると悪影響を与える可能性があります。

メモリ使用量の問題を修正するには、2つの側面があります。

一方では、メモリ使用量は主にベストプログラミングプラクティスに関するものです。開発者は、メモリの消費が最小限になるようにアプリケーションをコーディングする必要があります。たとえば、アプリケーションコードはデータベースへのSQLクエリを最適化して、RAMの使用率や冗長な呼び出しを最小限に抑える必要があります。

反対に、メモリ使用量はすべてハードウェアに関するものです。システムメモリは、限られた数の同時ユーザー要求またはトランザクションのみをサポートできます。スケーラビリティテストは、この制限を見つけることを目的としています。このしきい値に達すると、システムをさらにスケーリングするには、RAMまたはデータベースストレージを追加する必要があります。

CPU

CPU使用率は、アプリケーションが動作するために必要な処理能力を測定し、メガヘルツ (MHz) などのヘルツ単位で測定します。

CPU使用率は、メモリ使用率と同様のメトリックです。まず第一に、どちらもアプリケーションのシステムリソースの使用効率を評価するリソース使用率の指標です。また、CPU 使用率が高いとアプリケーションの速度が低下したりクラッシュしたりする可能性があるため、ユーザーエクスペリエンスにも直接影響します。最悪の場合、システムのCPUの寿命を縮める可能性があります。

不適切なプログラミング方法も、メモリと同様にCPUの過剰使用を引き起こします。たとえば、「デッド」コードやスレッドを使用すると、ソフトウェアが不要な処理能力を使用する可能性があります。

ただし、メモリと同様に、CPUは限られたリソースであり、一定量のタスクとユーザー要求しか処理できません。サーバーコンポーネントをアップグレードまたは追加すると、CPU 使用率が分散され、パフォーマンスが向上します。

ネットワーク

ネットワーク使用量は、アプリケーションが使用する帯域幅を決定するメトリックであり、1秒あたりのバイト数 (Bps) で測定されます。

スケーラブルなアプリケーションでは、大量のユーザーリクエストがあっても、ネットワークの使用を最小限に抑える必要があります。これが過剰な場合、ネットワークの輻輳が発生し、応答時間が長くなり、ユーザーエクスペリエンスが低下する可能性があります。

多くの場合、ネットワークの使用を改善するには、プログラミングの実践が必要です。たとえば、圧縮アルゴリズムは、アプリケーションがネットワーク経由で送信するデータサイズを縮小し、帯域幅の使用を最小限に抑えることができます。

スケーラビリティテストは、ネットワーク使用量の劇的な急増を検出するために重要です。これにより、さらに調査して解決することができます。ただし、ネットワークの輻輳は、使用しているネットワークの種類など、制御できない変数によって引き起こされることもあります。これらを排除するには、さまざまなネットワーク条件でスケーラビリティテストを実行することが不可欠です。たとえば、4G、5G、およびWi-Fiネットワークのテストシナリオが必要です。

アプリケーションのスケーラビリティをテストする方法

スケーラビリティテストには通常、次の4つの手順が含まれます。

最初のステップは、アプリケーションの現在の負荷を評価し、ユーザー数の増加などの要因に基づいて将来の容量を予測することです。これを行うと、開始するのに適したベンチマークが得られます。さらに、妥当な範囲でテストを実行できます。たとえば、ピーク時に 50,000 人しか確認していない場合、500,000人の同時ユーザーが関与するスケーラビリティテストを実行する必要はありません。それは時間、お金、労力の無駄です。
次に、チェックするメトリックに基づいてテストを設計する必要があります。これには、テストシナリオとテスト環境の2つが関係します。スケーラビリティテストを実行するための別のテスト環境は、組織の運用を妨げないようにするために重要です。正確なハードウェア仕様を含め、正確な結果を得るために、実稼働環境を可能な限り厳密にミラーリングすることを忘れないでください。必要に応じて、信頼できるスケーラビリティテストツールも検討することをお勧めします。Apache Jmeter、LoadNinja、Load Impact、Load View、NeoLoad などの例を調べることができます。テストシナリオは、システムのスケーラビリティを測定するために使用する一連の反復可能なソフトウェアタスクです。通常、これは、アプリケーションが「最もビジー」な状態にあることを表す、最もプロセッサを集中的に使用するタスクです。たとえば、かなりのCPUとRAMを消費するグラフィック処理ソフトウェアのピクセル計算アルゴリズムである可能性があります。理想的には、アプリケーションがどのように反応するかを確認するために、さまざまな状況とさまざまな負荷レベル (低、中、高) を表す個別のシナリオを用意する必要があります。最も簡単なのは、テストで仮想ユーザーの数を設定することです。たとえば、ピークシーズンに 500,000 人の Web サイト訪問者が予想されるとします。
テスト環境とスクリプトの準備ができたら、それらを実行できます。ここでの最善のアプローチは、定期的にテストして、アプリケーションのスケーラビリティの全体像を把握することです。また、分散環境でテストしている場合は、ロードバランサーが複数のサーバーを使用して、単一のサーバーが過負荷にならないように確認してください。
最後に、スループットやネットワーク使用率などの関連メトリックを含め、テストの実行後に結果を文書化して分析する必要があります。アプリケーションが故障した負荷レベルを特定し、いくつかの変更を実装し、テストシナリオを再実行して改善を確認します。

Agoraでリアルタイムコミュニケーションアプリをスケーリングする

リアルタイムコミュニケーションは、スケーラビリティが重要なアプリケーションの1つです。ただし、ビデオの遅延や通話の遅延をユーザーに経験させたくない場合は除きます。Agoraは、優れたユーザーエクスペリエンスを備えたシームレスなリアルタイムボイスチャットおよびビデオチャット機能を提供するリーダーです。Agoraのハイパースケーラビリティにより、アプリケーションはトラフィックの突然のスパイクに耐え、ライブビデオストリーミング中に1人から数百万人の同時ユーザーにスムーズにスケーリングできます。

Agora のグローバルエッジネットワークを使用して、アプリケーションを拡張し、世界中のどこにいても任意の数のエンドユーザーをサポートします。アプリケーションと対象ユーザーを増やすことは困難です。アプリケーションがシームレスに動作することを確認してください。

ガイドブックダウンロード

超低遅延API/SDK「Agora」ガイドブック

通話・配信遅延30-200ms！100万人の視聴対応！未経験者から専門家まで、誰でも読みやすいAgoraのガイドブックをダウンロードしませんか。

無料ダウンロード

執筆者ブイキューブ

Agoraの日本総代理店として、配信/通話SDKの提供だけでなく、導入支援から行い幅広いコミュニケーションサービスに携わっている。

2022年11月17日

ジッター（ジッタ）とは？

Agora
基礎知識
ライブ配信
ビデオ通話

※この投稿は、Agoraの日本総代理店であるブイキューブが、Agoraブログを翻訳した記事です。同僚との音声通話やビデオ通話が途切れ途切れになり、セッションの途中で突然切断されたことがある場合は、インターネットのジッターが原因である可能性があります。通話のジッターはユーザーのオンラインインタラクションを台無しにする可能性があるため、開発者がアプリケーションを構築する際にジッターを回避できるように理解することは重要な問題です。では、ネットワークのジッターとは何ですか? さらに重要なことに、どうすればそれを減らすことができますか? この開発者向けジッターガイドでは、これらの質問に答え、ユーザーの問題を調べて、ソリューションに移る前に問題を完全に理解できるようにします。

2023年05月09日

低レイテンシ（レイテンシー）とは

Agora
基礎知識
ライブ配信
ビデオ通話

※この投稿は、Agoraの日本総代理店であるブイキューブが、Agoraブログを翻訳した記事です。ビデオや、インタラクティブなライブストリーミングについて学習している場合は、「低レイテンシストリーミング」という用語に出くわしたことは間違いありません。この記事では、低レイテンシとは何か、なぜそれが重要なのか、さらに重要なのはいつそれが重要なのかについて説明します。一方向のコンテンツ (映画など) のオンデマンドストリーミングと、全員が同期している必要がある複数の関係者間のリアルタイムのやり取りのサポートとの間には、かなりの違いがあることを理解することが重要です。リアルタイム通信 (RTC) の世界では、ストリーミング遅延の最小化がすべてです。

2022年11月10日

パケットロス（パケロス）とは?

Agora
基礎知識
ライブ配信
ビデオ通話

※この投稿は、Agoraの日本総代理店であるブイキューブが、Agoraブログを翻訳した記事です。今日の接続された世界では、速度がすべてです。開発者は、リアルタイムのビデオ通信、インターネット通話、およびインスタントメッセージングが、ある地点から別の地点に可能な限り高速に到達するデータに依存していることを知っています。結局のところ、パフォーマンス問題の発生を体験すると、ユーザーはアプリケーションの利用をすぐにやめてしまいます。多くの問題がネットワークパフォーマンスを混乱させ、標準以下のユーザーエクスペリエンスを提供する可能性があります。これらの問題の1つは、パケットロスです。開発者の目標は、アプリケーションのパケットロスを防ぐことです。それを念頭に置いて、パケットロスとは何か、およびそれを防ぐ方法を説明するこのガイドを作成しました。しかし、そこに到達する前に、「なぜパケットロスが発生するのか?」という質問にユーザーの視点から答える必要があります。

2023年01月26日

Agora: メタバースのインフラストラクチャ

Agora
基礎知識
メタバース

※この投稿は、Agoraの日本総代理店であるブイキューブが、Agoraブログを翻訳した記事です。 ※一部、日本向けに調整しています。 3部構成のブログシリーズの第1部では、スケーラブルで低遅延のリアルタイムエンゲージメント（RTE）ソリューションを構築するためのAgoraのインテリジェントなグローバルネットワークが、接続性と相互運用性の課題を克服しユビキタスを可能にする方法を探求します。

2024年03月15日

Tencent Cloudコンテンツ生成AIを用いたライブギフトの実現方法

実装例・サンプルコード
ライブ配信
ビデオ通話
Tencent

※この投稿は、Tencentの日本代理店であるブイキューブが、Tencentブログを翻訳した記事です。ギフトを贈ることはユーザがライブ配信者へ応援する気持ちを伝えるメインな手段で、ライブ配信者とプラットフォームにとっても重要な収入源となります。しかし、従来のギフトでは、ギフトの豊かさと他の人やものと異なる独自性を求めるライブ参加者のニーズに応えることが難しいです。強力な生成機能を持つAIGCは、テキストおよび他の手段で全く新しいかつ独自性のあるギフトを容易に作成しライブ配信者へ贈ることができ、このようにユーザにインタラクティブな報いの体験を実感させます。「AIGC+ギフト」の組み合わせは、ライブストリーミングにおける双方向のやり取り体験を効果的に向上させ、ユーザアクティビティを促進させるだけでなく、ユーザがギフトを贈る意欲を引き出し、さらにプラットフォーム利益の成長にも繋がります。