ページの先頭です
このレポートでは、毎年IIJが運用しているブロードバンド接続サービスのトラフィックを分析して、その結果を報告しています(注1)(注2)(注3)(注4)。今回も、利用者の1日のトラフィック量やポート別使用量などを基に、この1年間のトラフィック傾向の変化を報告します。
昨年に引き続き、コロナ禍で自宅でのインターネット利用が増え、ブロードバンドトラフィックも増加傾向が続いています。その一方で、外出が減った分モバイルの利用量はほぼ横ばいとなっています。
図-1は、IIJの固定ブロードバンドサービス及びモバイルサービス全体について、月ごとの平均トラフィック量の推移を示したグラフです。トラフィックのIN/OUTはISPから見た方向を表し、INは利用者からのアップロード、OUTは利用者へのダウンロードとなります。トラフィック量の数値は開示できないため、両サービスの2020年1月のOUTの値を1として正規化しています。
ブロードバンドサービスのトラフィックは、新型コロナウイルスの国内感染が本格的に広がり始めた昨年3月から5月にかけて急増し、緊急事態宣言解除後の6月には少し減りましたが、8月から再び増加に転じました。この1年のブロードバンドトラフィック量は、INは20%の増加、OUTは23%の増加となっています。1年前はそれぞれ43%と34%の増加でしたので、昨年に比べ増加率は減少したものの、それ以前の増加率に戻ったとも捉えることができます。逆に、モバイルサービスは、リモートワーク向けの利用が増えたものの、外出時の利用分が減ったため、全体としては横ばい傾向です。モバイルは、この1年で、IN は39%の増加、OUTは1%の減少となっています。1年前はINが28%の増加、OUTが7%の減少でした。
ブロードバンドに関しては、IPv6 IPoEのトラフィック量も含めて示しています。IIJのブロードバンドにおけるIPv6は、IPoE 方式とPPPoE方式があります(注5)。2021年6月時点で、IPoEのブロードバンドトラフィック量の全体に占める割合は、INで31%、OUTで30%と、昨年同月よりそれぞれ7ポイントと10ポイント増えていて、全体の3分の1に近いトラフィックがIPoEとなっています。コロナ禍で顕著になってきたPPPoEの輻輳を避けて、IPoEへ移行する利用者が増えていて、IPoEの利用拡大が続いています。
次に、コロナ禍の平日と週末の時間別ブロードバンドトラフィック量の推移を見ていきます。ここでのトラフィック量はPPPoEとIPoEの合計値です。図-2及び図-3に以下の7つの週のトラフィックを示します。一斉休校が始まる前の2020年2月25日の週、最初の緊急事態宣言下の4月20日の週、緊急事態解除後の6月22日の週、感染第2波が落ち着いてきた8月31日の週、2回目の緊急事態宣言下の2021年1月18日の週、首都圏の緊急事態解除後の3月22日の週、そして、変異ウイルスによる感染第5波の始まりの7月5日の週です。ここでは、週の各時間の平均トラフィック量を、月曜から金曜の平日(休日は除く)と土日の週末に分けています。下側の波線はそれぞれの週のアップロード量ですが、今回はダウンロード量に注目します。
まず、平日のトラフィック量の推移を見ます。昨年の2月と4月を比較して最初の緊急事態宣言の影響を見ると、昼間のトラフィックが大きく増えていて、また夜のピーク時間帯でも増加しています。緊急事態宣言が解除された6月には昼間の増加分が半分以下に減少していますが、ピーク時間帯ではほとんど減っていません。その後、昼間のトラフィックは徐々に増えていきますが昨年4月のレベルに届くのは今年の3月です。この週は学校が春休みで昼間のトラフィック量は少し多めになっています。7月には昼間のトラフィックが少し減っていますが、これは、学校が授業期間であることに加え、リモートワークも少し減っているようです。また、20時から22時のピーク時間帯に着目するとほぼ一貫して増加していることが分かります。
一方、週末のトラフィック量は、平日に比べ変化が少なくなっています。週末の昼間の在宅率は学校やリモートワークよりも天気が大きく影響します。例えば、今年の1月23日・24日は悪天候で自宅でのインターネット利用が増え、3月27日・28日は関東以西で桜が満開となり人出が増えた結果トラフィックは少なめです。夜のピーク時間帯のトラフィック量については平日とほぼ同じです。
なお、IPoEトラフィックはインターネットマルチフィード社のtransixサービスを利用していて詳細なデータが取得できていないため、以降の解析の対象にはなっていません。
今回も前回までと同様に、ブロードバンドに関しては、個人及び法人向けのブロードバンド接続サービスについて、ファイバーとDSLによるブロードバンド顧客を収容するルータで、Sampled NetFlowにより収集した調査データを利用しています。モバイルに関しては、個人及び法人向けのモバイルサービスについて、使用量にはアクセスゲートウェイの課金用情報を、使用ポートにはサービス収容ルータでのSampled NetFlowデータを利用しています。
トラフィックは平日と休日で傾向が異なるため、1週間分のトラフィックを解析しています。今回は、2021年5月31日から6月6日の1週間分のデータを使っていて、前回解析した2020年6月1日から6月7日の1週間分と比較します。
ブロードバンドの集計は契約ごとに行い、一方モバイルでは複数電話番号の契約があるので電話番号ごとの集計となっています。ブロードバンド各利用者の使用量は、利用者に割り当てられたIPアドレスと、観測されたIPアドレスを照合して求めています。また、NetFlowではパケットをサンプリングして統計情報を取得しています。サンプリングレートは、ルータの性能や負荷を考慮して、1/8192程度に設定されています。観測された使用量に、サンプリングレートの逆数を掛けることで全体の使用量を推定しています。
IIJの提供するブロードバンドサービスにはファイバー接続とDSL接続がありますが、今ではファイバー接続の利用がほとんどとなっています。2021年には観測されたユーザ数の99%はファイバー利用者でした。
まずは、ブロードバンド及びモバイル利用者の1日の利用量をいくつかの切り口から見ていきます。ここでの1日の利用量は各利用者の1週間分のデータの1日平均です。
2019年のレポートから、利用者の1日の使用量は個人向けサービス利用者のデータのみを使っています。これは、利用形態が多様な法人向けサービスを含めると分布の歪みが大きくなってしまうため、全体の利用傾向を掴むには個人向けサービス分だけを対象にした方が、より一般性がありかつ分かりやすいと判断したからです。なお、次節のポート別使用量の解析では区別が難しいため法人向けも含めたデータを使っています。
図-4及び図-5は、ブロードバンドとモバイル利用者の1日の平均利用量の分布(確率密度関数)を示します。アップロード(IN)とダウンロード(OUT)に分け、利用者のトラフィック量をX軸に、その出現確率をY軸に示していて、2020年と2021 年を比較しています。X軸はログスケールで、10KB(104)から100GB(1011)の範囲を示しています。一部の利用者はグラフの範囲外にありますが、概ね100GB(1011)までの範囲に分布しています。
ブロードバンドのINとOUTの各分布は、片対数グラフ上で正規分布となる、対数正規分布に近い形をしています。これはリニアなグラフで見ると、左端近くにピークがあり右へなだらかに減少する、いわゆるロングテールな分布です。OUTの分布はINの分布より右にずれていて、ダウンロード量がアップロード量より、ひと桁以上大きくなっています。2020年と2021年で比較すると、INとOUT共に分布の山が僅かながら右に移動しており、利用者全体のトラフィック量が増えていることが分かります。今回はこれまでに比べて分布にほとんど変化がありませんが、これはPPPoEの総量が伸びていないことからも窺えます。
右側のOUTの分布を見ると、分布のピークはここ数年間で着実に右に移動していますが、右端のヘビーユーザの使用量はあまり増えておらず、分布の対称性が崩れてきています。一方で、左側のINの分布は左右対称で、より対数正規分布に近い形です。
図-5のモバイルの場合も同様に、分布の山が僅かに右に移動していて、全体の利用量が僅かながら増えていることが分かります。モバイルの利用量は、ブロードバンドに比べて大幅に少なく、また、使用量に制限があるため、分布右側のヘビーユーザの割合が少なく、左右非対称な形になります。極端なヘビーユーザも存在しません。外出時のみの利用や、使用量の制限のため、各利用者の日ごとの利用量のばらつきはブロードバンドより大きくなります。そのため、1週間分のデータから1日平均を求めると、1日単位で見た場合より利用者間のばらつきは小さくなります。1日単位で同様の分布を描くと、分布の山が少し低くなり、その分両側の裾が持ち上がりますが、基本的な分布の形や最頻出値はほとんど変わりません。
表-1は、ブロードバンド利用者の1日のトラフィック量の平均値と中間値、分布の山の頂点にある最頻出値の推移を示します。分布の山に対して頂点が少しずれている場合は、最頻出値は分布の山の中央に来るように補正しています。今回はいずれの数値も伸びています。分布の最頻出値を2020年と2021年で比較すると、INでは158MBから200MBに、OUTでは3162MBから3981MBに増えており、伸び率で見ると、INで1.3倍、OUTでも1.3倍となっています。
一方、平均値はグラフ右側のヘビーユーザの使用量に左右されるため、2021年には、INの平均は684MB、OUTの平均は4225MBと、最頻出値よりかなり大きな値になります。2020 年には、それぞれ609MBと3810MBでした。
モバイルでは、ヘビーユーザが少ないため、平均と最頻出値が近い値になります。表-2に示すように、今回はINの平均は僅かに減少しましたが、他の項目は増加しています。2021年の最頻出値は、INで8MB、OUTで71MBで、平均値は、INで10MB、OUTで86MBです。2020年の最頻出値は、INで7MB、OUTで63MB、平均値は、INで10MB、OUTで79MBでした。
図-6及び図-7では、利用者5,000人をランダムに抽出し、利用者ごとのIN/OUT使用量をプロットしています。X軸はOUT (ダウンロード量)、Y軸はIN(アップロード量)で、共にログスケールです。利用者のIN/OUTが同量であれば対角線上にプロットされます。
対角線の下側に対角線に沿って広がるクラスタは、ダウンロード量がひと桁多い一般的なユーザです。ブロードバンドでは、以前は右上の対角線上あたりを中心に薄く広がるヘビーユーザのクラスタがはっきり分かりましたが、今では識別ができなくなっています。また、各利用者の使用量やIN/OUT比率にも大きなばらつきがあり、多様な利用形態が存在することが窺えます。モバイルでも、OUTがひと桁多い傾向は同じですが、ブロードバンドに比べて利用量は少なく、IN/OUTのばらつきも小さくなっています。ブロードバンド、モバイル共に、2020年との違いはほとんど分かりません。
図-8及び図-9は、利用者の1日のトラフィック量を相補累積度分布にしたものです。これは、使用量がX軸の値より多い利用者の、全体に対する割合をY軸に、ログ・ログスケールで示したもので、ヘビーユーザの分布を見るのに有効です。グラフの右側が直線的に下がっていて、べき分布に近いロングテールな分布であることが分かります。ヘビーユーザは統計的に分布しており、決して一部の特殊な利用者ではないと言えます。
ブロードバンドの分布は昨年とほとんど変わっていませんが、モバイルでは昨年観測されていた、大量にアップロードするユーザによるIN側分布の右下の出っ張りがなくなり、直線的な傾きとなっています。
利用者間のトラフィック使用量の偏りを見ると、使用量には大きな偏りがあり、結果として全体は一部利用者のトラフィックで占められています。例えば、ブロードバンド上位10%の利用者がOUTの48%、INの76%を占めています。更に、上位1%の利用者がOUTの15%、INの50%を占めています。昨年と比べても、偏りに大きな変化はありません。モバイルでは、上位10% の利用者がOUTの48%、INの49%を、上位1%の利用者がOUT の12%、INの16%を占めています。こちらも昨年のレポートから偏りにほとんど変化はありません。
次に、トラフィックの内訳をポート別の使用量から見ていきます。最近では、ポート番号からアプリケーションを特定することは困難です。P2P系アプリケーションには、双方が動的ポートを使うものが多く、また、多くのクライアント・サーバ型アプリケーションが、ファイアウォールを回避するため、HTTPが使う80番ポートを利用します。大まかに分けると、双方が1024番以上の動的ポートを使っていればP2P系のアプリケーションの可能性が高く、片方が1024番未満のいわゆるウェルノウンポートを使っていれば、クライアント・サーバ型のアプリケーションの可能性が高いと言えます。そこで、TCP とUDPで、ソースとデスティネーションのポート番号の小さい方を取り、ポート番号別の使用量を見てみます。
表-3はブロードバンド利用者のポート使用割合の過去5年間の推移を示します。2021年の全体トラフィックの72%はTCPで、昨年から5ポイント減少しました。HTTPSのTCP443 番ポートの割合は、54%で前回から2ポイント増加しました。HTTPのTCP80番ポートの割合は17%から12%に減っています。QUICプロトコルで使われるUDP443番ポートは、11% から16%に増えていて、HTTPの減った分とQUICの増えた分がほぼ同じです。
減少傾向のTCPの動的ポートは、2021年には6%にまで減りました。動的ポートでの個別のポート番号の割合は僅かで、最大の31000番でも0.6%となっています。また、Flash Playerが利用する1935番が0.2%ありますが、これら以外のトラフィックは、ほとんどがVPN関連です。
表-4はモバイル利用者のポート使用割合です。全体的にはブロードバンドの数字に近い値となっています。これは、スマートフォンでもPCと同様のアプリケーションを使うようになってきたことに加え、ブロードバンドにおけるスマートフォンの利用割合が増えているからだと思います。
図-10は、ブロードバンド全体トラフィックにおける主要ポート利用の週間推移を、2020年と2021年で比較したものです。TCPポートの80番、443番、1024番以上の動的ポート、UDP ポート443番の4つに分けてそれぞれの推移を示しています。グラフでは、ピーク時の総トラフィック量を1として正規化して表しています。2020年と比較すると、UDP443番ポートがTCP80番ポートより大きくなったことが分かります。昨年観測された平日昼間のトラフィック増加分が少し減っているのが分かります。全体のピークは19時から23時頃です。
図-11のモバイルでは、トラフィックの大半を占めるTCP80番ポートと443番ポート、UDP443番ポートについて推移を示します。2020年と比較すると、ここでもUDP443番ポートが更に増えていることに加え、昼休みのピークがよりはっきりと観測できるようになっています。ブロードバンドに比べると、朝から夜中までトラフィックの高い状態が続きます。平日には、朝の通勤時間、昼休み、夕方17時頃から22時頃にかけての3つのピークがあり、ブロードバンドとは利用時間の違いがあることが分かります。
この1年半のコロナ禍のトラフィック状況を振り返ると、昨年の3月から5月は、人の移動が止まって在宅率が上昇した結果、平日昼間のブロードバンドトラフィックが大きく増えました。しかし、この期間を除くとトラフィック量は概ね成長曲線に乗って順調に伸びています。つまり、コロナ禍でトラフィック増加は年率40%程度に上昇したものの、当初危惧された劇的な増加にはならず、感染状況に伴う在宅率の変化による増減はあるものの、全体としては堅調な増加を続けています。
また、ボトルネックなどの制約のあるPPPoEに比較して、IPoEのトラフィックが大きく伸びていて、ブロードバンド全体の伸びを牽引しています。今後もIPoEの利用拡大が続くと思われます。
執筆者プロフィール
長 健二朗(ちょう けんじろう)
株式会社IIJ イノベーションインスティテュート 技術研究所所長。
ページの終わりです