ページの先頭です


ページ内移動用のリンクです

  1. ホーム
  2. IIJの技術
  3. セキュリティ・技術レポート
  4. Internet Infrastructure Review(IIR)
  5. Vol.23
  6. 3.技術トレンド

Internet Infrastructure Review(IIR)Vol.23
2014年5月28日
RSS

目次

3. 技術トレンド

ビッグデータ解析の現状

本レポートでは、既にエクサバイト級のデータが流通していると推定されるビッグデータの現状ならびに解析基盤の技術動向とそのリアルタイム化に伴うビッグデータ解析の変化について解説します。

3.1 ビッグデータの現状

図-1 データ形式の異なる3種類のデータ

近頃では、至る所で見聞きするようになった「ビッグデータ」ですが、その実態は相変わらず非常に捉え辛いままです。語り手の立場や意見によって「ビッグデータ」の意味するところが大きく異なることや、有効だとされる活用事例が様々な業種をまたいで多岐にわたることが、その主たる原因でしょう。ビッグデータに関わる現状の網羅的な把握を試みた総務省の平成25年度の調査では、国内でのビッグデータの流通量は年々拡大していることが報告されています。

メディア別の流通量では、POS、RFID、GPSから得られるデータの総量が多く、経年推移では医療系データ(電子カルテ、画像診断)とM2M系データ(GPS、RFID)が大きく伸びていると報告されています。この調査では、メディアについて「データは出生が多様で様々な種類に及んでる」とし、「データ形式の異なる3種類のデータに分類される(図-1)」と説明されていますが、データ分析の視点から見ると非構造データ(新)に分類されるデータ群の中には、POS、RFID、GPSなどのように標準フォーマットが規定されている(すなわち構造化されている)事例もありますし、映像や音声、テキストなどのストリームデータでも、タイトルや著作者などのメタ情報を内蔵する事例があるので、実際には、構造型データと非構造型データを内包する複合型のデータと理解するべきでしょう。図-2は、国内で流通するビッグデータは非構造化データよりも構造化データが圧倒的に多いことを示しています。

図-2 ビッグデータ流通量の推計

図-2 ビッグデータ流通量の推計(※1)

次に、産業別でのビッグデータの流通量(図-3)と蓄積量 (図-4)の推定値について、総務省の調査では次のように報 告しています。

図-3 ビッグデータ流通量の推移(産業別)

図-3 ビッグデータ流通量の推移(産業別)(※2)

図-4 ビッグデータ蓄積量(産業別、2012年)

図-4 ビッグデータ蓄積量(産業別、2012年)(※3)

この推定の大変興味深いところは、流通量に関しては(不動産業を除くと)概ね同じ特性で増加しているのに対し、蓄積量は業種ごとに大きく異なることです。ビッグデータの蓄積量は、その利活用の度合いを表しているとすれば、これは業種ごとのビッグデータ利活用に対する取り組みの温度差を示していると理解することもできますが、業界ごとの慣行の違いが反映されている可能性もあります。産業別の蓄積量では、BtoBの業種よりもBtoCの業種の方が蓄積量は多いこと、更に、ビッグデータの多くが所有者の内部に留まっている非公開データであることにも注目されます。

総務省の調査結果に基づけば、既にエクサバイト級のデータが流通していると推定されることから、「ビッグデータの利活用は始まっている」と主張しても良いでしょう。しかしながら、「大量のデータソースから収集・蓄積したビッグデータを選別・分析することにより、新たな知見を得る」というビッグデータ本来の利活用は、端緒についたところという現状が浮かび上がってきます。

さて、今後のビッグデータの利活用を促進・加速する「ビッグデータに関わる今日的な課題」という議論では、「ビッグデータの共有化をどのよう、促進するのか?」、また、「ビッグデータの解析により、どのような新たな知見を得られるのか?」の2つの課題が掲げられることが多いのですが、その文脈で頻繁に語られるのが、M2M、IoT、CPSの3つのキーワードです。各々の定義を確認すると、Machine-to-Machine(M2M)は、有線や無線の通信システムを用いて同じ種類のデバイスの間でのコミュニケーションを可能にする技術、Internet of Things(IoT)は、インターネットのような構造の中で仮想的に表現されるユニークに識別可能なオブジェクト、Cyber-Physical System(CPS)は、物理的な実体を制御する協調型計算エレメントによるシステムということで、各々は独立した概念というよりは、センサーなどのデバイスから構成されるネットワークに対して、3つの視点を提示していると理解するべきなのかもしれません。例えば、RFIDタグを用いた荷物の集配管理システムでは、個々の荷物にRFIDタグが付与されますが、その荷物がRFIDリーダーの近傍を通過すると、その位置情報を付加されたデータが生成されます。このデータを蓄積しておいて任意の荷物について位置情報をトレースすると、その荷物がどういう経路で移動して、現在どこで保管されているのかを調べることができます。更に、集配管理システムが取り扱うすべての荷物についてトレースすれば、荷物が集中している配送センターを正確に把握することができます。スマートフォンが普及した今日では、同じ方法で人間の動態も把握できるわけですが、各デバイスが生成するデータを集めるとビッグデータが形成され、業務の最適化やマーケティングに有益な知見が得られると考えられています。

3.技術トレンド

ページの終わりです

ページの先頭へ戻る