ビッグデータ≠大量のデータ


出典:gahag.net
『ビッグデータ』
もはやこのワードはビジネスパーソンにとって一般的なものでしょう。
しかし、いざ厳密な説明を求められると詰まってしまう人も多いのではないでしょうか?
 
IT用語の常で、曖昧な理解のまま使えてしまうのです。
そんな曖昧なワードや概念を理解するために使える方法があります。
 
それは類似のワード・概念との比較によってその輪郭をはっきりさせる方法です。
今回はビッグデータと既存のデータ管理システムRDBと比較していきます。
 
ビッグデータはただ「大きい」だけではないのです。
ぜひきちんとその輪郭を把握してみましょう。
 

ビッグデータとは? 定義をしっかり押さえよう


起業tv編集部作成
比較の前にまずは定義と「3つのV」を押さえておくことにしましょう。
 
ビッグデータの定義は、“一般的なデータ管理・処理ソフトウエアで扱うことが困難なほど巨大で複雑なデータの集合”と某百科事典にはあります。また、このデータの集合を分析処理することで、新しい発見を行っていくのがビッグデータの強みとなっています。
 
実はビッグデータの厳密な定義は明確には統一されていなかったりしますが、技術的にはいくつかの特性のようなものが定義されています。
その中でも有名なのは、IT系調査会社Gartnerが提唱する「3つのV」です。
 

Volume(データ量)

第1のVはデータ量です。
ビッグデータの最も浸透しているイメージであり、この大量のデータを処理するからこそ正確かつ面白みのある分析結果が出るのでしょう。
 

Velocity(データ速度)

第2のVはデータ速度です。
データを処理する速度ももちろんですが、データ収集の速度・リアルタイム性も重要です。IoTなどの発展により日々大量のデータが集まる社会になりました。
 

Variety(多様性)

第3のVは多様性です。
おそらくビッグデータにおいて最も重要な特徴となります。
データの多様性とは、例えば顧客層と売上高だけで分析するのではなく、日時・天候・陳列の様子・エリアの競合の動きなど様々な要素を統合的に分析していくことを指します。
 
では定義と3つのVがわかったところで、いよいよRDBと絡めながら見ていきましょう。
 

ビッグデータとRDB

RDB(Relational Database)は関係データベースとも呼ばれ、広く使われているデータ管理手法です。
RDBでは「表」のように「行」と「列」をデータに与え、構造的にデータを管理します。イメージとしてはExcelのような感じですが、実際にはもう少し複雑です。
 
RDBは構造的なデータの扱いでは圧倒的な価値を誇ります。
 
しかしながらデータ・ドリブン・マーケティングの台頭により企業はより高度なデータ分析を求め始めました。さらにセンシング技術の発達によりデータ収集手段は多様化し、蓄積されるデータはいわゆる「非構造化データ」と呼ばれるものに代わっていきます。
 
もしRDBでこれらの課題に対応しようとすればサーバー代などで膨大なコストがかかります。
そこで生まれたのが「ビッグデータ」です。

起業tv編集部作成
上記の表はビッグデータとRDBの簡単な比較です。
見ての通り、ビッグデータとRDBは同じデータ管理システムで大きく異なるものです。
そのため、使う目的でしっかりと区別する必要があります。
 
例えば、ビッグデータはマーケティングリサーチのためのデータマイニングに使われます。ここでは非構造的なデータを高速で処理する必要が出てきます。
ビッグデータでは細かい処理の違いを許容することで速度とコストパフォーマンスを共存させています。
マーケティングリサーチのために買い物の合計重量を分析する場合、mg単位の違いを分析してもあまり意味はないでしょう。
 
しかし銀行ではどうでしょう。
1円レベルの違いを許容しても大丈夫でしょうか?
 
ビッグデータの方があらゆる点で優れているわけではなく、役割分担が大切なのです。
 

ビッグデータがもたらすメリットと日本

ビッグデータは大量の複雑な情報の中から新たな価値を生む情報(知識)を発見します。
この辺りは『データマイニング』の記事に詳しくあります。

これまでは処理しきれなかった大量でリアルタイムな非構造化データ。
資源に関しては乏しいと言われる日本ですが、この手の「情報資源」は毎日大量に生み出されています。
ビッグデータがもたらすメリットを日本の企業がどのように活用していけるか、注目してみましょう。
 

ビッグデータの先にあるもの


出典:photo-ac.com
ビッグデータ、一見理解できていそうで実は理解できていないIT用語。
ビジネスで使うのなら確実に理解しておきたいですよね。
そんな時には「比較」がおすすめです。
類似の概念や、系統的に繋がっている概念と比較することで、理解したい概念の輪郭が見えてくることがあります。
 
ビッグデータを理解して、ビッグデータの先にある世界はどんなものなのか、考えてみましょう。

【よく読まれている記事】
総利用者数300人突破!! 「起業の科学」著者田所雅之氏による、ここだけでしか見れないコンテンツ

『enfacスタートアップサイエンス』は、世界で5万回シェアされたスライド「StartupScience」制作者の田所雅之氏が、書籍300冊、経営者のブログ500本、自身のシリコンバレーでの起業経験と1000人以上の起業家を取材する中で体系化した知識を、動画ラーニングのenfacが、いつでもどこでも学びやすくまとめた動画学習コンテンツです。


2017年6月より1年間をかけて企画・撮影した105本。今後も、毎月2-3本新しいコンテンツをリリースし、学びを深めていくことをサポートします。
コンテンツを学習することで、「試行錯誤で時間を浪費する」「チーム内で噛み合わないコミュニケーションを続ける」などの無駄を省き、チームが本来の目的や使命に向かってより効果的に進むことができます。

これ以上は記事がありません

読み込むページがありません

おすすめの記事