結局、データマイニングって何なの?


出典:photo-ac.com
「データマイニング」「ビッグデータ」「機械学習」「クラウドコンピューティング」…。
テクノロジーが進化していくとともに、さまざまな概念と言葉が溢れてきます。
 
ITを専門としていない人種からすると、こういった言葉の意味は実に曖昧です。
似たような響きのカタカナ語も多く、アレルギーを持っている人も少なくないと思います。
 
従来ならば「自分はIT系ちょっと苦手で…」なんてお茶を濁すこともできましたが、最近のビジネス界ではそうはいきません。
ビジネスとITの距離がより密接になり、ビジネスパーソンはIT系用語を当たり前のように扱えることが求められています。
 
なんとなく意味は分かるけど、明快に説明しろといわれると難しいIT系用語。
その意味を理解するコツは、“比較”にあります。
 
今回は「データマイニング」の詳しい意味を学んでみましょう。
 

データマイニングとは? まずは定義とメリットから


出典:pakutaso.com
何にせよ、まずはデータマイニングの定義から見てみましょう。
データマイニングは「大量のデータから、有用な知識(パターン)を見つけ出す手法」のことを指します。
 
まさしく“データの鉱脈”から“価値の高いデータ”をマイニング(採掘)する技術のことです。
 
データマイニングのメリットは得られた“価値の高いデータ(パターン)”を利用することで得られます。
 
有名な事例が「ビールとおむつ」です。
アメリカのとあるスーパーマーケットチェーンが行ったデータマイニングの結果、ビールとおむつを一緒に購入している顧客が多いというパターンが得られました。
そこでこの2つを並べて売ってみると売上が伸びたのです。
 
実はこの事例は事実関係が曖昧で、半ばデータマイング界の都市伝説と化しているのですが、データマイニングのメリットがよくわかるエピソードの1つです。
 
データマイニングは大量のデータから戦略上有用なデータを抽出することで、そのメリットはもちろんそのデータによって有効な戦略を策定できることなのです。
 

統計分析とデータマイニングは違うもの?


出典:photo-ac.com
データ(情報)を扱う知識・技能体系といえば統計学
ビジネスの世界でも統計学的な分析は数多く行われてきました。
 
しかし今学んでいるデータマイニングもデータ(情報)を扱う手法のはずです。
「あれ、データマイニングって横文字にしただけで結局は統計分析と同じじゃない?」
 
もちろんそんなことはなく、両者には明確な違いが存在しているのです。
 
その違いとはずばり、「仮説があるかないか」です。
 
統計分析は通常、事前に何らかの仮説を立てておくものです。その仮説と使用するデータに基づき適切な分析手法を選択して行われます。
 
対して、データマイニングは新たな知識を発掘(発見)することを目的としており、明確な仮説が存在しません。
 
仮説に基づき手法を選択していくのが統計学的手法で、とにかくデータを分析して使えるパターンを探し出すのがデータマイニングです。
 
*統計学的手法をデータマイニングの1種とする考え方もありますが、今回はデータマイニングを知識発見的手法として位置付けています。
 

機械学習とデータマイニングも似ている?


出典:photo-ac.com
この時点で「機械学習」を知っている方は気付いたかもしれません。
 
大量のデータから、仮説を用いず、有用なパターンを探し出す。
「これって、機械学習と一緒じゃない?」
 
お察しの通り、データマイニングの基本的なスタンスは機械学習と同じです。
では違いは何でしょうか?
 
答えは単純で、「得られたデータを誰が使うのか」です。
 
機械学習ではAIが使います。学習し、成長することを目的としています。
一方、データマイニングで得られたデータを使うのは人間です。マーケターや教育者、経営者などがそれぞれの戦略のために用います。
 
ではAIがマーケティング戦略を作ったり教育をしたりするとどうなるでしょう。
「常時データマイニング状態」です。
 

ビッグデータとデータマイニングの関係は?


出典:gahag.net
最後にビッグデータとデータマイニングの関係も見ておきましょう。
 
ビッグデータも曖昧なIT用語筆頭ですね。
 
ビッグデータとデータマイニングの関係は明快、「親子」です。
ビッグデータが親、データマイニングが子供です。兄弟に機械学習やディープラーニングがいます。
 
何が言いたいかというとビッグデータはデータマイングの前提だということです。
大量のデータを処理できるだけでは、データマイニングの目的である有用な知識を発見することにはつながりません。
大量の非構造データから有効なパターンを見つけられるビッグデータが存在したからこそ、データマイニングも生まれることできたのです。
 

データマイニングで創る新たな戦略


出典:pakutaso.com
データマイニングの意味をより深く理解できたでしょうか?
 
他の概念と比較することでおぼろげだった輪郭がはっきりすることは多いです。
「わかる」とは「分かる(分ける)」こととも言います。
 
機械学習と深層学習(ディープラーニング)の違い、ビッグデータと従来のデータベースの違いSaaS・PaaS・IaaSなどなど。
IT用語は比較して、マスターしていきましょう。

【よく読まれている記事】
総利用者数300人突破!! 「起業の科学」著者田所雅之氏による、ここだけでしか見れないコンテンツ

『enfacスタートアップサイエンス』は、世界で5万回シェアされたスライド「StartupScience」制作者の田所雅之氏が、書籍300冊、経営者のブログ500本、自身のシリコンバレーでの起業経験と1000人以上の起業家を取材する中で体系化した知識を、動画ラーニングのenfacが、いつでもどこでも学びやすくまとめた動画学習コンテンツです。


2017年6月より1年間をかけて企画・撮影した105本。今後も、毎月2-3本新しいコンテンツをリリースし、学びを深めていくことをサポートします。
コンテンツを学習することで、「試行錯誤で時間を浪費する」「チーム内で噛み合わないコミュニケーションを続ける」などの無駄を省き、チームが本来の目的や使命に向かってより効果的に進むことができます。

これ以上は記事がありません

読み込むページがありません

おすすめの記事