Contents
結局、データマイニングって何なの?
出典:photo-ac.com
「データマイニング」「ビッグデータ」「機械学習」「クラウドコンピューティング」…。
テクノロジーが進化していくとともに、さまざまな概念と言葉が溢れてきます。
ITを専門としていない人種からすると、こういった言葉の意味は実に曖昧です。
似たような響きのカタカナ語も多く、アレルギーを持っている人も少なくないと思います。
従来ならば「自分はIT系ちょっと苦手で…」なんてお茶を濁すこともできましたが、最近のビジネス界ではそうはいきません。
ビジネスとITの距離がより密接になり、ビジネスパーソンはIT系用語を当たり前のように扱えることが求められています。
なんとなく意味は分かるけど、明快に説明しろといわれると難しいIT系用語。
その意味を理解するコツは、“比較”にあります。
今回は「データマイニング」の詳しい意味を学んでみましょう。
データマイニングとは? まずは定義とメリットから
出典:pakutaso.com
何にせよ、まずはデータマイニングの定義から見てみましょう。
データマイニングは「大量のデータから、有用な知識(パターン)を見つけ出す手法」のことを指します。
まさしく“データの鉱脈”から“価値の高いデータ”をマイニング(採掘)する技術のことです。
データマイニングのメリットは得られた“価値の高いデータ(パターン)”を利用することで得られます。
有名な事例が「ビールとおむつ」です。
アメリカのとあるスーパーマーケットチェーンが行ったデータマイニングの結果、ビールとおむつを一緒に購入している顧客が多いというパターンが得られました。
そこでこの2つを並べて売ってみると売上が伸びたのです。
実はこの事例は事実関係が曖昧で、半ばデータマイング界の都市伝説と化しているのですが、データマイニングのメリットがよくわかるエピソードの1つです。
データマイニングは大量のデータから戦略上有用なデータを抽出することで、そのメリットはもちろんそのデータによって有効な戦略を策定できることなのです。
統計分析とデータマイニングは違うもの?
出典:photo-ac.com
データ(情報)を扱う知識・技能体系といえば統計学。
ビジネスの世界でも統計学的な分析は数多く行われてきました。
しかし今学んでいるデータマイニングもデータ(情報)を扱う手法のはずです。
「あれ、データマイニングって横文字にしただけで結局は統計分析と同じじゃない?」
もちろんそんなことはなく、両者には明確な違いが存在しているのです。
その違いとはずばり、「仮説があるかないか」です。
統計分析は通常、事前に何らかの仮説を立てておくものです。その仮説と使用するデータに基づき適切な分析手法を選択して行われます。
対して、データマイニングは新たな知識を発掘(発見)することを目的としており、明確な仮説が存在しません。
仮説に基づき手法を選択していくのが統計学的手法で、とにかくデータを分析して使えるパターンを探し出すのがデータマイニングです。
*統計学的手法をデータマイニングの1種とする考え方もありますが、今回はデータマイニングを知識発見的手法として位置付けています。
機械学習とデータマイニングも似ている?
出典:photo-ac.com
この時点で「機械学習」を知っている方は気付いたかもしれません。
大量のデータから、仮説を用いず、有用なパターンを探し出す。
「これって、機械学習と一緒じゃない?」
お察しの通り、データマイニングの基本的なスタンスは機械学習と同じです。
では違いは何でしょうか?
答えは単純で、「得られたデータを誰が使うのか」です。
機械学習ではAIが使います。学習し、成長することを目的としています。
一方、データマイニングで得られたデータを使うのは人間です。マーケターや教育者、経営者などがそれぞれの戦略のために用います。
ではAIがマーケティング戦略を作ったり教育をしたりするとどうなるでしょう。
「常時データマイニング状態」です。
ビッグデータとデータマイニングの関係は?
出典:gahag.net
最後にビッグデータとデータマイニングの関係も見ておきましょう。
ビッグデータも曖昧なIT用語筆頭ですね。
ビッグデータとデータマイニングの関係は明快、「親子」です。
ビッグデータが親、データマイニングが子供です。兄弟に機械学習やディープラーニングがいます。
何が言いたいかというとビッグデータはデータマイングの前提だということです。
大量のデータを処理できるだけでは、データマイニングの目的である有用な知識を発見することにはつながりません。
大量の非構造データから有効なパターンを見つけられるビッグデータが存在したからこそ、データマイニングも生まれることできたのです。
データマイニングで創る新たな戦略
出典:pakutaso.com
データマイニングの意味をより深く理解できたでしょうか?
他の概念と比較することでおぼろげだった輪郭がはっきりすることは多いです。
「わかる」とは「分かる(分ける)」こととも言います。
機械学習と深層学習(ディープラーニング)の違い、ビッグデータと従来のデータベースの違い、SaaS・PaaS・IaaSなどなど。
IT用語は比較して、マスターしていきましょう。