數(shù)據(jù)挖掘用處當(dāng)然很大,但是我們要知道數(shù)據(jù)挖掘、數(shù)據(jù)分析只是工具,是要完成我們對業(yè)務(wù)的訴求的。舉個(gè)例子:在大海上,孤零零地屹立著礦井,想要開采出石油。
普通人,對于大海是沒有感覺的,更不用說找到寶藏了。但是對于專業(yè)的石油開采人員來說,大海在他們眼里是一座寶藏,他們勘探坐標(biāo),用開采工具,找到寶藏。數(shù)據(jù)挖掘?qū)ζ髽I(yè)和個(gè)人的作用也是如此,對數(shù)據(jù)更加敏感,找到其背后的規(guī)律,就能為你帶來效益。
數(shù)據(jù)分析、數(shù)據(jù)挖掘?qū)τ谄胀ㄈ藖碚f更像是個(gè)專業(yè)的名詞,數(shù)據(jù)分析師們實(shí)際上也是在做一些支持性的工作。
對于一個(gè)商品在未來的銷售情況,1、我們首先明確我們的目的:是要找到商品未來的銷售情況。2、我們嘗試收集商品過往的數(shù)據(jù),對數(shù)據(jù)進(jìn)行探索,包括數(shù)據(jù)簡單描述、數(shù)據(jù)質(zhì)量驗(yàn)證等。3、我們開始收集數(shù)據(jù),對數(shù)據(jù)進(jìn)行清洗,集成,完成數(shù)據(jù)挖掘前的準(zhǔn)備工作。4、我們選擇和應(yīng)用各種數(shù)據(jù)挖掘模型,并進(jìn)行優(yōu)化。5、對模型進(jìn)行評估,確認(rèn)模型是否實(shí)現(xiàn)了預(yù)期的商業(yè)目標(biāo)。6、將數(shù)據(jù)可視化,方便后續(xù)監(jiān)控和維護(hù)。
其中可能還會用到相關(guān)的算法:如 Apriori 算法來揭示各商品之間的關(guān)系。以上便是數(shù)據(jù)挖掘的六步:簡記為:1、商業(yè)理解。2、數(shù)據(jù)理解。3、數(shù)據(jù)準(zhǔn)備。4、模型建立。5、模型評估。6、呈現(xiàn)結(jié)果
完成這六步,你想要的結(jié)果自然可以得出。