[SQL SERVER][SSAS] Data Mining(1)

[SQL SERVER][SSAS] Data Mining(1)

這裡我參考 MSDN 的教學課程,自己紀錄 SSAS Data Mining工具使用過程。

 

目標:

針對已購買自行車的客戶找出值得注意客戶,

同時希望也可以預測未來最有可能購買自行車的潛在客戶。

 

1.建立 Data Source 和 Data Source View 方法可參考[SQL SERVER][BI] 多維度報表(1)

2.建立採礦模型結構

image

 

image

透過決策樹演算法會識別與可預測資料行相互關聯的輸入資料行,

決策樹就是依據傾向於特定結果的趨勢來產生預測。

 

image

案例資料表選擇 vTargetMail

 

image

勾選BikerBuyer為可預測,並按下建議。

 

image

輸入重要程度可做為影響預測的因素。

(系統會自動選取具有重大相互關聯性的資料行 (信心大於 95%),使其包含在模型中。)

有幾個重要因素會影響購買自行車意願 Age、TotalChildren、NumberChildrenAtHome、YearlyIncome

 

image

image

 

3.新模型加入採礦結構

image

輸入 TM_Clustering並選擇Microsoft_Clustering。

Microsoft_群集演算法可以尋找關於腳踏車通勤者之其他較不明顯的特性,

這些群集對於瀏覽資料、識別資料的異常,以及建立預測很有幫助。

 

image

切換到採礦模型即可看到Microsoft_Clustering模型。

 

image

部署和處理採礦模型。

 

 

image

到這裡你已經知道該如何新增採礦結構並加入其他採礦模型,

並且你也知道輸入的重要程度是影響預測趨勢結果的因素,

後面我們將會分析,年紀、年收入、孩子數量..等因素如何影響購買力,

以及你如何找出最有可能購買自行車的潛在客戶。

 

 

 

參考

資料採礦基本教學課程

Microsoft 決策樹演算法

Microsoft 群集演算法

針對採礦模型和採礦結構使用鑽研 (Analysis Services - 資料採礦)