[SQL SERVER][SSAS] Data Mining(1)
這裡我參考 MSDN 的教學課程,自己紀錄 SSAS Data Mining工具使用過程。
目標:
針對已購買自行車的客戶找出值得注意客戶,
同時希望也可以預測未來最有可能購買自行車的潛在客戶。
1.建立 Data Source 和 Data Source View 方法可參考[SQL SERVER][BI] 多維度報表(1)
2.建立採礦模型結構
透過決策樹演算法會識別與可預測資料行相互關聯的輸入資料行,
決策樹就是依據傾向於特定結果的趨勢來產生預測。
案例資料表選擇 vTargetMail
勾選BikerBuyer為可預測,並按下建議。
輸入重要程度可做為影響預測的因素。
(系統會自動選取具有重大相互關聯性的資料行 (信心大於 95%),使其包含在模型中。)
有幾個重要因素會影響購買自行車意願 Age、TotalChildren、NumberChildrenAtHome、YearlyIncome
3.新模型加入採礦結構
輸入 TM_Clustering並選擇Microsoft_Clustering。
Microsoft_群集演算法可以尋找關於腳踏車通勤者之其他較不明顯的特性,
這些群集對於瀏覽資料、識別資料的異常,以及建立預測很有幫助。
切換到採礦模型即可看到Microsoft_Clustering模型。
部署和處理採礦模型。
到這裡你已經知道該如何新增採礦結構並加入其他採礦模型,
並且你也知道輸入的重要程度是影響預測趨勢結果的因素,
後面我們將會分析,年紀、年收入、孩子數量..等因素如何影響購買力,
以及你如何找出最有可能購買自行車的潛在客戶。
參考