[SQL SERVER][SSAS] Data Mining(3)
5.驗證模型:這步驟就是要驗證相關模型預測是否正確(Data Mining 中的一個重要步驟)。
輸入選擇:
預測值=1。可預測資料行=Bike Buyer。
增益圖:
增益圖會繪製隨機猜測模型及理想的模型。
我們的模型會於隨機猜測與理想或完美預測之間。
現在你可以看出 vTargetMail(決策模型) 預測高於TM_Clustering(群集模型)預測。
前面我們判斷出決策模型預測較為正確,
現在行銷部門想要了解購買自行車是否和性別特性有關,
我們就來建立一個依據客戶性別模型。
新增決策樹模型
輸入TM_Decision_Tree_Male。
設定模型篩選器。
資料行:Gender 、運算子: = 、 值 :M。
確認後執行處理和部署。
針對 女性 請重複上訴動作,結果如下。
檢視結果,並評估篩選過之模型的正確性請參考之前的文章。
模型篩選性別後,結果有些有趣的差異。
男性: 45>=年紀<59 、家中小孩等於0、年收入>=26000、不在北美洲、汽車數量不等於1、全部小孩數量=2 最有購買力。
女性: 38>=年紀<45 、汽車數量等於0、家中小孩不等於3、其中又以家中小孩等於0、年紀>=41 最有購買力。
6.建立處理和預測
我們將會建立一個查詢來預測哪些客戶最有可能購買自行車。
一旦您識別出購買自行車機率很高的客戶之後,您將會鑽研採礦模型中案例的詳細資料,
以擷取這些客戶的名稱和連絡資訊。
採礦模型預測:
選擇輸入資料表
ProspectiveBuyer (dbo)。
結構資料行會自行對應輸入資料表資料行。
修改連接
將可預測的資料行 [Bike Buyer] 對應到輸入資料表資料行。
ProspectiveBuyer新增具名計算:
此運算式將會從輸入資料表的 BirthDate 資料行中計算客戶的年齡。
由於[Age] 已被識別為用來預測自行車購買能力的最具影響力資料行,
所以它必須同時存在於模型和輸入資料表中。
運算式:DATEDIFF(YYYY,[BirthDate],getdate())。
重新設定 AGE 連接對應
設計預測查詢:我們將查詢出最有可能購買自行車的潛在客戶
設計查詢可參考 MSDN 這裡就不多說了。
修改一下查詢,針對機率排序大到小
設計後選擇結果
可以透過第一個資料行(Expression) 判斷潛在客戶,
而你也有客戶電話、姓名、住址..等,這樣你就可以請行銷部門展開銷售活動。
採礦結構上使用鑽研:
由於行銷部門決定,他們也想要傳送郵件給五年以前曾經購買自行車的客戶。
而我將使用鑽研來顯示擁有比較舊的自行車之客戶的姓名和地址,達到這個需求。
設定 AllowDrillThrough= true
採礦模型檢視器選擇案例背景=1,並針對38~45節點鑽研
透過鑽研視窗檢視相關資料
參考