PowerPivot 入門觀念
這一陣子花點時間 Study SQL Server 2012 的 BI 相關資料,剛開始接觸的時候所有相關資料似乎都介紹要去使用 PowerPivot for EXCEL,初次聽到的時候總覺得微軟是不是在新版本的 Excel 中有了新的 Pivot 的強化版,而在相關 Lab 和文件中測試和了解之後,發覺我真的是搞錯了。在微軟 Technet 上面有篇文章 PowerPivot for Excel Tutorial Introduction ( http://technet.microsoft.com/en-us/library/gg413497.aspx ),我引用最前面介紹的一段:
PowerPivot is an add-in for Microsoft Excel 2010 that enables you to import millions of rows of data from multiple data sources into a single Excel workbook, create relationships between heterogeneous data, create calculated columns and measures using formulas, build PivotTables and PivotCharts, and then further analyze the data so that you can make timely business decisions without requiring IT assistance.
從上述的說明中我們可以看到幾個有關於 PowerPivot 的重點:
- 在 Excel 2010 中他不是內建的一個功能,你必須安裝一個增益集之後才能有的功能。至於 Office 2007 之前的版本則無法使用,而 Office 2013開始則是內含有這樣的功能。
- 他跟原本 Excel 所提供的載入外部資料的有些相識,讓你可以透過他來讀取各種資料來源 ( EX: SQL Server , Oracle , Excel , 文字檔等 ),而且不受限資料來源的筆數,可以處理百萬筆以上的資料做快速的資料分析。
- 原本的 Excel 載入外部資料只能讀取 Table or View,功能比較陽春。但配合 PowerPivot 之後可以自己組合 SQL 指令去載入資料,載入之後可以用 Data Analysis Expressions (DAX) 語法 ( 有些類似 Excel 的函數 ) 去產生一些計算欄位 ( 比較簡單的像是把日期資料取出年、季、月,或者是做一些數量乘單價算出總額的欄位運算 )
- 使用 Column Stored 的壓縮技術來存放和管理資料,配合 PowerPivot 所儲存的 xlsx 檔案可以用 zip 來解壓縮 ( 可以把副檔名從 .xlsx 改為 .zip ),就可以在這個壓縮檔開啟後在 \xl\customData 的目錄下看到有 item1.data,這個就是 PowerPivot 連接資料庫後取出來的資料。
- 可以利用 Excel 快速的建立出豐富的圖表資料和分析結果,可以減少 IT 人員的投入處理。這樣的結果也可以透過佈署到 SharePoint 2010 上面(需配合PowerPivot for SharePoint ),配合定時更新資料和 Silverlight 的效果,讓更多的使用者可以使用這樣的結果。
後記 :
當在跟朋友分享 PowerPivot 的時候,有朋友問到「那這個跟 SQL Server 2012 似乎沒有關係啊?」「要是我連的是 Oracle,那我要買 SQL Server 才能用嗎 ?」。我個人是覺得這個算是微軟 BI Solution 上的一個魚餌吧,基本上你使用 PowerPivot for Excel 的時候,的確是跟 SQL Server 沒有太大的關係,但當你要佈署到 SharePoint 上面去,或者是要建立 Tabular 的時候,那個時候才會真正跟 SQL Server 真正的有關係了。