[Power BI] 讀書會 #6 Power BI建立資料連結


  前面花了四篇篇幅簡單介紹Power BI所運用的技術,往後幾篇會著重介紹Power BI Desktop的三個模組:Power Query、Power Pivot、Power View。本篇會簡單介紹Power BI跟資料源建立連結。

1. 開始畫面

開始畫面

2. 資料匯入畫面

資料匯入畫面
  微軟花了很多功夫在建立各種資料來源的資料擷取,是個功能超強大的爬蟲功能。由上圖可以看出,舉凡地端的檔案、資料庫,再到雲端的SSAS、Azure、Google Analytics...等,可以將資料變成Table的樣式匯入到Power BI Desktop。建立連結時,除了將資料源名稱和中繼資料產生在Power BI之外,還會產生連結該種資料源的Connection String,以便Power BI檔案上傳到雲端Service或地端Server在Refresh資料後,能夠知道要去哪個位置、使用哪個身份認證來取得資料。在跟各種資料源建立連結時,有兩種模式可以選擇:Import Mode和DirectQuery Mode。

3. Import Mode

  Import Mode指的是Power BI會以本篇介紹的VertiPaq演算法,將資料縮小後儲存在自身的檔案內。Import Mode有以下特點:
(1) 如果資料量越多,則Power BI的檔案(.pbix)越大。
(2) 所有「檔案」類型的資料源,均以Import Mode將資料載入。
(3) 是微軟官方推薦的載入資料源方法,原因在於它是以VertiPaq演算法儲存,有一套自己的搜尋資料方式(DAX語法)。
(4) 資料分析時,是將所有資料匯入記憶體,所以記憶體需要夠大,如果是用手機或平板的話,需要注意一不小心就會撐爆記憶體。

4. DirectQuery Mode

  DirectQuery Mode顧名思義就是「直接查詢」,有以下幾個特點:
(1) 在跟資料源建立連結時選擇DirectQuery,Power BI Desktop只會產生資料表名稱(Source Name)和中繼資料(Metadata),並不會將資料匯入,所以檔案容量不會因為資料量的多寡而改變。
(2) 此種模式支援資料庫類型的資料源。
(3) 如果有在DB資料源上使用DAX語法,則Power BI的演算法會動態產生SQL語法到DB撈資料。
(4) 建議一次查詢時的返還速度要小於5秒,以免User一直抱怨。

下一篇會介紹Power Query,用來做Data Cleansing和Data Shaping。

#Import Mode #DirectQuery Mode #Data Source







Related Posts

MTR04_0626

MTR04_0626

建立映像檔使用Dockerfile

建立映像檔使用Dockerfile

覺得 JavaScript function 很有趣的我是不是很奇怪

覺得 JavaScript function 很有趣的我是不是很奇怪






Comments