[新科技速遞][Tableau] [數據模型Data Model]
新科技速遞
數據BI市場之中,除了Salesforce.com收購的Tableau,Microsoft的Power BI都是業務分析的重要工具,第三家就是較小規模的Qlik。三家都是在Gartner魔力鏡象領導位置,2020年Power BI仍是領先者。
嚴格而言,建立不同數據來源的關係,即不同表格的關係,可統稱為數據模型(Data Model),從不同表格的不同欄位,再建立新關係報表,不須將眾多表格合併成為同一寬長的報表。從多數據來源的建模,也是Power BI和Qlik強項,Tableau也終於推出數據建模。
Tableau強於快速將數據視覺化,建立可視化圖表分析數據,快速找出走勢和多邊的關係。近期Power BI也加入了AI,數據可視化能力更強。Microsoft 亦為Excel加入AI,自動視覺化數據,變成了Excel標準功能。
邏輯層打通跨表
Power BI從開始,就能處理各種跨表計算,毋須事前合併所有表在一起。Power BI的Tabular Model承傳自SQL Server,降低數據分析的門檻。
數據模型實現各種跨表的運算, Microsoft的DAX(Data Analysis Expressions)可應用在Power BI與數據互動,除了運算功能包括在DAX,例如啟動和關閉特定的數據關係;Power BI利用「語義層」(Semantic layer )建立跨表的邏輯關係,動態建立不同來源數據的分析運算,模型計算可說 Power BI的 強項,DAX也賦與分析強大功能, 一開始就是面向模型的工具(Model-based tool),DAX橫跨多項產品,應用於Power Pivot和SSAS。
有人以DAX與Excel的VLookup函數相比,可從原有數據產生新的數據。不過DAX針對關聯數據庫,速度更高,功能更廣,可產生更複雜的報表。
以往Tableau 通過聯接方式合併一張出實體的「寬表」(Wide Fact Table),費時失事,難以維護,也有大量的數據冗餘,源於Tableau 一直缺乏「語義層」,也難在數據模型上展開有效計算。Tableau新推出Tableau 2020.2版本,終於加入新數據模型,具備實體層聯接據之餘,加入語義層以建立「邏輯層」(Logical Layer)的「關係」,更易混合多來源數據作分析,支援跨表和不同詳細級別的分析。
Tableau的數據建模技術,宣稱還可降低建立報表難度,無需編程或撰寫腳本;從多個數據庫表和顯示不同層次的詳細分析;只透過滑鼠拖放,建立連接多個表的「關係」(Relationships),自動創建集合,省去複雜編碼流程,避免傳統數據庫連接遇到的不準確性風險。例如透過常見郵遞區號 ID 字段,建立銷售訂單表與歷史退貨表的關聯,以規畫某一區預期產品退貨率。關係還可提高查詢效率和執行方法,數據來源也更易維護。
對於Power BI用戶,Tableau的數據模型,可能沒太大新意;對Tableau用戶來源,多數據來源模型,卻是全新的突破,處理數據源時多了一個選擇,也更易管理。
KPI流動為先
高層管理慣以流動設備監察業務表現,新版2020.2也提供了「指標」(Metrics)正式版本,支援以流動設備,監測業務的關鍵績效指標(KPI),也就指管理層關注的各項業務指標。
Tableau Software 產品總監 Francois Ajenstat 指:「機構確保所有人能基於數據快速決策。Tableau 2020.2 版本減少分析複雜數據的工作。」
房產投資管理機構 JLL 商業情報全球總監 James Baker 說:「過去,我們花時間設計和構建倉庫的數據模型優化分析。如今透過設定「關係」,同時引入多個表,毋須運算或自定 SQL語言,以適當級別聚合數據,減少管理數據來源的總量。」
指標從多個內部儀表板整合重要數據,自行定義關鍵數據的可視圖示,透過推送即時通知 Tableau Mobile 應用,也可以瀏覽器顯示。指標無需深挖儀錶板或調整濾鏡,才能查看最新的數據。
3D 渲染和可視化提供商 Enscape 數據分析員 Dominik Ruf 表說:「指標提供KPI,例如環比和同比收入、客戶流失率、升級或降級訂閱。指標也在手機上提供決策所需數據的個性化視圖。」
Tableau開始支持Esri ArcGIS,直接在 Tableau 視覺化 Esri 地理空間數據,解決更多位置相關問題。Tableau 2020.2新版本詳解:https://www.tableau.com/products/new-features