現代社會強調數字管理,不少行政人員每天建報表,以分析業務動向。但數據儲存不同位置,必須整合和清理,花去大量時間,建立報表和統計圖表、又要專門知識。全球都缺乏數據科學家,處理海量的大數據。
千里之行,始於足下。隨著數據工具發展,不少桌面,以至雲端工具已發展出高階的功能,簡化建立數據模型,更易掌握如何運用數據作決策。用戶可以利用這些工具,發掘數據的價值。
商業數據產生來源,可以甚為分散;除了大小試算表,也存於數據庫、雲服務、網上應用,數據又有不同格式。現代數字化業務,產生了大量數據,整理後可呈現成圖表,加入不同參度,反覆產生呈現不同關係圖表,發掘數據之間關係,找出業務契機。
上述從數據沙裡淘金,被稱為「商業智慧」(Business Intelligence,BI),以數據先從不同來源,通過ETL工具處理,建立「數據倉庫」(DataWarehouse),然後建立多維度的Data Cube,用戶可以生成不同報表,甚至作出假設分析。一般來說,建立BI主要必須懂得SQL語法,幾乎必須專門工具和技能。
自助服務先驅
但建立BI周期長而成本高,數據又隨時過時。解決方法是建立「自助服務」(Self-service),用戶自己從系統採集數據、編製報表、建立模型;以數據視覺化工具分析,就是Tableau率先提出。Tableau極容易上手,最大優點可導入數據來源和格式極多,採用數據來源超過80多種;從關係數據庫、非結構數據、JSON,甚至雲服務Salesforces等取用數據。
最普遍處理數據的工具,可能仍是Excel試算表。試算表亦有強大分析功能。但建立類似Pivot Table,亦必須具備一定專業水平。後來,Microsoft在Excel上發表了Power BI,可從不同數據來源,建立數據模型。不久。Power BI脫離了Excel成為獨立產品,成為Tableau最大競爭對手。
Tableau於2003年成立,處理關聯數據庫的數據視覺化,後來不斷改進,加入更多數據來源,大幅簡化介面,變成了自助服務BI神器。以Tableau自建分析圖表,可不斷增加數據來源和參數,重覆分析找出數據的關係。
簡化整理數據
但數據表格從不同來源連結一起,必須先整理才能重新作計算。一般用戶只懂導入數據,卻不會整理數據之間關係。
今年Tableau推出了數據預備工具Prep,快速清理從不同來源導入的數據,甚至發現不合理數據;例如某些數值缺失,或數據中不必要內容,或者是與連結的數據不相干,Prep可快速清除數據之間關係,建立相關連結。
Tableau亞太區客戶諮詢高級總監TC Gan說,Tableau不能取代BI作大規模數據採挖,卻可讓用戶快速從多種數據,獲得彼此關係,作出假設再行求求證。
Tableau支援多種模式;包括雲運算和實體服務器,以內存(In-memory)方式執行,速度極快。連接數據庫,亦不一定要下載數據,可直接從數據庫分析,避免複製過多數據。
Tableau大中華區總監Thomas Yap說,Tableau真正理念為培養「數據文化」,任何決定以數據檢視、分析、表達、討論。雖然並非人人都可成數據專家,Tableau縮短學習曲線。Tableau也推出公開網頁,公眾可發表不同數據建立報告,切磋數據儀式板的設計,以數據討論不同議題,相當有趣。