2018年可稱為香港的大數據元年。由業界代表組成的大數據治理公會日前成立,財政司司長陳茂波在典禮中透露,政府準備推出大數據分析平台,逐步開放政府數據,並要求各部門年底前公布開放數據安排,以及收集各界意見。
美國在大數據是先行者,美國總統科學技術顧問委員會(PCAST)2010年的Designing a Digital Future報告指出,隨着AI技術如「深度學習」的興起,加上數碼化發展速度提升,數據呈指數式增長。數據將不止於是數據,而是可以轉化為信息,由信息處理成為知識,因此,責成聯邦政府每個部門和機構,有需要制定一個「大數據戰略」,包括妥善的收集、儲存、維護、管理、分析、共享大數據,確保各部門的數據達到客觀、實用和安全的標準,完善保障數據在收集和處理過程中不受非法使用、塗改的影響,數據可靠而準確之餘,能夠有用於社會經濟及展。
美國早人一步實踐大數據戰略的意義,不單是有利於技術的。AI專家李開復在新書《AI·未來》指出,現階段人工智能不再是「發明的年代」,目前五花八門的AI新里程碑,其實都是把過去十年的技術突破——主要是「深度學習」——和一些互補的技術,應用在新問題之上。事實上,今天的數碼時代從硬實力,轉為軟實力的競爭,關於「軟實力」,除了指各方面的落地應用之外,更重要的是大數據從管理、法規層面,演進到社會文化層面。過去十年,美國關於個人資料保障、數據合法性使用等等,不時出現重大事故,令數碼化進程受到衝擊,然而,美國一邊發展、一邊修正。從技術方面提升安全程度,從自我完善的態度,讓社會更能接受大數據的開放使用,美國的軟實力一步一步建立起來。
1948年奧威爾寫成《1984》之際,正值美國科學飛躍發展的時代,小說中當政者利用科技無處不在的監控人民生活,美國人並不以虛構故事視之。隨着六七十年代電腦科技的推進,專家學者對科技侵害個人私隱、影響個人行為自由,一再表示擔憂,互聯網、大數據與AI引起的法律糾紛、維權團體的反對不絕,不過,每一個關卡對於美國的數碼化的一次洗禮,美國從中得到解決問題的經驗,成為數碼化時代的贏家本錢。
愈早推動大數據開放運動愈有優勢,我們的眼光除了立法者的法律、法規,各行各業包括政府部門的自律、自覺性規管之外,還要放得更遠更深。假如香港的中數據元年是2108年的話,即將來臨的2019年,教育界應協同各界準備向中小學推動大數據基本教育,讓香港年輕一代日後成為合格的數碼公民。歷史學家黃仁宇評中國歷史令人印象深刻,他指中國近代之所以大幅落後於西方和日本,歸咎於我們沒有數字管理的能力(Mathematically Management)。「一旦某一個國家能在數目字上管理,到底使用何種數字,尚可以隨時商酌,大體上以技術上的要求作主,不必籠統的以意識形態為依歸了。」數字管理就是數據的收集、儲存、分析,這與我們今天的大數據如出一轍。
王仁宇說︰「資本主義社會,是一種現代化的社會,它能夠將整個的社會以數目字管理。」數碼化時代同樣以數目字管理,之不過,數據的內涵和功能更豐富。電腦科技、互聯網未出現的時代,我們只有兩元空間︰人類社會空間和物理空間,現在龐大的計算力和數據量,產生了一個以前沒有的信息空間,人與人、人與物、物與物可以互聯信息,數據量已超出普通人想像。如果我們的學校還是停留在傳統的數目字世界,學生便難以掌握大數據的價值觀,對於社會數碼化不單只不能成為推動力,更有可能成為誤用、誤判的阻力。
香港這一年的STEM教育發展很不錯,然而,科技與社會發展今年發展很快,期望STEM教育可以趕上形勢,加入大數據的入門知識,包括大數據的技術和價值觀,讓年輕一代都有數據管理的意識和能力。
電郵︰pingwah@gmail.com
作者︰黃秉華 資深科技記者、香港STEM教育推廣者。