Web3嘉年華2025
Slide
Web3Festival2025
previous arrow
next arrow

自主科技| 理大研究大模型訓練 無限融合引領AI突破

香港理工大學楊紅霞教授
香港理工大學楊紅霞教授解釋,InfiFusion長遠意義,在於全球知識領域盈千上萬,散佈不同專家手上,目前AI訓練少數人操縱,許多人無從參與,長遠窒礙通用AI出現。

[自主科技]

中國AI晶片進口受限,科學家另闢蹊徑,DeepSeek大幅減少AI算力要求後,本港學者亦開拓研究,讓更多人參與AI。

上星期,DeepSeek再在arxiv發表論文,提出注意力機制NSA,減少超長文本訓練和推論資源算力,引起關注。另一群AI學者在arxiv則提出嶄新大模型融合策略InfiFusion,大幅減少算力需求,文章第一通訊作者為香港理工大學楊紅霞教授。 Continue reading “自主科技| 理大研究大模型訓練 無限融合引領AI突破”

眾創時代| DeepSeek 一石激起千層 浪普惠AI時代來臨

DeepSeek
DeepSeek以極低成本訓練出高性能模型,引起矽谷恐慌,不少人認為成本低得離譜,甚至有人稱其盗竊技術。

[眾創時代] [DeepSeek]

國產大模型DeepSeek激起千層浪,APP登上了iPhone最多下載應用榜首,成最熱門聊天機器人,模型的下載量驚人。

由於推理成本低,全球公有雲馬上提供DeepSeek服務。開發AI晶片的Cerebras提供DeepSeek R1推理服務,每秒輸出達1500個Token,足以應付任何應用。 Continue reading “眾創時代| DeepSeek 一石激起千層 浪普惠AI時代來臨”