
[自主科技]
中國AI晶片進口受限,科學家另闢蹊徑,DeepSeek大幅減少AI算力要求後,本港學者亦開拓研究,讓更多人參與AI。
上星期,DeepSeek再在arxiv發表論文,提出注意力機制NSA,減少超長文本訓練和推論資源算力,引起關注。另一群AI學者在arxiv則提出嶄新大模型融合策略InfiFusion,大幅減少算力需求,文章第一通訊作者為香港理工大學楊紅霞教授。 Continue reading “自主科技| 理大研究大模型訓練 無限融合引領AI突破”
[自主科技]
中國AI晶片進口受限,科學家另闢蹊徑,DeepSeek大幅減少AI算力要求後,本港學者亦開拓研究,讓更多人參與AI。
上星期,DeepSeek再在arxiv發表論文,提出注意力機制NSA,減少超長文本訓練和推論資源算力,引起關注。另一群AI學者在arxiv則提出嶄新大模型融合策略InfiFusion,大幅減少算力需求,文章第一通訊作者為香港理工大學楊紅霞教授。 Continue reading “自主科技| 理大研究大模型訓練 無限融合引領AI突破”