
[自主科技]
中國AI晶片進口受限,科學家另闢蹊徑,DeepSeek大幅減少AI算力要求後,本港學者亦開拓研究,讓更多人參與AI。
上星期,DeepSeek再在arxiv發表論文,提出注意力機制NSA,減少超長文本訓練和推論資源算力,引起關注。另一群AI學者在arxiv則提出嶄新大模型融合策略InfiFusion,大幅減少算力需求,文章第一通訊作者為香港理工大學楊紅霞教授。 Continue reading “自主科技| 理大研究大模型訓練 無限融合引領AI突破”
[自主科技]
中國AI晶片進口受限,科學家另闢蹊徑,DeepSeek大幅減少AI算力要求後,本港學者亦開拓研究,讓更多人參與AI。
上星期,DeepSeek再在arxiv發表論文,提出注意力機制NSA,減少超長文本訓練和推論資源算力,引起關注。另一群AI學者在arxiv則提出嶄新大模型融合策略InfiFusion,大幅減少算力需求,文章第一通訊作者為香港理工大學楊紅霞教授。 Continue reading “自主科技| 理大研究大模型訓練 無限融合引領AI突破”
[眾創時代] [DeepSeek]
國產大模型DeepSeek激起千層浪,APP登上了iPhone最多下載應用榜首,成最熱門聊天機器人,模型的下載量驚人。
由於推理成本低,全球公有雲馬上提供DeepSeek服務。開發AI晶片的Cerebras提供DeepSeek R1推理服務,每秒輸出達1500個Token,足以應付任何應用。 Continue reading “眾創時代| DeepSeek 一石激起千層 浪普惠AI時代來臨”