[新科技速遞]
Meta開源了史上參數最多的Llama 3.1 405B,參數達4,050億,上下文長度128K,支援8種語言,性能上超越GPT-4o。Meta行政總裁朱克伯格宣佈推出Llama 3.1,與Linux相提並論。朱克伯格認為,Llama 3.1會成為未來創新的基礎技術。 Continue reading “新科技速遞| 首次超越閉源下載火爆 開源大模型迎Linux時刻”
[新科技速遞]
Meta開源了史上參數最多的Llama 3.1 405B,參數達4,050億,上下文長度128K,支援8種語言,性能上超越GPT-4o。Meta行政總裁朱克伯格宣佈推出Llama 3.1,與Linux相提並論。朱克伯格認為,Llama 3.1會成為未來創新的基礎技術。 Continue reading “新科技速遞| 首次超越閉源下載火爆 開源大模型迎Linux時刻”
Meta開源Llama 3大模型;包括兩個 80 億(8B)和 700 億(70B)參數版本,已供下載。4000 億參數(400B)版本正在開發,較不少閉源大模型,Llama 3性能有過之無不及,不少評分拋離對手。Meta行政總裁扎克伯格(Mark Zuckerberg)透露,400B在數學(GSM-8K)、編程(Human-Eval)、多任務語言理解(MMLU)基準,超越了GPT4。 Continue reading “新科技速遞| 開源Llama後發先至 微調版本衝擊AI生態”
[新科技速遞]
Facebook母公司Meta屬下Meta AI研究人員,宣佈以人工智能開發高質素機械翻譯,以NLLB-200命名的單一AI 模型,能翻譯出200種不同語言,支援多語言翻譯挑戰,包括了訓練低資源語言,也就是只有少數樣本供訓練AI模型的非主流語系。 Continue reading “新科技速遞| 語言機器學習技術 攻關低資源語言翻譯”