[新科技速遞]
美國在AI基礎研究領先,中國在行業應用百花齊放。華為在東莞松山湖舉行開發者大會2024,公佈了盤古大模型5.0 和HarmonyOS升級,並介紹落地行業的發展。
盤古大模型已應用在多個行業;包括政務、金融、製造、醫藥研發、煤礦、鋼鐵、鐵路、自動駕駛、工業設計、建築設計、氣象等。香港天文台正以盤古大模型測試天氣預報。
盤古大模型5.0升級至多模態,理解文字、圖片、影片等內容,支持AIGC創作內容。中國的電子商貿發達,為AI創造不少落地場景。華為雲媒體服務產品部總裁呂陽明介紹盤古媒體大模型的新性能,以及零售、市務推廣和動畫創作的落地場景。
OpenAI介紹了Sora後,以AI生成多媒體創作工具,如雨後春筍出現, AI生成內容勢將大為增加,內容製作後要加工和處理,華為雲媒體大模型以雲運算提供AIGC創作內容、內容處理和增值服務,簡化多媒體內容製作和處理。
內容製作市場龐大
嚴格來說,媒體大模型非完全針對媒體,除了內容創作和處理,也包括了即時傳譯、配音、字幕,用戶互動等,除了媒體和影視業,向廣告、動畫創乍、零售、電商直播、電腦遊戲、教育提供內容製作服務,甚至國際視像會議的即時傳譯。
呂陽明說,AIGC推動數字內容生產,批量生產內容,須有充足創造力、算力和聯接力,華為雲建立起AI原生基礎設施,提供邊緣雲網格、盤古媒體大模型和內容生成服務。
呂陽明說,以往一般傳媒以「內容緩存加速」(CDN),但AI製作內容各有不同,必須提供差異化服務。所以部署在邊緣位置最底層「邊緣雲網格」是統一架構存算網絡,加入了運算、加速和保安功能,首先是媒體和內容要實時傳送,必須為應用加速,其次多媒體內容要求高算力,所以根據不同的服務水平承諾,AI算力觸手可及,為不同內容提供推理和內容處理;第三是防止數據漏露和阻隔Prompt攻擊,因此必須邊緣安全服務。
數字人性價比高
中間層才是媒體大模型和媒體引擎,處理音訊、視頻、圖形、圖像等能力。最上層則提供AIGC內容生產、AI MPC內容處理、AI EC內容聯接與協同三大類服務。
MetaStudio數字內容生產線利用AIGC生成內容;包括 AIGC視頻和AIGC 3D和數字人等製作,針對遊戲製作、電商直播、教育和醫療。呂陽明說, 數字人是中國生成式AI最炙手可熱的技術,華為每張生成卡支援20位數字人同時直播,性價比無出其右。
後期製作潛力無限
以AIGC生成內容後,必須後期製作、翻譯和配音,華為AI MPC提供內容處理,包括創作視頻風格、配音、視訊壓縮和增強。呂陽明認為, AI MPC內容處理服務甚具前景,內容生成後往往經多項處理,才能迎合不同市場。
呂陽明說,華為與中國傳媒大學合作製作《致親愛的自己》動畫版,過程只要20多張圖片就訓練出視頻風格,保持風格、人物和外貌一致。中影集團影片《長安三萬里》卡通,法語自動翻譯和配音,媒體大模型亦保留角色原音和情感。此外,AI MPC亦可為視頻提供壓縮、轉碼,高清低碼節省頻寬等功能。
華為AI EC內容聯接和協同,則提供即時互動、即時傳譯、即時協作服務。華為視像會議提供低延時即時傳譯,同時支援64頻道,凖確率93%。
AI創造數字內容愈來愈多,AI媒體服務極可能成為業界下一個風口。