新科技速遞
AWS是全球最大的雲服務供應商,全球的市場佔有率超過4成。每年用戶大會參加人數眾多,2019年超過了6萬5千人。
AWS維持市場的地位,除了在數據中心的投資,網絡的高可用性,區域內數據中心的數量,也多少在產品創新速度,以及產品的多元化。
AWS的業務規模,足以開發專有的新晶片,2016年AWS收購了以色列Annapurna Labs後,開發晶片,在雲端釋放更強大的運算力。雲服務供應商具備了規模經濟效應,依賴晶片降低成本,加速創新。
類似Google開發TPU晶片,加速人工智能,AWS則利用晶片加持,即使是虛擬化基建,亦可發揮強悍的運算力和網絡功能。
一般數據中心以軟件,以虛擬化運算和網絡,本身有不少損耗,記憶體和算力花在虛擬化上,加上安全和加密,最終分配給用戶的運算資源,大打折扣。
AWS就利用特製晶片優化雲服務的虛擬化,推出了全球訓練AI和圖像運算最快的運算服務(Instance),客戶可根據CPU、記憶體、儲存、甚至網絡配搭,訂購不同Instance;還可優化網絡建立大規模的叢集運算,速度媲美超級電腦。
Instance品種大增數倍
據AWS行政總裁Andy Jassy介紹,通過晶片上的創新,AWS的Instance種類,比2年前多出了4倍。
購入Annapurna Labs後,AWS推動了Nitro計畫,以ASIC晶片取代虛擬化(Hypervisor)功能,包括保護硬件及BIOS,VM、保安、網絡、儲存、加密等。Nitro鎖定設定,保安不會有人為錯誤,外間無法登入管理賬戶,其他Nitro硬件PCIe網絡、NVMe儲存、遠端直接記憶存取、EBS儲存,加速儲存和傳輸,推動服務創新。
虛擬化是雲服務的基礎;Nitro簡化虛擬化,快速推出不同Instance;可按照不同任務,配搭選擇的運算、記憶、儲存。
ARM低成本高性能
Jassy表示, Annapurna Labs是AWS的轉捩點;包括開發性價更高ARM晶片Graviton2,針對特定場景;包括微服務、容器、Application Servers,ARMv7和v8設計,完全支援JVM虛擬機、其至可作高性能運算(HPC)。
Graviton2和華為的鯤鵬920一樣,屬64核和7nm製程。華為的構思,鯤鵬920可為手機遊戲服務,手機可直接利用雲端的算力。AWS則對ARM的前景,有更多想像空間。
AWS正式以旗下AI推理晶片Inferentia推出Inf1 Instance服務。Jassy表示,推理(Inference)佔去AI成本的8成以上。AI模型建立之後,大部分時間供預測用途,消耗最多的算力。華為研發出昇騰(Ascend)系列,推出昇騰Ascend 910,號稱是地上最強,支援全場景AI計算框架MindSpore。Inf1 Instance則只集中推理用途。
雲服務各自修行,以晶片推獨家服務。華為有海思,AWS有Annapurna Labs。其他的雲服務,看來也會收購晶片開發。
Nitro創新數據服務
Nitro其中一項優點,可實現儲存之間快速數據轉移。據Jassy介紹,Nitro令AWS快速推出更多種類Instance外,數據服務也有不少創新。近年,用戶從Oracle數據庫遷移至Aurora上;不少微軟 SQL也轉移過來,甚至開始放棄Windows伺服系統,遷移到Linux上。
AWS數據庫以SaaS提供服務,加上數據倉庫(Data Warehousing)和數據湖(Data Warehousing);商業智能(BI)和大數據分析更易執行。Jassy介紹,AWS的 S3已經是全球最受流行的數據湖儲存方案。AWS RedShift則是增長最快雲數據倉庫。Nitro高速在儲存體間傳送數據,推動AWS數據服務創新。
AWS推出Federated Query,同時檢索S3、Redshift數據倉庫、RDS及 Aurora (PostgreSQL) 數據庫,然後送到Redshift分析,或S3數據湖作大數據分析。
並行擴充免費時段
Nitro也更有效利用S3物件儲存。較早前,RedShift推出Concurrency Scaling服務,自動增加暫時性的容量,即使數千並行用戶同時作查詢,仍保持快速的效能。這種自動擴充的容量,每天有一小時免費任用,97%用戶利用免費一小時,進行並行數據分析。
但是,Redshift仍要在數據量和運算性能的兩者,作出成本的抉擇;數據多就使用較低效率的硬碟,數據少就用讀寫快的SSD。 Redshift推出RA3 Instance,靈活擴充運算和儲存。RA3擁有大量SSD,檢索數據一旦超出SSD容量,較少用數據傳至S3作暫存。Jassy說,Nitro加持的ec2加速Instance之間傳輸,RA3以同樣SSD,處理更多數據。
Nitro另一項創新是AQUA(Advanced Query Accelerator),不少企業以S3建立數據湖,靠廉價S3儲存原始的數據,數據從S3檢索後,送到Redshift作BI分析。AQUA就利用Nitro在S3建立緩存(Cache)縮壓和加密,數據預先檢索和過濾,預先完成部分工序,大幅減少送往Redshift分析的數據量,檢索速度快了10倍以上。
AWS上各項數據服務,必須一提雲服務上大熱的Elasticsearch。Elastic與多家公有雲合作,數據轉化成JSON格式,搜尋後以Kibana建立報表,性能極強。Elastic又加入了AI,用於保安和基建監察。近年容器興起,產生更大量日誌,Elastic整合容器日誌檢索分析,十分有用。
Elastic搜尋的數據儲存在S3上,以價格最貴的熱(Hot)儲存,如果檢索數據太多,負擔不起大量熱儲存,每次只能搜尋數天數據,其他就只得棄掉或放進冷儲存;用戶當然希望檢索更長時期的數據。
AWS就以Nitro打造「Ultrawarm」儲存,以快速的數據轉移,熱儲存上不常用數據,自動遷移至S3「凍」儲存上,Ultrawarm儲存可處理數以倍計數據,讓Elastic檢索上月的數據量。
Nitro成為AWS的秘密武器,一般企業數據中心無法擁有類似晶片,速度和成本,肯定不如AWS在雲的性能速度。除非基建IT可加快創新,否則轉移向雲端,看來已成定局。