開年的AI圈,可真是熱鬧。
DeepSeek激起千層浪。
一邊是硅谷、華爾街都在激辯DeepSeek的影響;另一邊,科技巨頭已經(jīng)下場無縫連接DeepSeek-R1模型服務。
先是微軟,現(xiàn)在已經(jīng)將DeepSeek-R1模型添加到其Azure AI Foundry,開發(fā)者可以用新模型進行測試和構建基于云的應用程序和服務。
同時,微軟還將R1的精煉版本引入“Copilot+PC”,率先提供給搭載驍龍X芯片、英特爾酷睿Ultra 200V處理器的PC設備,然后是搭載AMD Ryzen AI 9的設備。
微軟CEO薩蒂亞·納德拉(Satya Nadella)在財報后的電話會議上稱,DeepSeek的新模型“確實有一些創(chuàng)新”,它將得到廣泛應用。在納德拉看來,僅僅發(fā)布最好的新模型是不夠的,必須讓它具有成本效益。
雖然微軟是OpenAI的深度投資者且有很多合作,但在產(chǎn)品商業(yè)化上它依然選擇多樣性的模型。目前Azure的平臺上既有OpenAI的GPT系列、Meta的Llama系列、Mistral的模型,現(xiàn)在新增了DeepSeek。
緊接著,AWS(亞馬遜云科技)也宣布,用戶可以在Amazon Bedrock和Amazon SageMaker AI兩大AI服務平臺上部署DeepSeek-R1模型。
AWS一直強調(diào)的是“一個模型無法解決所有問題”?,所以在AWS的平臺上集成了第三方和自家大模型,如今又添加了DeepSeek的模型,用戶可以根據(jù)需求選擇最合適的模型。
從微軟和AWS的選擇和動作看,都在用更多、更強大的大模型矩陣,來強化自家的云業(yè)務。眼下云廠商正在加大AI轉型力度,外界也最關注AI如何驅動云增長。
微軟最新發(fā)布的四季度財報顯示,營收和利潤超預期增長,但是Azure云業(yè)務增長低于預期,當天股價下跌6.18%至414.99美元/股。2025年,云廠商之間的角逐更加激烈,焦點仍會是AI。
互聯(lián)網(wǎng)大廠之外,英偉達也同步上線了搭載DeepSeek-R1的軟件服務。英偉達的官網(wǎng)顯示,DeepSeek-R1模型現(xiàn)已作為NVIDIA NIM微服務預覽版提供,開發(fā)者可以測試和體驗該API,未來提供可下載的NIM微服務版本。
什么是NIM服務?這是英偉達在2024年新推出的軟件產(chǎn)品,主要助力AI應用開發(fā)。Forrester副總裁兼首席分析師戴鯤曾向21世紀經(jīng)濟報道記者表示,NIM是個推理平臺,融合了底層的CUDA、對自身和第三方大模型的支持、對主流推理框架和云平臺的集成,可以加速生成式人工智能模型推理全過程,是NVIDIA企業(yè)級AI平臺的最后一塊拼圖。
英偉達當然是硬件巨頭,更是軟件專家,它也有自己的B端AI服務平臺,NIM微服務主要是幫助開發(fā)者面向未來創(chuàng)造新的應用,不需要從零寫代碼。
所以,英偉達接入DeepSeek-R1也是豐富自家平臺上的模型選項,然后和自家硬件相結合,形成一整套軟硬件AI體系。結合NVIDIA AI Foundry和NVIDIA NeMo軟件,企業(yè)還可定制DeepSeek-R1 NIM微服務,以構建特定領域的AI智能體。
R1作為推理模型,英偉達在介紹中著重強調(diào)了其強大的推理能力,并表示推理需要大量的算力支持。
英偉達解析道,DeepSeek-R1采用大規(guī)模專家混合(MoE)架構,參數(shù)規(guī)模高達 6710 億,是許多流行的開源大模型的10倍。其輸入上下文長度可達128000個Token,每層擁有256個專家(Experts),每個Token會被并行路由至8個不同的專家進行推理計算。
而要想實現(xiàn)R1的實時推理,需要大量高算力GPU,并依賴高帶寬、低延遲的通信能力,將輸入 Token高效路由至所有專家進行推理。結合NVIDIA NIM微服務的優(yōu)化,一個配備8塊H200 GPU并通過NVLink和NVLink Switch互聯(lián)的服務器,即可運行完整的6710億參數(shù) DeepSeek-R1 模型,實現(xiàn)高達3872 Token/秒的推理吞吐量。
對于英偉達、AWS和微軟三家巨頭而言,不論“黑貓還是白貓”,能夠上場應用的模型就是“好貓”。而大家迅速接入DeepSeek模型,一方面是認可DeepSeek的能力,另一方面大家的共識是AI成本在降低,都在為AI普及和應用爆發(fā)做更多基礎布局。
從去年開始,業(yè)界大佬就不斷強調(diào)成本下降這一觀點,但各有各的邏輯。比如英偉達說AI推理成本下降,主要基于算力效率提高。現(xiàn)在,DeepSeek從算法角度給出了新的解題思路,通過工程創(chuàng)新提高訓練和推理效率,進一步降低成本。
同時,DeepSeek也帶給OpenAI、Anthropic兩大閉源代表更大的競爭壓力。這兩家AI明星已經(jīng)聚集了巨大資本,2024年都獲得了大額融資。近日Anthropic CEO發(fā)文要求加強出口管制;OpenAI動作頻頻,不僅突然宣布“o3”模型要在周五公布,還有融資傳聞流出。
據(jù)媒體報道,OpenAI正在以3000億美元估值,尋求新一輪的400億美元融資,還有報道稱,軟銀此番計劃最多向OpenAI投資250億美元。這也和不久前推出的Stargate(星際之門)計劃,有所呼應。
可以預見,AI賽場上,你追我趕的競爭態(tài)勢愈演愈烈,DeepSeek刮起的旋風還將繼續(xù)。表面上看,DeepSeek是一家小型初創(chuàng)企業(yè),但它背后的幻方量化已經(jīng)成長了近十年,公司招募的多是外人眼中的“天才少年”,精悍的團隊讓DeepSeek的敘事席卷全球。
人才,依然是創(chuàng)新的基石,AI繼續(xù)吸引著全球最聰明的腦袋、最頂尖的人才投身其中。DeepSeek的“黑神話”拉開了AI新篇章,這或許是一個新起點,在AI開源世界中,更多的DeepSeek正在孕育中。同時,也讓子彈多飛一會,讓這場圍繞著DeepSeek、成本、AI泡沫、開源閉源的探討越辯越明。