界面新聞記者 | 宋佳楠
據新浪財經報道,截至北京時間1月26日15:45,DeepSeek在美區蘋果App Store免費榜升至第六位,超越Google Gemini、Microsoft Copilot等美國科技公司的生成式AI產品。
同在今日,DeepSeek出現了短時閃崩現象。不少網友反映,使用時遇到 “服務器繁忙” 的提示。
對此,DeepSeek回應稱,當天下午確實出現了局部服務波動,但問題在數分鐘內就得到了解決。此次事件可能是由于新模型發布后,用戶訪問量激增,服務器一時無法滿足大量用戶的并發需求。不過,官方狀態頁并未將這一事件標記為事故。
界面新聞了解到,此前DeepSeek在美區榜單的排名并無特別突出表現,處于穩步上升階段,但未進入前十。此次突然躥升,與其近期一系列突出表現有直接關系。
去年年底,DeepSeek推出開源模型DeepSeek-V3。當時,聊天機器人競技場(Chatbot Arena)數據顯示,DeepSeek-V3在所有模型中排名第七,在開源模型中排第一,是全球前十中性價比最高的模型。
DeepSeek-V3大模型的核心技術創新是其迅速崛起的關鍵。該模型融合了Multi-head Latent Attention(MLA)、混合專家架構(MoE)和FP8低精度訓練三項技術,顯著提升了性能與效率。
而在本月20日,DeepSeek又正式開源R1推理模型。1月24日,DeepSeek-R1在Chatbot Arena綜合榜單上排名第三,與OpenAI的頂尖推理模型o1并列。在高難度提示詞、代碼和數學等技術性極強的領域,DeepSeek-R1拔得頭籌;在風格控制以及高難度提示詞與風格控制結合的測試中,DeepSeek-R1均與o1 并列第一。
此外,Artificial-Analysis的初始基準測試結果顯示,DeepSeek-R1在AI分析質量指數中取得第二高分,但價格卻是o1的約三十分之一。
DeepSeek以“低成本訓練”和“高性價比”為核心賣點,其API輸入價格僅為每百萬Token 0.1元人民幣,遠低于Claude 3.5 Sonnet(3美元/百萬Token),吸引了不少中小開發者和企業。這種低成本訓練策略也讓該公司有了“AI界拼多多”的稱號,甚至引發了間接沖擊英偉達等硬件廠商的討論。
界面新聞稍早前曾報道,360公司創始人周鴻祎認為,DeepSeek在對抗美國AI技術霸權的 “中國大模型技術復仇者聯盟戰隊” 中,DeepSeek必定占有一席之地。
他還特別指出,由于DeepSeek及其創始人非常低調,其技術能力和未來前景被市場嚴重低估。
DeepSeek即為杭州深度求索人工智能基礎技術研究有限公司,成立于2023年7月。公司由知名量化資管巨頭幻方量化創立。如今,DeepSeek的種種表現,已讓包括Meta在內的硅谷科技巨頭感受到了壓力。