來源:華爾街見聞
簡單來說,ChatGPT的“深度研究”功能適用于那些不只想要快速獲取答案或摘要,而是需要綜合考慮多個網站及其他信息來源,不斷深入挖掘直到找到最合適的答案的任務。Altman表示:“它真的很好,可以完成需要數小時/數天且花費數百美元的任務?!?/p>
本文作者:蔣紫涵
來源:硬AI
OpenAI推出AI Agent“深度研究”,分析師要失業了?
當地時間2月2日,OpenAI在直播中宣布推出一款全新的AI代理(AI agent),名稱叫做“深度研究”(Deep Research),旨在幫助用戶利用ChatGPT進行深入、復雜的研究。
OpenAI表示,該功能專為“在金融、科學、政策和工程等領域從事高強度知識工作的人員”設計,提供全面、精準、可靠的研究支持,并且,該功能同樣適用于需要進行細致調研的大宗消費決策,例如汽車、家電、家具購買等。
簡單來說,ChatGPT的“深度研究”功能適用于那些不只想要快速獲取答案或摘要,而是需要綜合考慮多個網站及其他信息來源,不斷深入挖掘直到找到最合適的答案的任務。
Altman寫道:
“它可以去互聯網,做復雜的研究和推理,然后給你一份報告。它真的很好,可以完成需要數小時/數天且花費數百美元的任務。”
“它計算量很大且速度很慢,但它是第一個可以執行如此廣泛復雜、有價值的任務的AI系統。”
對此,網友們躍躍欲試,有人“已經準備好使用它了”,還有人自報賬號請求先一步用上ChatGPT的“深度研究”功能:
也有人提出疑問,ChatGPT的“深度研究”功能比谷歌的“深度研究”功能更強嗎?會不會存在隱私問題?能不能把報告中每句話的首字母大寫?
限定發布,未來將拓展至更多用戶
Altman表示,ChatGPT的“深度研究”功能目前僅向ChatGPT Pro訂閱用戶開放,每月限額100次查詢,隨后將逐步推廣至Plus和Team用戶,最終擴展至企業級(Enterprise)用戶。預計Plus版本將在約一個月后推出,并且未來付費用戶的查詢限制將“顯著提高”。
對此,許多網友表示,200美元/月的ChatGPT Pro訂閱費用太貴了:
不是免費的誰在意啊。
還有網友猜測道,等之后實現了AGI,是不是要每月收取2000美金,限額使用10次?
其實,Altman表示,免費用戶也能使用,但額度非常少。
需要注意的是,“深度研究”功能目前僅在特定地區推出,OpenAI尚未公布該功能何時向英國、瑞士及歐洲經濟區(EEA)用戶開放。
目前,ChatGPT 深度研究的輸出僅限于文本格式。不過,OpenAI計劃在未來增加嵌入式圖像、數據可視化及其他“分析型”輸出。此外,OpenAI還表示,未來將支持接入“更多專業化的數據源”,包括“訂閱制”數據庫和內部資源。
研究精度如何?AI仍存局限
分析師要大面積失業了嗎?關鍵在于,ChatGPT“深度研究”功能的精準度能否滿足專業研究需求?畢竟,AI并不完美,仍然存在“幻覺”(hallucination)問題,即生成錯誤或虛假信息的可能性。
考慮到這一點,OpenAI透露,每次深度研究的輸出都將“完整記錄,附帶清晰的引用來源及推理摘要,便于用戶參考和驗證信息”。
不過,分析認為,這一舉措是否足以避免AI誤導用戶仍待觀察——此前,OpenAI在ChatGPT內推出的AI搜索功能(ChatGPT Search)已被曝出存在錯誤回答的問題。TechCrunch評測發現,ChatGPT Search在某些查詢上甚至不如谷歌搜索可靠。
增強精準度:使用專門優化的o3版本AI模型
為了提高深度研究的準確性,OpenAI采用了一種特殊版本的o3“推理”AI 模型,該模型經過強化學習(reinforcement learning)訓練,專門針對“需要使用瀏覽器和Python工具的實際任務”。
OpenAI表示,該版本的o3模型“針對網頁瀏覽和數據分析進行了優化”,可以“利用推理能力搜索、解讀和分析互聯網海量文本、圖片及PDF,并根據新獲取的信息靈活調整策略?!?/p>
該模型還可以瀏覽用戶上傳的文件,繪制并迭代調整圖表,在回答中嵌入生成的圖表及網頁圖片,并引用來源中的具體句子或段落。
為了測試該模型的效果,OpenAI采用了一項名為“人類終極考試”(Humanity’s Last Exam)的評估方法,該測試涵蓋3000多道高難度學術問題,遠超其他AI評估基準,以確保測試難度始終領先于模型的進步水平。
ChatGPT“深度研究”功能所使用的o3模型在測試中的準確率為26.6%——這一成績看似不高,但相比之下,已經遠超其他AI模型的得分:
谷歌 Gemini Thinking:6.2%
xAI Grok-2:3.8%
OpenAI GPT-4o:3.3%
不過,盡管如此,OpenAI仍然承認,ChatGPT“深度研究”功能存在局限性,可能會出現錯誤推斷、誤解權威信息與謠言的情況,并且,在面對不確定性時往往無法明確表述。
本文來自微信公眾號“硬AI”,關注更多AI前沿資訊請移步這里
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。