剛剛,OpenAI放出Operator,能模擬人類上網(wǎng),智能體之戰(zhàn)打響
1月24日消息,今日凌晨,OpenAI 發(fā)布了首款智能體產(chǎn)品“Operator”。這一功能是一款能夠模擬人類操作網(wǎng)頁瀏覽器的AI助手,支持自動完成旅行住宿預訂、餐廳預約和在線購物等復雜任務。
本文引用地址:http://www.biyoush.com/article/202501/466616.htmOperator 目前以研究預覽(Research Preview)版本發(fā)布,能夠通過互聯(lián)網(wǎng)自動為用戶執(zhí)行多種任務。
OpenAI 表示,計劃很快將其集成到ChatGPT中。目前,該功能僅面向美國的 Pro 用戶開放。
Operator 的底層技術采用了一種全新的模型——Computer-Using-Agent(CUA)。
CUA 結合了 GPT-4o 的視覺能力和強化學習的高級推理能力,使其能夠與 GUI 界面交互。
Operator 可以識別網(wǎng)頁界面內(nèi)容,并通過鼠標、鍵盤完成所有允許的操作,從而實現(xiàn)自動化操作,無需定制化的 API 集成。
當遇到問題或出錯時,Operator 能利用自身的推理能力進行自我糾錯。如果無法解決問題,它會將控制權交回用戶。
OpenAI 總裁 Greg Brockman 在 X 平臺發(fā)文稱:“Operator 是一種可以通過內(nèi)置瀏覽器為用戶執(zhí)行任務的智能體。2025年將成為智能體之年。”
評論