「Agent代理人」將是AI競賽新的破局者？

作者：陳玲麗時間：2025-03-13 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

號稱“全球首款真正意義上的通用AI Agent”的國產(chǎn)產(chǎn)品Manus風(fēng)頭十足，刷屏海內(nèi)外社媒。Manus的名字來源于拉丁語Mens et Manus，意為“mind and hand”，即手腦并用，這也是麻省理工學(xué)院的校訓(xùn)。

本文引用地址：http://www.biyoush.com/article/202503/468051.htm

值得注意的是，Manus在權(quán)威的GAIA（General AI Assistants，通用AI助手）基準(zhǔn)測試中創(chuàng)下了新紀(jì)錄，全部難度級別中的評分都超越了OpenAI的DeepResearch。Manus的出現(xiàn)標(biāo)志著人機(jī)協(xié)作進(jìn)入了一個新的范式，它可能是通向通用人工智能（AGI）的一個重要窗口。由于產(chǎn)品處于內(nèi)測階段，僅以邀請碼形式開放使用，Manus急劇進(jìn)入一個供不應(yīng)求的狀態(tài)。

經(jīng)過2023年的百模大戰(zhàn)，2024年的應(yīng)用之爭，行業(yè)淘汰賽加劇，2025年對于初創(chuàng)企業(yè)而言，落地路線的選擇至關(guān)重要。Manus不僅僅是一個只會聊天的對話式AI工具，它是一個多模型、多智能體產(chǎn)品，擁有“獨(dú)立思考”能力，能夠?qū)?fù)雜的通用任務(wù)進(jìn)行多步驟拆解并執(zhí)行。只需要告訴它最終目標(biāo)，Manus就可以靈活調(diào)用各類工具，自主執(zhí)行瀏覽網(wǎng)頁、操作網(wǎng)頁應(yīng)用、編寫并執(zhí)行代碼等操作來實現(xiàn)。

「Agent代理人」有多強(qiáng)？

業(yè)內(nèi)常規(guī)產(chǎn)品中，通行的邏輯是在平臺內(nèi)整合全球供應(yīng)鏈企業(yè)信息，來幫助用戶完成供貨商/需求方匹配這件事。但在Manus的案例中，你能看到完全不同的實現(xiàn)方式。Manus與傳統(tǒng)AI助手最大的不同在于自主規(guī)劃與執(zhí)行能力，從“被動響應(yīng)”向“主動執(zhí)行”的跨越，其核心架構(gòu)通過多模型協(xié)作將復(fù)雜任務(wù)拆解為子目標(biāo)，并調(diào)用外部工具逐步完成。例如，用戶只需輸入“分析特斯拉股票并制作PPT”，Manus會自動完成數(shù)據(jù)搜集、分析、圖表生成及PPT排版，全程無需人工干預(yù)。類似任務(wù)如簡歷篩選、房產(chǎn)推薦等，Manus均能通過虛擬機(jī)技術(shù)分解步驟，模擬人類工作流。

打開Manus界面，有四部分構(gòu)成，分別是瀏覽器、搜索、編輯器和終端，是把各類功能組合封裝好的一款產(chǎn)品。具體來看，第一步跟ChatGPT一樣有對話界面，用戶需要提出具體的訴求，之后操作界面被劃分為了兩部分，左面是對話界面，右面是終端。當(dāng)開始執(zhí)行任務(wù)后，左面開始識別意圖、制定執(zhí)行步驟以及開始搜索、調(diào)用所需的各類工具，右面的終端相當(dāng)于一個虛擬機(jī)，可以同步執(zhí)行文件處理、代碼生成、搜索瀏覽器等工作。

里面有一個小插曲，據(jù)說，Manus團(tuán)隊一開始的方向是AI瀏覽器。在偶然看到Arc被放棄后，他們才決定了終止AI瀏覽器的研發(fā)工作。現(xiàn)在在使用過程中，也能看到瀏覽器的痕跡。

Manus目前采用「Multiple Agent」架構(gòu)，運(yùn)行在獨(dú)立的虛擬機(jī)中。通過規(guī)劃型Agent負(fù)責(zé)任務(wù)拆解、執(zhí)行型Agent調(diào)用具體工具、監(jiān)控驗證Agent跟蹤任務(wù)進(jìn)度和debug等多層代理分工協(xié)作機(jī)制，來大幅提升對復(fù)雜任務(wù)的處理效率，并通過并行計算縮短響應(yīng)時間。此外，Manus還具備記憶能力，能夠在執(zhí)行類似任務(wù)時不斷優(yōu)化和提升自己的工作效率：例如若用戶習(xí)慣以Excel接收結(jié)果，后續(xù)任務(wù)會自動優(yōu)先生成表格。整個過程在云端異步完成，這意味著用戶可以隨時關(guān)閉電腦，等待結(jié)果生產(chǎn)。

在這個架構(gòu)中，每個代理可能基于獨(dú)立的語言模型或強(qiáng)化學(xué)習(xí)模型，彼此通過API或消息隊列通信。同時每個任務(wù)也都在沙盒中運(yùn)行，避免干擾其他任務(wù)。專用RL小模型負(fù)責(zé)系統(tǒng)中最關(guān)鍵的決策環(huán)節(jié)：意圖識別、任務(wù)規(guī)劃和工具調(diào)用。整個工作流程設(shè)計以一份todo.md文件為核心，它兼顧記憶和指揮，解決了AI Agent長期面臨的上下文管理難題，并且能夠保持執(zhí)行反饋與todo.md之間的動態(tài)聯(lián)系。

使用Manus過程中，用戶能感受到的體驗感更多是跨App操作能力及其可視化過程帶來的，而輸出結(jié)果的可用性完全有賴于基礎(chǔ)模型的能力。最近幾個月的一系列推理模型比如GPT o3、DeepSeek R1、QWQ、Claude 3.7 Sonnet等的發(fā)布甚至開源，一定程度上提升了路徑規(guī)劃能力、深度研究能力和代碼寫作的準(zhǔn)確率，為更具生產(chǎn)力的agent提供了可能。

Manus的火爆加速了開源社區(qū)的創(chuàng)新進(jìn)程，MetaGPT等團(tuán)隊迅速推出OpenManus、OWL等開源項目，通過復(fù)現(xiàn)核心架構(gòu)推動Agent技術(shù)普惠化。開源社區(qū)的活躍表明，行業(yè)競爭壁壘正從單一模型性能轉(zhuǎn)向工程化能力，包括工具鏈封裝效率、場景適配性及用戶體驗優(yōu)化。不過，實際應(yīng)用仍需解決模型幻覺、響應(yīng)速度等體驗問題，這將是下一階段技術(shù)演進(jìn)的重點(diǎn)。

Manus存在的爭議

在Manus的解釋理虛擬機(jī)中的計算機(jī)應(yīng)用并不多，主要體現(xiàn)在模擬用戶點(diǎn)擊、瀏覽和切換工具使用，意義不是十分大。因此Zengyi Qin（MIT博士）認(rèn)為它在本質(zhì)上還是一個預(yù)先設(shè)定的“workflow”，在無邊界操作系統(tǒng)級環(huán)境（open-ended OS Level environment）中并未取得突破。官網(wǎng)上介紹的智能研究、高級數(shù)據(jù)分析、任務(wù)自動化三大功能其實也就是Manus的極限了。

Manus真正的殺手锏是它模擬人類方式工作方式的能力，它并沒有做到哪些人類當(dāng)前真正無法做到的事，這也就是為什么一些已經(jīng)體驗過的用戶，形容Manus為“一個實習(xí)生”。而Manus團(tuán)隊本身并不自研大模型，而是基于業(yè)內(nèi)大模型開發(fā)“套殼”產(chǎn)品，這也是Manus被不少AI業(yè)內(nèi)人士認(rèn)為不具備“護(hù)城河”、以及在技術(shù)層面并沒有太多新東西的原因之一。

需要指出的是，根據(jù)參加過溝通會的行業(yè)人士表述，Manus并不諱言自己是一個“套殼”產(chǎn)品，其價值在于工程化創(chuàng)新 —— 通過逆向工程實現(xiàn)任務(wù)拆解邏輯的標(biāo)準(zhǔn)化，降低開發(fā)門檻，為行業(yè)提供了可復(fù)用的技術(shù)框架。這種將底層模型與工具調(diào)用深度集成的模式，或?qū)⒊蔀锳gent產(chǎn)品的通用范式。

一場產(chǎn)品經(jīng)理式的成功

在Manus獲得如此熱度之后，就如同好奇DeepSeek團(tuán)隊成員一樣，外界也開始關(guān)心這家應(yīng)用層公司團(tuán)隊的來歷。Manus團(tuán)隊主要成員包括創(chuàng)始人肖弘、產(chǎn)品合伙人張濤和首席科學(xué)家季逸超。其中，張濤曾在字節(jié)跳動負(fù)責(zé)國際化產(chǎn)品，隨后在光年之外擔(dān)任產(chǎn)品負(fù)責(zé)人，與肖弘、季逸超共同成立Manus AI并擔(dān)任合伙人后，目前負(fù)責(zé)產(chǎn)品戰(zhàn)略、市場溝通及用戶體驗優(yōu)化，主導(dǎo)構(gòu)建了Manus的多代理架構(gòu)設(shè)計，提出“用戶體驗應(yīng)從答案交付轉(zhuǎn)向成果交付”的產(chǎn)品理念。

一個很明確的事實是，Manus誕生的必要前提是基座模型的性能提升，但這是過去兩年來整個行業(yè)有目共睹的趨勢，為什么率先讓Agent獲得注意力的會是Manus？從傳播路徑上來看，Manus與DeepSeek-R1一樣，爆火是因為成功打出了用戶體驗上的低門檻和時間差。DeepResearch只有200美元/月的ChatGPT Pro用戶才能夠使用，因而Manus更容易在體驗上形成沖擊。

這是一場產(chǎn)品經(jīng)理式的成功，考驗的是產(chǎn)品設(shè)計能力和產(chǎn)品實現(xiàn)技能。這種能力，是Manus團(tuán)隊所擅長的，也是曾被市場所低估的。

Manus控股公司蝴蝶效應(yīng)（Butterfly Effect Hong kong）成立于2023年，境內(nèi)企業(yè)名為北京紅色蝴蝶科技有限公司，還在武漢設(shè)有分公司。在Manus之前，主要有兩款產(chǎn)品：2023年初推出號稱All-in-One的AI助手瀏覽器插件Monica，接入了ChatGPT等工具的API，可為用戶提供搜索、閱讀、寫作、翻譯、創(chuàng)作等多種任務(wù)的協(xié)助，截至2024年年底，主打海外市場的Monica已經(jīng)擁有了超過1000萬的用戶；另一款則是2023年收購而來的另一款插件ChatGPT for Google。

現(xiàn)在的Manus距離正式版想交付給大家的體驗還差很遠(yuǎn)，像模型幻覺、交付物友好度、運(yùn)行速度等方面都還有很大的提升空間。未來，Manus或?qū)⒒贏HPU（Agentic Hours Per User）這一新指標(biāo)打造出獨(dú)屬于AI的商業(yè)模式，即衡量用戶委托AI完成任務(wù)的時間效率，目標(biāo)是通過并行任務(wù)提升生產(chǎn)力，否則很難完成規(guī)?；?。目前，Manus通過KV cache優(yōu)化、推理時延壓縮、執(zhí)行流程精簡等手段，實現(xiàn)了單次任務(wù)消耗控制在兩美元左右的成本。但是，單次任務(wù)的成本可能只是一個平均數(shù)或中位數(shù)，許多動輒兩小時的任務(wù)生成，其消耗成本應(yīng)該不止于此。

AI的下一個關(guān)鍵階段

2025年是AI Agent爆發(fā)的元年已經(jīng)成為行業(yè)共識。根據(jù)麥肯錫等多份權(quán)威報告，在多元化需求驅(qū)動下，AI Agent市場呈爆發(fā)式增長態(tài)勢，2024年全球AI Agent市場規(guī)模約為51億美元，預(yù)計2030年將飆升至471億美元，復(fù)合年增長率高達(dá)44.8%。

與GPT等對話式AI不同，AI Agent能像人類助手般獨(dú)立規(guī)劃任務(wù)、調(diào)用工具并交付成果。如果說大模型讓AI長出了“腦”，那AI Agent就是讓AI長出了“手和腳”。借用OpenAI前應(yīng)用研究主管Lilian Weng的經(jīng)典定義，一個合格的Agent需要三大核心能力：Planning（規(guī)劃）、Tool use（工具使用）、Memory（記憶）。

AI Agent的熱潮并非偶然，而是技術(shù)演進(jìn)的必然產(chǎn)物。早在2024年紅杉AI峰會上，吳恩達(dá)教授便預(yù)言“AI Agent是AI發(fā)展的下一個關(guān)鍵階段”。實際上，市場對AI Agent更早的感知來自于OpenAI和Anthropic。

· 2024年10月，由OpenAI前研究副總裁達(dá)里奧·阿莫迪、大語言模型GPT-3論文的第一作者湯姆·布朗等人共同創(chuàng)立的企業(yè)Anthropic，推出了基于Claude模型的擴(kuò)展功能Computer Use，用戶能夠像指揮人類一樣指導(dǎo)Claude操作電腦，包括移動光標(biāo)、點(diǎn)擊按鈕和輸入文本。在國內(nèi)，智譜是最早探索Agent的初創(chuàng)企業(yè)，同期推出自主智能體AutoGLM。

· 2025年1月，OpenAI推出基于Computer-Using Agent模型的了首款A(yù)I智能體Operator，可以根據(jù)用戶指令，在云端執(zhí)行任務(wù)，如訂餐、制定計劃、購物等。具體來說，CUA將GPT-4o的視覺能力與強(qiáng)化學(xué)習(xí)的高級推理能力相結(jié)合，經(jīng)過訓(xùn)練可以與圖形用戶界面（GUI）交互，就像人類使用鼠標(biāo)和鍵盤操作一樣。如果遇到問題，Operator可以利用其推理能力自我糾正，遇到故障卡頓、需要幫助時，它會將控制權(quán)還給用戶，就像自動駕駛一樣。

可以預(yù)判的是，AI Agent是大模型公司不會錯過的產(chǎn)品方向，憑借算力、數(shù)據(jù)等優(yōu)勢，大廠基本都是在模型端、應(yīng)用端、智能體開發(fā)平臺協(xié)同三個領(lǐng)域閉環(huán)發(fā)展，傾向于以MaaS（模型即服務(wù)）形式將Agent嵌入現(xiàn)有應(yīng)用生態(tài)。大廠們的思路在于，利用AI智能體賦能業(yè)務(wù)，完善AI應(yīng)用生態(tài)，提高業(yè)務(wù)及自身在AI時代的競爭力。垂類企業(yè)則聚焦行業(yè)Know-how，開發(fā)場景化解決方案：例如，工業(yè)軟件廠商可基于Agent優(yōu)化生產(chǎn)流程，而網(wǎng)絡(luò)安全企業(yè)可增強(qiáng)威脅響應(yīng)能力。

大廠現(xiàn)在幾乎人手一個AI應(yīng)用，有自研大模型，同時接入了DeepSeek-R1推理模型，RAG、聯(lián)網(wǎng)搜索更是現(xiàn)成的，原地改造或者再造一個Manus幾乎不是問題。而AI初創(chuàng)企業(yè)布局智能體的思路在于，推出更多可場景化的落地方案，尋找商業(yè)變現(xiàn)的路徑。隨著技術(shù)的不斷發(fā)展和市場的逐漸成熟，AI Agent領(lǐng)域的競爭將愈發(fā)激烈，各企業(yè)的產(chǎn)品也將不斷迭代升級，以滿足用戶日益增長的需求。

進(jìn)入2025年，從Operator到Manus，從大廠到獨(dú)角獸的競相加速，一場圍繞AI Agent的競逐賽悄然拉開帷幕。就像比爾·蓋茨曾說的，“誰能主宰AI Agent，那才是大事，因為你將永遠(yuǎn)不用去搜索網(wǎng)站或者亞馬遜”。Manus的爆火出圈，反映的是大眾對于以Manus為代表的這一類AI Agent產(chǎn)品的期待，拋開“套殼”帶來的爭議，當(dāng)智能體的價值被更多人看到，智能體時代有望加速到來。

在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

新聞中心

「Agent代理人」將是AI競賽新的破局者？

評論

相關(guān)推薦

技術(shù)專區(qū)