ChatGPT 慘遭嫌棄,Llama 2 開(kāi)源春風(fēng)得意、OpenAI 表示不服!
既開(kāi)源又免費(fèi)的 Llama 2 一經(jīng)發(fā)布頗有席卷之勢(shì),成了最火爆的開(kāi)源 ChatGPT 替代,國(guó)內(nèi)外不少開(kāi)發(fā)者及企業(yè)都跟風(fēng)進(jìn)行模型的研究和商業(yè)開(kāi)發(fā),比如這幾天 OpenAI 傳奇科學(xué)家 Andrej Karpathy 就用純 C 語(yǔ)言打造了一個(gè)輕量版的 Llama 2 模型。而反觀被稱為大模型天花板的 GPT-4 則很不如意,深陷智商下降漩渦。
ChatGPT 什么時(shí)候不聰明了?
自今年三月 GPT-4 發(fā)布后,已經(jīng)有不少的開(kāi)發(fā)者和用戶在 OpenAI 論壇提到使用 ChatGPT 時(shí)會(huì)出現(xiàn)不連貫性、非自然語(yǔ)言、以及推理等問(wèn)題。其核心癥結(jié)眾說(shuō)紛紜,有學(xué)者懷疑是 OpenAI 的系統(tǒng)修改和升級(jí)導(dǎo)致,通過(guò)削弱運(yùn)算性能從而實(shí)現(xiàn)降本增效。然而由于 ChatGPT 閉源的屬性,我們很難確定其背后的真正原因。
OpenAI社區(qū)討論GPT-4性能的帖子尤其熱鬧
圍繞 GPT 智商下降的討論在 “How is ChatGPT's Behavior Changing Over Time?” 論文的發(fā)布之下被推向了頂峰,來(lái)自斯坦福大學(xué)和加州大學(xué)伯克利分校的學(xué)者 Lingjiao Chen、Matei Zaharia 和 James Zou 對(duì) 3 月和 6 月不同版本的 GPT-3.5 和 GPT-4 進(jìn)行了任務(wù)測(cè)試,結(jié)果發(fā)現(xiàn)不同版本的結(jié)果出現(xiàn)顯著的表現(xiàn)差異(漂移 drifting)。
首先是程序員們最為關(guān)心的代碼生成能力。即使在明確聲明不要注釋的前提下,新版 GPT-3.5 和 GPT-4 仍然添加了更多的非代碼文本和注釋,使回答變得繁雜冗長(zhǎng)。同時(shí),代碼質(zhì)量下降使得直接可執(zhí)行代碼生成的比例更低(GPT-4 從 3 月的 52%下降到 6 月的 10%)。這對(duì)于程序員們而言,可能在用 LeetCode 刷題時(shí),自己答對(duì)的概率比 ChatGPT 還能高不少。
面對(duì)如此多的討論,OpenAI 否定了 ChatGPT 性能倒退的說(shuō)法。OpenAI 產(chǎn)品副總裁 Peter Welinder 在一條推文中說(shuō):“我們并沒(méi)有讓 GPT-4 變得愚蠢。恰恰相反:我們使每個(gè)新版本都比前一個(gè)版本更智能?!彼岢隽艘粋€(gè)猜想,“你用得越多,越能注意到以前沒(méi)有看到的問(wèn)題,”并鼓勵(lì)大家把覺(jué)得 GPT 退化的截圖發(fā)給他用以分析。
有趣的是,Chen 等人對(duì) ChatGPT 測(cè)試的論文與 Llama 2 幾乎同時(shí)發(fā)表,無(wú)論用途和用戶,向所有人開(kāi)放免費(fèi)下載使用。“OSS LLM 不會(huì)這么保密。我們可以作為一個(gè)社區(qū)嚴(yán)格版本化和跟蹤回歸、診斷和修復(fù)所有這些問(wèn)題,”Fan 在推文中提到。自 ChatGPT 橫空出世之后,人人都在呼喚、渴求它的開(kāi)源,然而終究是石沉大海。哪怕是當(dāng) OpenAI 創(chuàng)始人 Sam Altman 被直接問(wèn)到關(guān)于開(kāi)源的問(wèn)題時(shí),他的回答依然很巧妙地規(guī)避了 GPT 是否會(huì)開(kāi)源,只是說(shuō)“我們未來(lái)會(huì)有更多開(kāi)源大模型,但沒(méi)有具體模型和時(shí)間表”。這也是為什么 Llama 2 火速收獲全球開(kāi)發(fā)者及企業(yè)喜愛(ài)的關(guān)鍵所在。而對(duì)于搭建像 ChatGPT 一樣封閉式的大語(yǔ)言模型,對(duì)于安全的不確定性、更持續(xù)透明的信息同步和維護(hù)依然是開(kāi)發(fā)者最為迫切的需求。參考鏈接:https://twitter.com/DrJimFan/status/1681716564335394817https://arxiv.org/abs/2307.09009https://www.theregister.com/2023/07/20/gpt4_chatgpt_performance/?td=rt-3ahttps://community.openai.com/t/experiencing-decreased-performance-with-chatgpt-4/234269https://twitter.com/OfficialLoganK https://twitter.com/OpenAI
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。