代碼生成超越 ChatGPT,科大訊飛發(fā)布智能編程助手 iFlyCode!星火大模型能力再升級
北京時間 8 月 15 日,科大訊飛于合肥濱湖會展中心舉行星火認知大模型 V2.0 升級發(fā)布會,重磅官宣代碼能力升級了 5 項關(guān)鍵能力,除了常見的代碼生成與補齊、糾錯之外,還有代碼解釋和單元測試生成。而這所有的能力,都可以在訊飛發(fā)布的全新的智能編程助手 iFlyCode 中使用。
為什么要將代碼能力升級擺在第一位?科大訊飛董事長劉慶峰向 CSDN(ID:CSDNnews)表示:“代碼能力對于各行業(yè)的賦能是直接且剛性的。代碼既是鏈接數(shù)字世界的關(guān)鍵支撐,同時也是降低創(chuàng)業(yè)者的門檻的重要工具,不用人人都是編程高手,只要發(fā)揮自己的想象力、基于對應用場景的認知,就可以提升開發(fā)效率、實現(xiàn)相關(guān)創(chuàng)業(yè)。中國無論是軟件產(chǎn)業(yè)還是數(shù)字經(jīng)濟發(fā)展,如果在大模型時代不把代碼能力提升到國際領(lǐng)先水平,那么國民生產(chǎn)效率一定無法和國際巨頭比肩,所以我覺得這件事情很關(guān)鍵。其次,代碼能力的演示也相對更簡單直觀,綜合考慮將代碼放在了多模態(tài)的前面?!?br />
那么,星火的代碼能力實現(xiàn)到了什么程度,劉慶峰表示,在測試中,代碼生成和補齊維度上已經(jīng)超過了 ChatGPT,而訊飛星火代碼各維度的能力將在今年 10 月 24 日實現(xiàn)全面超越 ChatGPT,明年上半年將對標 GPT-4。
而對于編程助手 iFlyCode 是不是對標 GitHub Copilot?科大訊飛研究院院長劉聰向 CSDN 坦言:“當前代碼助手產(chǎn)品都是基于 Copilot 的機制,可以理解為對標 Copilot 的邏輯”。
接下來,就讓我們一起來看,星火大模型對代碼能力的升級實際如何,開發(fā)者們究竟可以如何使用起來從而達到「10 倍工程師」的效果。
代碼生成和補齊上已超越 ChatGPT,明年對標 GPT-4!
在此前星火大模型剛剛發(fā)布時,它生成的代碼,復數(shù)類的代碼基本實現(xiàn)正確,但測試用例沒有一次性生成完整。而到今天,三個月過去,星火的代碼能力距離真實的生產(chǎn)環(huán)境使用更近一步。
此次訊飛星火 2.0 對代碼能力進行了 5 個維度的升級,代碼生成和補齊自不必說,在代碼糾錯上,能夠定位拼寫、語法和邏輯錯誤,還支持一鍵修改;而對程序員們而言,比寫代碼更頭疼的讀代碼在這里有了更好的體現(xiàn),星火的「代碼解釋」功能,只要選中一段代碼,就可以直接給出詳細的解讀。在單元測試生成方面,只要選中代碼,即可一鍵生成單測用例,智能生成單元測試數(shù)據(jù)。
現(xiàn)場體驗區(qū) iFlyCode 的展示對程序員來講,一向「Show me the code」至上。在劉聰?shù)默F(xiàn)場演示中,無論是寫函數(shù)、用 Python 畫愛心、做個貪吃蛇游戲,都能夠迅速搞定。
筆者在實際測試中發(fā)現(xiàn),星火生成代碼速度很快,而且是可以直接運行的。但它在生成的過程中,要真正實現(xiàn)你想要的功能,要調(diào)整或嘗試不同的 Prompt。七夕將近,還是用畫愛心舉例,Python 非常絲滑地 Run 出了愛心。
但切換到 Java 就失敗了,并且嘗試了好幾種不同的 Prompt 還沒有成功。下面給出一個星火明確說是一個可以繪制愛心形狀的 Java 代碼示例 Run 起來的樣式:
當然,用 Java 來畫愛心,使用 ChatGPT 也失敗了(盡管在 Prompt 和 GPT 的回答里都明確說明了是繪制桃心型的代碼示例):
在編程語言支持上,星火對于 Python 的支持能力非常顯著。劉慶峰介紹,根據(jù) OpenAI 構(gòu)建的代碼能力公開測試集 HumanEval,星火 V1.5 Python 的效果只有 41 分,V2.0 已經(jīng)到了 61 分,接近 ChatGPT。根據(jù)認知智能國家重點實驗室構(gòu)建的代碼的真實的場景使用的測試集,代碼生成和補齊維度上已經(jīng)超過了 ChatGPT。依然如之前的計劃,訊飛星火代碼各維度的能力將在今年 10 月 24 日實現(xiàn)全面超越 ChatGPT,明年上半年將對標 GPT-4。對此,劉慶峰表示,“當前對于代碼能力的邏輯、算法、方法、體系、數(shù)據(jù)準備已經(jīng)全部就緒,我們所需要的就是時間和算力,這些東西及算力正在補齊,在今年的 1024 上會看到更新的進展。”
那么,程序員們?nèi)绾胃玫貋硎褂蒙闲腔鸬木幊棠芰Γ琲FlyCode 應運而生。
對標 Copilot,智能編程助手 iFlyCode 都帶來了什么?
在 AI 編程上,當前能夠看到較為普遍的兩類,一類是以 GitHub Copilot 為代表的 IDE 集成,非常普遍,讓程序員們在 IDE 內(nèi)直接實現(xiàn)了編程的閉環(huán),比如 GitHub Copilot Chat 可以讓開發(fā)者們直接在編輯器里收獲類似于 ChatGPT 的體驗,與 VS Code、Visual Studio 深度整合,可以給開發(fā)者提供深入的分析,并能得到對于錯誤的修正建議,Google 的 Android Studio 也采用了集成的方式,以對話式編程助手「Studio Bot」來幫助 Android 程序員提升編程效率。還有一類是從 Chat 打通在線編程平臺,比如 Google 的 Bard 直連 Colab。
我們看到訊飛所選擇的是 IDE 集成,iFlyCode 以程序員們所熟悉的插件形式無縫融入,支持 5 種主流的 IDE。
在發(fā)布會現(xiàn)場,劉聰在集成了 iFlyCode 插件的 VS Code 里,通過幾步 Prompt,沒有寫一行代碼,就實現(xiàn)了用兩個手指捏合就能寫字的“凌空手寫”功能。
根據(jù)訊飛內(nèi)部研發(fā)效能平臺對 2000 余名員工在一個月內(nèi)測試使用 iFlyCode 1.0 的成效數(shù)據(jù)統(tǒng)計,在一些典型場景中,代碼采納率達 30%,編碼效率提升 30%,綜合效率提升 15%。
代碼智能的迭代是迅猛的,正在極大地改變傳統(tǒng)的編程方式,也許 Andrej Karpathy(OpenAI 科學家、曾任 Tesla AI 負責人)之前提出的「最好的編程語言是自然語言」離我們真的不遠了。
同時和朋友們預告下,后續(xù)針對 iFlyCode 等智能編程助手,CSDN 還將為大家?guī)韺懘a實測以及代碼任務(wù)評測,歡迎小伙伴們持續(xù)關(guān)注起來。
AI 編程對于開發(fā)者來說意味著什么?
在當前階段,我們能夠明確看到的是,AI 更進一步地成為了我們的編程助手。它在至少在這三方面對程序員的影響是巨大的。
能夠解決一些可能需要搜索、查看很多資料才能找到答案的問題。多年以來,我們編程的場景一直會使用到大量的搜索,遇事不決問搜索,但很可能花費了大量的時間和精力,卻只能查找到相關(guān)的解決方案,要解決問題還需要大量的調(diào)試和修改。而讓程序員特別頭疼的還有,搜索到的內(nèi)容能夠解決問題的往往會是那 5%-10%。而 AI 編程助手則能夠很快速,而且相對精確地給我們答案,甚至是一段可以直接解決問題的代碼。
還有一些編程上的體力活,比如需要寫一些邏輯不復雜但代碼量相對較大的活,可以直接拋給 AI 編程助手,從而實現(xiàn)編程效率的極大提升。此外,在寫代碼時,有時還會遇到一些不太好下手的代碼,可以直接給 AI,讓它去實現(xiàn)一些邏輯,可能會幫助開發(fā)者找到新思路。
那么,當「人人都是開發(fā)者」,編程的門檻進一步降低,對于開發(fā)者們來說,智能編程會讓開發(fā)者的角色發(fā)生變化嗎?未來,開發(fā)者的核心競爭力會體現(xiàn)在哪些方面?
劉聰這樣和 CSDN 說道:“編程助手能夠簡化程序員的工作,提升生產(chǎn)效率,將開發(fā)者的精力釋放出來,從而能夠做更多的具有創(chuàng)造性的工作?!边@也將是程序員們的不被取代的核心能力所在。
劉慶峰在現(xiàn)場講了這樣一句話——“未來不是屬于 AI,而是屬于掌握了 AI 的新人類”,我將其引申為:“未來不是屬于 AI,而是屬于掌握了 AI 的新程序員?!?/p>
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。