Stable Diffusion公司開源大語言模型StableLM,網(wǎng)友:不是我想要的!
眾所周知,去年初創(chuàng)公司 Stability AI 發(fā)布的 AI 圖像生成工具 Stable Diffusion,成為一種革命性的圖像模型,也使 AI“文生圖”實(shí)現(xiàn)了飛速的發(fā)展。
滿載著大家對其“不再局限于開發(fā)圖像生成”和“開源”的期待,在 4 月 20 日, Stability AI 宣布推出開源大型語言模型(LLM)—— StableLM。
(圖源:Stability AI 官方博客截圖)
小參數(shù)大訓(xùn)練,開源備受熱捧
據(jù) Stability AI 官方報道,StableLM 模型還處于 Alpha 階段,參數(shù)比較少,只有 30 億和 70 億個參數(shù),之后還會推出有 150 億到 650 億參數(shù)的模型。作為一個類 ChatGPT 模型,StableLM 模型可以生成文本和代碼,并為一系列下游應(yīng)用程序提供動力,能為小而高效的模型通過適當(dāng)?shù)呐嘤?xùn)提供高性能。
然而,與 ChatGPT、Bard 等模型相比,StableLM 最大的“優(yōu)勢”莫過于可供每一個人下載并部署在本地,就連筆記本也可以跑起來。
正如 Stability AI 在報道中坦言的:“語言模型將成為我們數(shù)字經(jīng)濟(jì)的支柱,我們希望每個人都在他們的設(shè)計中擁有發(fā)言權(quán)?!?/span>
StableLM 目前已在 GitHub 開源,其高性能低消耗等特點(diǎn)快速吸引了一大波人的關(guān)注,不到一天時間,星標(biāo)已接近 6000 Stars。
寫文案、編代碼,還支持商業(yè)化
值得一提的是,StableLM 的發(fā)布主要得益于 Stability AI 在 EleutherAI (一個非營利性研究中心)開源早期語言模型方面的經(jīng)驗(yàn),其語言模型包括 GPT-J 、 GPT-NeoX 和 Pythia 套件,它們基于 The Pile 開源數(shù)據(jù)集訓(xùn)練。
StableLM 是基于一個新的實(shí)驗(yàn)數(shù)據(jù)集訓(xùn)練出來的,該數(shù)據(jù)集基于 The Pile 構(gòu)建,但數(shù)據(jù)集規(guī)模是原來的 3 倍,包含 1.5 萬億個標(biāo)記內(nèi)容。盡管其參數(shù)只有 30 到 70 億(相比之下,GPT-3 有 1750 億個參數(shù)),但這個數(shù)據(jù)集的豐富性使得 StableLM 在對話和編碼任務(wù)中表現(xiàn)出驚人的高性能。
Stability AI 還表示,作為概念驗(yàn)證,他們還使用了斯坦福大學(xué) Alpaca程序?qū)δP瓦M(jìn)行了微調(diào),使用了五個最近的對話代理數(shù)據(jù)集的組合:斯坦福大學(xué)的Alpaca、Nomic-AI的gpt4all、RyokoAI 的ShareGPT52K 數(shù)據(jù)集、Databricks 實(shí)驗(yàn)室的 Dolly 和 Anthropic 的 HH,并把這些模型發(fā)布為 StableLM-Tuned-Alpha。
目前,在官方博客中, Stability AI 也展示了 70 億參數(shù)微調(diào)模型在“文本對話、創(chuàng)作內(nèi)容、編寫代碼”幾個方面的示例:
在對話方面,當(dāng)提問“你會對即將高中畢業(yè)的朋友說些什么”,StableLM 回答說:“你們應(yīng)該為自己的成就、工作、交友等方面感到驕傲,并對自己的未來抱以期望?!?/span>
面對“寫一封郵件”的任務(wù),StableLM 也是可以依照信件的格式,清晰的羅列出相關(guān)內(nèi)容。
(圖源: Stability AI 官方博客截圖)
甚至,StableLM 還可以完成一首 rap 的歌詞:
(圖源: Stability AI 官方博客截圖)
在面對“用 C 語言編寫可以計算機(jī)生命意義”的問題上,StableLM 在“解答未果”后,還用幽默的口吻調(diào)侃道:“生命的實(shí)際意義會有更復(fù)雜的成分,例如社會、哲學(xué)等。”
(圖源: Stability AI 官方博客截圖)
不僅如此,StableLM 模型還允許商業(yè)化,但開發(fā)人員需要遵守 CCBY-SA-4.0 許可條款,自由地檢查、使用和調(diào)整 StableLM 基礎(chǔ)模型。 “大方開源”遭來非議
伴隨著 StableLM 在 GitHub 上的開源,國內(nèi)外網(wǎng)友也展開了熱議,而萬萬沒想到的是,許多網(wǎng)友在試用后,竟開始瘋狂抨擊 StableLM 的效果:
“我試圖用它生成的所有東西,但最后我都沒有采納?!保?/span>
“StableLM 的‘開源’是唯一的優(yōu)勢了吧”;
“它的回答結(jié)果真的平平無奇,不是我想要的”。
但是,也有網(wǎng)友幫忙解釋道:
“畢竟 Alpha 版本的參數(shù)量目前較小”;
“我還是相信在不久的將來, StableLM 會進(jìn)步的”;
“能大方開源,已經(jīng)讓我欣慰了”。
此外, StableLM 模型“開源”的安全性等問題也備受大家關(guān)注。
眾所周知,去年在 Stable Diffusion 發(fā)布后,Stability AI 遭到了很多藝術(shù)家的投訴和起訴。因此,很多人對 StableLM 表示懷疑:“ 不知道是否還會引發(fā)訴訟”、“害怕又發(fā)生剽竊問題”……
與此同時,不少人擔(dān)心有人會利用開源來撰寫釣魚鏈接的文案和協(xié)同軟件攻擊等。
對此, Stability AI 官方表示:“我們開源我們的模型,以提高透明度并促進(jìn)信任。研究人員可以'深入了解'來驗(yàn)證性能,研究可解釋性技術(shù),識別潛在風(fēng)險并幫助制定保障措施” 。
參考鏈接:
https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-modelshttps://techcrunch.com/2023/04/19/stability-ai-releases-chatgpt-like-language-models/?guccounter=1https://news.ycombinator.com/item?id=35629127https://github.com/Stability-AI/StableLM
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。