Stable Diffusion公司開源大語言模型StableLM，網(wǎng)友：不是我想要的！

發(fā)布人：AI科技大本營時間：2023-04-24 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

眾所周知，去年初創(chuàng)公司 Stability AI 發(fā)布的 AI 圖像生成工具 Stable Diffusion，成為一種革命性的圖像模型，也使 AI“文生圖”實(shí)現(xiàn)了飛速的發(fā)展。

滿載著大家對其“不再局限于開發(fā)圖像生成”和“開源”的期待，在 4 月 20 日， Stability AI 宣布推出開源大型語言模型（LLM）—— StableLM。

（圖源：Stability AI 官方博客截圖）

小參數(shù)大訓(xùn)練，開源備受熱捧

據(jù) Stability AI 官方報道，StableLM 模型還處于 Alpha 階段，參數(shù)比較少，只有 30 億和 70 億個參數(shù)，之后還會推出有 150 億到 650 億參數(shù)的模型。作為一個類 ChatGPT 模型，StableLM 模型可以生成文本和代碼，并為一系列下游應(yīng)用程序提供動力，能為小而高效的模型通過適當(dāng)?shù)呐嘤?xùn)提供高性能。

然而，與 ChatGPT、Bard 等模型相比，StableLM 最大的“優(yōu)勢”莫過于可供每一個人下載并部署在本地，就連筆記本也可以跑起來。

正如 Stability AI 在報道中坦言的：“語言模型將成為我們數(shù)字經(jīng)濟(jì)的支柱，我們希望每個人都在他們的設(shè)計中擁有發(fā)言權(quán)?！?/span>

StableLM 目前已在 GitHub 開源，其高性能低消耗等特點(diǎn)快速吸引了一大波人的關(guān)注，不到一天時間，星標(biāo)已接近 6000 Stars。

（圖源：GitHub 截圖）

寫文案、編代碼，還支持商業(yè)化

值得一提的是，StableLM 的發(fā)布主要得益于 Stability AI 在 EleutherAI (一個非營利性研究中心)開源早期語言模型方面的經(jīng)驗(yàn)，其語言模型包括 GPT-J 、 GPT-NeoX 和 Pythia 套件，它們基于 The Pile 開源數(shù)據(jù)集訓(xùn)練。

StableLM 是基于一個新的實(shí)驗(yàn)數(shù)據(jù)集訓(xùn)練出來的，該數(shù)據(jù)集基于 The Pile 構(gòu)建，但數(shù)據(jù)集規(guī)模是原來的 3 倍，包含 1.5 萬億個標(biāo)記內(nèi)容。盡管其參數(shù)只有 30 到 70 億（相比之下，GPT-3 有 1750 億個參數(shù)），但這個數(shù)據(jù)集的豐富性使得 StableLM 在對話和編碼任務(wù)中表現(xiàn)出驚人的高性能。

Stability AI 還表示，作為概念驗(yàn)證，他們還使用了斯坦福大學(xué) Alpaca程序?qū)δＰ瓦M(jìn)行了微調(diào)，使用了五個最近的對話代理數(shù)據(jù)集的組合：斯坦福大學(xué)的Alpaca、Nomic-AI的gpt4all、RyokoAI 的ShareGPT52K 數(shù)據(jù)集、Databricks 實(shí)驗(yàn)室的 Dolly 和 Anthropic 的 HH，并把這些模型發(fā)布為 StableLM-Tuned-Alpha。

目前，在官方博客中， Stability AI 也展示了 70 億參數(shù)微調(diào)模型在“文本對話、創(chuàng)作內(nèi)容、編寫代碼”幾個方面的示例：

在對話方面，當(dāng)提問“你會對即將高中畢業(yè)的朋友說些什么”，StableLM 回答說：“你們應(yīng)該為自己的成就、工作、交友等方面感到驕傲，并對自己的未來抱以期望?！?/span>
面對“寫一封郵件”的任務(wù)，StableLM 也是可以依照信件的格式，清晰的羅列出相關(guān)內(nèi)容。

（圖源： Stability AI 官方博客截圖）

甚至，StableLM 還可以完成一首 rap 的歌詞：

（圖源： Stability AI 官方博客截圖）

在面對“用 C 語言編寫可以計算機(jī)生命意義”的問題上，StableLM 在“解答未果”后，還用幽默的口吻調(diào)侃道：“生命的實(shí)際意義會有更復(fù)雜的成分，例如社會、哲學(xué)等。”

（圖源： Stability AI 官方博客截圖）

不僅如此，StableLM 模型還允許商業(yè)化，但開發(fā)人員需要遵守 CCBY-SA-4.0 許可條款，自由地檢查、使用和調(diào)整 StableLM 基礎(chǔ)模型。

“大方開源”遭來非議

伴隨著 StableLM 在 GitHub 上的開源，國內(nèi)外網(wǎng)友也展開了熱議，而萬萬沒想到的是，許多網(wǎng)友在試用后，竟開始瘋狂抨擊 StableLM 的效果：

“我試圖用它生成的所有東西，但最后我都沒有采納?！保?/span>
“StableLM 的‘開源’是唯一的優(yōu)勢了吧”；
“它的回答結(jié)果真的平平無奇，不是我想要的”。

但是，也有網(wǎng)友幫忙解釋道：

“畢竟 Alpha 版本的參數(shù)量目前較小”；
“我還是相信在不久的將來， StableLM 會進(jìn)步的”；
“能大方開源，已經(jīng)讓我欣慰了”。

此外， StableLM 模型“開源”的安全性等問題也備受大家關(guān)注。

眾所周知，去年在 Stable Diffusion 發(fā)布后，Stability AI 遭到了很多藝術(shù)家的投訴和起訴。因此，很多人對 StableLM 表示懷疑：“ 不知道是否還會引發(fā)訴訟”、“害怕又發(fā)生剽竊問題”……

與此同時，不少人擔(dān)心有人會利用開源來撰寫釣魚鏈接的文案和協(xié)同軟件攻擊等。

對此， Stability AI 官方表示：“我們開源我們的模型，以提高透明度并促進(jìn)信任。研究人員可以'深入了解'來驗(yàn)證性能，研究可解釋性技術(shù)，識別潛在風(fēng)險并幫助制定保障措施” 。

參考鏈接：

https://stability.ai/blog/stability-ai-launches-the-first-of-its-stablelm-suite-of-language-modelshttps://techcrunch.com/2023/04/19/stability-ai-releases-chatgpt-like-language-models/?guccounter=1https://news.ycombinator.com/item?id=35629127

https://github.com/Stability-AI/StableLM

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

博客專欄

Stable Diffusion公司開源大語言模型StableLM，網(wǎng)友：不是我想要的！

相關(guān)推薦

技術(shù)專區(qū)

在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

博客專欄

Stable Diffusion公司開源大語言模型StableLM，網(wǎng)友：不是我想要的！

相關(guān)推薦

技術(shù)專區(qū)

Stable Diffusion公司開源大語言模型StableLM，網(wǎng)友：不是我想要的！