在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

  • <object id="1jp1h"></object>
    <address id="1jp1h"><nav id="1jp1h"></nav></address>
  • <label id="1jp1h"></label>
    
    

    <bdo id="1jp1h"></bdo>

    博客專欄

    EEPW首頁 > 博客 > 一句話生成“DC 神奇女俠”,精通中文的國產(chǎn)AIGC神器來襲

    一句話生成“DC 神奇女俠”,精通中文的國產(chǎn)AIGC神器來襲

    發(fā)布人:AI科技大本營 時間:2022-11-20 來源:工程師 發(fā)布文章
    導語:中文世界的AIGC已然開啟。通過智源研究院大模型研究團隊開源的雙語 AltDiffusion 模型,可以實現(xiàn)精細長中文Prompts高級創(chuàng)作。

    來,生成式AI(AIGC)正如火如荼地展開。擴散模型在圖像的生成上正在超越GANs,成為文本生成最先進的模型。通過該模型,文本在生成圖片、視頻、音頻,以及分子設(shè)計等“一鍵生成”的技術(shù)上都開始應用。

    在國外,OpenAI、Meta和谷歌等廠商正在不斷發(fā)布最新研發(fā)成果。國內(nèi)科技公司華為、阿里、商湯等也紛紛涌入這一領(lǐng)域。

    對于中文世界的創(chuàng)作者來說,如果應用Dall·E 2等國外工具,將會面臨的難題是:思考英文Prompts準確表達的絞盡腦汁,翻譯軟件詞不達意的尷尬,精細構(gòu)思的 Prompts 在畫面生成中找不到一絲痕跡,亦或面對文化誤解中的“中國風”哭笑不得……

    日前,智源研究院大模型研究團隊開源最新雙語AltDiffusion模型,為中文世界帶來專業(yè)級AI文圖創(chuàng)作的強勁動力:支持精細長中文 Prompts 高級創(chuàng)作;無需文化轉(zhuǎn)譯,從原汁原味中國話直達形神兼?zhèn)渲袊嫞?/span>且在繪畫水平上達到低門檻中英對齊原版 Stable Diffusion 級震撼視效,可以說是講中文的世界級 AI 繪畫高手。

    圖片

    創(chuàng)新模型 AltCLIP 為這一工作的基石,為原 CLIP 模型補齊更強的跨語言三大能力。AltDiffusion 和 AltCLIP 模型均為多語言模型,中英雙語為第一階段工作,代碼與模型已開源。

    AltDiffusion

    https://github.com/FlagAI-Open/FlagAI/tree/master/examples/AltDiffusion 

    AltCLIP

    https://github.com/FlagAI-Open/FlagAI/examples/AltCLIP 

    HuggingFace space試玩地址:

    https://huggingface.co/spaces/BAAI/bilingual_stable_diffusion

    技術(shù)報告

    AltCLIP: Altering the Language Encoder in CLIP for Extended Language Capabilities

    https://arxiv.org/abs/2211.06679  

    圖片

    專業(yè)級中文 AltDiffusion

    長Prompt精細繪畫 + 原生中國風,滿足中文AI創(chuàng)作高手的高需求

    得益于以 AltCLIP 為基礎(chǔ)的強大中英雙語言對齊能力,AltDiffusion 達到近似于 Stable Diffusion 程度的視效水平,尤其具備更懂中國話、更善中國畫的獨特優(yōu)勢,非常值得專業(yè)級中文AI文圖創(chuàng)作者期待。


    長Prompt生成,畫面效果毫不遜色
    Prompt長短是檢驗模型文圖生成能力的分水嶺,越長的Prompt,越考驗語言理解、圖文對齊和跨語言這三大能力。
    在同樣的中英文長 Prompt 輸入調(diào)校下,AltDiffusion 在不少圖片生成案例中表現(xiàn)力甚至更勝一籌:元素構(gòu)成豐富精彩、細節(jié)描摹細膩精準。主流模型同主題創(chuàng)作效果如下:
    圖片圖片圖片圖片圖片更懂中國話,更善中國畫除中英文 Prompts 輸入表現(xiàn)近似之外,AltDiffusion 還能補齊西方世界里中國畫風的不足,利用中文圖文對繼續(xù)微調(diào)出中文特色的生成,例如國畫風格生成模型,產(chǎn)出真正的“中國風”。
    飽覽旖旎國風美圖片圖片圖片圖片圖片圖片圖片AltDiffusion更懂中文,在中國文化語境中的意義描摹上指哪打哪,秒懂創(chuàng)作者意圖。例如對“唐朝盛景”的描繪,避免出現(xiàn)因文化誤解而產(chǎn)生的跑題情況。圖片尤其對原生于中國文化的概念,理解與表現(xiàn)更為精確,得以避免“日本風”與“中國風”混淆,令人啼笑皆非的狀況。例如,與Stable Diffusion在中英文輸入對應唐裝人物風格的Prompts,差異一目了然。對比兩種”中國風“圖片圖片
    在特定風格的生成中,會原生以中文文化語境為身份主體,進行風格創(chuàng)作,例如對于下面帶有"古建筑"的prompt,會默認生成中國古代建筑。在創(chuàng)作風格上更加貼合中文創(chuàng)作者身份。圖片

    中英雙語,生成效果對齊

    AltDiffusion基于Stable Diffusion,通過將原來Stable Diffusion中的CLIP替換成AltCLIP,并且用中英文圖文對對模型進行進一步的訓練得到。得益于 AltCLIP 強大的語言對齊能力,AltDiffusion 的生成效果在英文上與 Stable Diffusion 很接近,在中英文雙語的表現(xiàn)上也體現(xiàn)了一致性。如“戴帽子小狗”的同義中英文Prompts 輸入AltDiffusion后,生成畫面效果基本對齊,一致性極高:圖片在對“男孩”的畫面增加描述詞為“中國男孩“之后,在原小男孩形象基礎(chǔ)上,精準調(diào)整成典型“中國”孩子,在語言控制生成中展現(xiàn)出極佳語言理解能力和精準的生成表達結(jié)果。
    圖片圖片


    圖片

    打通StableDiffusion原生態(tài)

    豐富生態(tài)工具與PromptsBook應用,可玩性極佳

    特別值得一提的是 AltDiffusion 的生態(tài)打通能力:所有支持Stable Diffusion的工具如Stable Diffusion WebUI,DreamBooth等都可應用在我們的中英雙語 Diffusion 模型上,為中文AI創(chuàng)作提供了豐富選擇。
    Stable Diffusion WebUI 一個優(yōu)秀的文圖生成、文圖編輯的網(wǎng)頁工具;當我們把北大夜景圖霍格沃茨(prompt: Hogwarts)化,瞬間即可呈現(xiàn)夢幻的魔法世界。直通霍格沃茨圖片圖片
    DreamBooth通過少量樣本對模型進行調(diào)試以生成特定的風格的工具;通過這一工具,在AltDiffusion上利用少量中文圖片即可生成特定風格,比如“大鬧天宮”風格。圖片充分利用社區(qū)Stable Prompts BookPrompts 對于生成模型非常重要,社區(qū)用戶通過大量 prompts 嘗試,積累出豐富的生成效果案例。這些寶貴的 prompts 經(jīng)驗,對于 AltDiffusion 用戶幾乎全都適用!此外,還可以通過混合中英文方式去搭配一些神奇的風格和元素,或繼續(xù)挖掘?qū)ltDiffusion適用的中文Prompts。方便中文創(chuàng)作者微調(diào)開源的AltDiffusion提供了中文生成模型的一個基礎(chǔ),大家可以在這個基礎(chǔ)上用更多特定領(lǐng)域的中文數(shù)據(jù)進行模型微調(diào),方便中文創(chuàng)作者表達。
    圖片以首個雙語 AltCLIP 為基石

    全面增強跨語言三大能力,中英對齊,中文更優(yōu),極低門檻語言理解,圖文對齊,跨語言能力,是跨語言研究必備的三種能力。AltDiffusion 的諸多專業(yè)級能力,源于 AltCLIP 以創(chuàng)新性換塔思路,在這三大能力上全面增強:與原 CLIP 中英文語言對齊能力大大提高,可以無縫接入 Stable Diffusion 等所有建立在原 CLIP 上的模型和生態(tài)工具;同時賦予其強悍的中文能力,在多項數(shù)據(jù)集取得中文更優(yōu)效果。(詳細解讀請參考技術(shù)報告)

    值得一提的是,這種對齊方法對訓練多語言多模態(tài)表征模型的門檻大大降低,相對于重新去做中文或者英文的圖文對預訓練,只需約 1% 的計算資源與圖文對數(shù)據(jù)。

    在全面CLIP benchmark中取得了和英文原版一致效果,在一些檢索類數(shù)據(jù)集上如Flicker-30K上超過了原版。

    圖片Flicker-30K上表現(xiàn)效果超過原版CLIP。圖片中文ImageNet上zero-shot結(jié)果最優(yōu)。圖片


    *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



    關(guān)鍵詞: AI

    相關(guān)推薦

    技術(shù)專區(qū)

    關(guān)閉