DeepMind的TF Hub demo詮釋「史上最強(qiáng) GAN 圖像生成器」
上圖是樣本生成單元格的控制界面,可以控制:生成樣本數(shù)量、截?cái)嘀?、噪聲種子、和類(lèi)別的參數(shù)。我們可以看看下圖的例子來(lái)說(shuō)明各自的作用。
本文引用地址:http://www.biyoush.com/article/201811/394648.htm如上圖所示,很容易看出,生成樣本數(shù)量(10)和類(lèi)別(芝士漢堡)就是字面的意思,那么截?cái)嘀怠⒃肼暦N子分別有什么作用呢?僅用一張圖看不出來(lái),我們修改一下參數(shù)看看區(qū)別就行了。
這時(shí),我們只需要拖動(dòng)滑塊來(lái)修改參數(shù),然后 Colab 會(huì)立刻執(zhí)行新參數(shù)設(shè)置下的任務(wù),但這也意味著我們一次只能修改一個(gè)參數(shù)。
經(jīng)過(guò)多次實(shí)驗(yàn),我們發(fā)現(xiàn),截?cái)嘀翟酱?,生成樣本的多樣性越?實(shí)際上,截?cái)嘀悼刂频氖请[變量分布(一般呈高斯型)的截?cái)嗑嚯x,也就是采樣范圍,因此不難理解其對(duì)多樣性的作用。
從上到下:截?cái)嘀禐?0.02、0.26、0.58、1.0 的芝士漢堡生成結(jié)果。
而噪聲種子的值對(duì)生成結(jié)果的影響主要是每次生成樣本的初始條件,從而最終生成結(jié)果也會(huì)不同,可以用它來(lái)改善生成多樣性。
最后是類(lèi)別參數(shù)的控制,該 Colab 中提供了 1000 個(gè)類(lèi)別選項(xiàng),可玩性很足,但要找到自己想要的類(lèi)別實(shí)在有點(diǎn)困難??梢赃@樣操作,雙擊這個(gè)單元格,代碼會(huì)顯示在左側(cè),右側(cè)會(huì)出現(xiàn)鉛筆圖標(biāo),點(diǎn)擊該圖標(biāo)后就能查看完整列表,在這個(gè)列表下用 Ctrl+F 搜索類(lèi)別的編號(hào),再返回修改,這樣就簡(jiǎn)單多了。
我們嘗試生成了埃及貓(285)和大熊貓(388)的樣本:
可以發(fā)現(xiàn),埃及貓的眼神不太對(duì),大熊貓有點(diǎn)營(yíng)養(yǎng)不良。論文給出的結(jié)果很真實(shí)自然,但在這個(gè) Colab 實(shí)驗(yàn)中我們也能發(fā)現(xiàn)存在很多「不自然」的生成樣本。
接下來(lái),我們來(lái)嘗試圖像插值任務(wù)。
如上圖所示,這個(gè)任務(wù)的可控參數(shù)有:樣本數(shù)量、插值數(shù)量、截?cái)嘀?、噪聲種子、以及用于插值的圖像類(lèi)別 A 和 B。樣本數(shù)量是指每次插值時(shí)類(lèi)別 A 和類(lèi)別 B 的的初始樣本數(shù)量,如下圖所示樣本數(shù)量為 2。下圖展示了一些示例,供大家參考。注意該圖像插值是生成樣本之間的插值,所以左右兩側(cè)的原圖也會(huì)有些不自然。
圖像插值結(jié)果示例,其中樣本數(shù)量為 2、插值數(shù)量為 5、截?cái)嘀禐?0.2、噪聲種子為 0、類(lèi)別 A 為金毛、類(lèi)別 B 為雞。
其它參數(shù)不變,插值數(shù)量為 10 的插值結(jié)果示例。
金毛和埃及貓的圖像插值結(jié)果。
知道怎么用了吧?自己去耍吧~
評(píng)論