借助計(jì)算機(jī)建模及 eBird 數(shù)據(jù)集,馬薩諸塞大學(xué)成功預(yù)測(cè)鳥(niǎo)類遷徙
關(guān)鍵詞:BirdFlow 自然保護(hù) 概率模型
鳥(niǎo)類遷徙是一個(gè)令人著迷的自然現(xiàn)象。據(jù)了解,世界上近五分之一的鳥(niǎo)類會(huì)因繁殖和越冬而進(jìn)行定期的遷徙。在生態(tài)學(xué)中,研究鳥(niǎo)類遷徙路線等生態(tài)規(guī)律,對(duì)保護(hù)瀕危鳥(niǎo)種、維護(hù)生態(tài)平衡、防止流行病的傳播等具有重要意義。
近年來(lái),由于全球氣候變化以及人類活動(dòng)等因素的影響,預(yù)測(cè)鳥(niǎo)類遷徙變得更加困難。近期,馬薩諸塞州立大學(xué)阿姆赫斯特分校的研究生 Miguel Fuentes 和康奈爾大學(xué)的 Benjamin M. Van Doren 等在《Methods in Ecology and Evolution》期刊上發(fā)表了一個(gè)新的概率模型 BirdFlow,該模型利用計(jì)算機(jī)建模和 eBird 數(shù)據(jù)集來(lái)準(zhǔn)確預(yù)測(cè)候鳥(niǎo)的飛行路徑。
本研究成果發(fā)表在《Methods in Ecology and Evolution》
論文地址:
https://besjournals.onlinelibrary.wiley.com/doi/full/10.1111/2041-210X.14052
研究人員利用 eBird Status & Trends project 產(chǎn)生的相對(duì)豐度估計(jì) (abundance esitimates) 來(lái)模擬鳥(niǎo)類移動(dòng),不過(guò)其中也有一個(gè)問(wèn)題,過(guò)往相對(duì)豐度信息只能顯示出每周鳥(niǎo)類的位置范圍,并不能追蹤個(gè)體。因此在本次研究中,研究人員重點(diǎn)解決了這個(gè)問(wèn)題,關(guān)鍵流程如下圖所示:
圖 1:數(shù)據(jù)準(zhǔn)備和建模過(guò)程
Data Preprocessing:預(yù)處理相對(duì)豐度估計(jì)以產(chǎn)生每周的種群分布;
loss function:指定一個(gè)損失函數(shù),使用每周分布以及能量成本的代理對(duì)潛在的模型進(jìn)行評(píng)分;
Model Structure:選擇一個(gè)模型結(jié)構(gòu);
Trained Model:通過(guò)數(shù)值過(guò)程優(yōu)化損失函數(shù)以選擇最佳的模型參數(shù);
Validation:計(jì)算真實(shí)鳥(niǎo)類的平均對(duì)數(shù)似然和 PIT 值,來(lái)驗(yàn)證訓(xùn)練后的模型。
BirdFlow 建模概覽
研究人員使用 ebird R 從 eBird Status & Trends 中下載了 11 種鳥(niǎo)類的相對(duì)豐度估計(jì)值,并且這 11 種鳥(niǎo)類還有可用的 GPS 或衛(wèi)星跟蹤數(shù)據(jù)。
eBird Status and Trends:
https://science.ebird.org/zh-CN/status-and-trends
表 1:使用的 11 種鳥(niǎo)類的 GPS 跟蹤數(shù)據(jù)
下一步,研究人員定義了一個(gè)損失函數(shù),該損失函數(shù)基于從 eBird Status&Trends 中導(dǎo)出每周種群分布、鳥(niǎo)類在不同位置之間的運(yùn)動(dòng)能量成本以及熵正則化項(xiàng)。
在對(duì)損失函數(shù)優(yōu)化前,需要先指定一個(gè)模型結(jié)構(gòu),這里研究人員證明了優(yōu)化過(guò)程只限制在馬爾科夫鏈 (Markov chains) 上搜索是合理的。因此,他們將鳥(niǎo)類的運(yùn)動(dòng)建模為馬爾可夫模型,并進(jìn)行優(yōu)化,包括使用馬爾可夫鏈參量化和優(yōu)化算法。
經(jīng)過(guò)以上步驟,研究人員獲得了一個(gè)訓(xùn)練后的模型,并對(duì)其進(jìn)行了相關(guān)驗(yàn)證。
BirdFlow 驗(yàn)證過(guò)程
驗(yàn)證過(guò)程分為三部分,分別為超參數(shù)網(wǎng)格搜索 (Hyperparameter grid search)、熵校正 (Entropy calibration)、K-周預(yù)測(cè) (k-week forecasting),具體過(guò)程及試驗(yàn)結(jié)果如下。
超參數(shù)網(wǎng)格搜索
驗(yàn)證模型階段,研究人員執(zhí)行了一個(gè)超參數(shù)網(wǎng)格搜索,并用搜索結(jié)果研究了兩個(gè)問(wèn)題。
第一,研究人員通過(guò)一個(gè)消融研究,探究了熵正則化項(xiàng)和距離指數(shù)對(duì)模型質(zhì)量的影響。消融研究結(jié)果如下圖,可以看到所有的 BirdFlow 模型表現(xiàn)的都比只包含鳥(niǎo)類相對(duì)豐度的基準(zhǔn)模型要好。
圖 2:模型類型消融研究
第二,研究人員通過(guò)兩種超參數(shù)選擇方法探究了模型對(duì)超參數(shù)選擇的敏感性。試驗(yàn)結(jié)果如下圖所示,對(duì)大多數(shù)鳥(niǎo)類來(lái)說(shuō),使用 LOO 參數(shù)(其他鳥(niǎo)類的驗(yàn)證跟蹤數(shù)據(jù)選擇)的模型與使用 tuned 參數(shù)(使用該鳥(niǎo)類的驗(yàn)證跟蹤數(shù)據(jù))的模型表現(xiàn)一樣好。其中,性能是以 1 周過(guò)渡的平均對(duì)數(shù)似然 (log-likelihood) 來(lái)衡量的。
圖 3:參數(shù)敏感性
熵校正
下圖展示了熵正則化對(duì)模型校準(zhǔn)的影響。在不同熵權(quán)重下,5 個(gè)版本的丘鷸模型 (American Woodcock model) 的隨機(jī)概率積分變換 (PIT) 直方圖顯示了訓(xùn)練模型對(duì)丘鷸一周的東西方位預(yù)測(cè)情況。
可以看到,直方圖幾乎一致,表明模型的校準(zhǔn)表現(xiàn)良好。
圖 4:熵正則化對(duì)模型校準(zhǔn)的影響
k-周預(yù)測(cè)
圖 5 和圖 6 展示了不同預(yù)測(cè)時(shí)間(以周為單位)下的模型性能。研究人員從超參數(shù)網(wǎng)格搜索中確定了表現(xiàn)最佳的模型,并評(píng)估了從 1 到 17 周,此最佳模型相對(duì)基準(zhǔn)模型的表現(xiàn)。
圖 5(a) 顯示了每種鳥(niǎo)類的結(jié)果。可以看到,隨著時(shí)間的增加,各個(gè)鳥(niǎo)類最佳模型的表現(xiàn)能力越來(lái)越接近基準(zhǔn)模型。圖 5(b) 顯示了丘鷸 tuned 模型、LOO 模型和基準(zhǔn)模型的差距對(duì)比。可以看到,預(yù)測(cè)時(shí)間內(nèi),tuned 模型、LOO 模型表現(xiàn)能力得都比基準(zhǔn)模型好。
圖 5:預(yù)測(cè)性能圖
圖 6:小丘鷸模型推理結(jié)果
經(jīng)過(guò)以上試驗(yàn),研究人員發(fā)現(xiàn) BirdFlow 能利用 eBird 的每周相對(duì)豐度估計(jì)準(zhǔn)確推斷出個(gè)別鳥(niǎo)類的遷徙路徑,而且結(jié)果顯示,BirdFlow 預(yù)測(cè)的結(jié)果遠(yuǎn)比基準(zhǔn)模型要好得多。
基于這個(gè)成果,研究人員認(rèn)為除了探究鳥(niǎo)類遷徙這個(gè)自然現(xiàn)象外,BirdFlow 模型或許還能夠用于其他現(xiàn)象的研究,例如鳥(niǎo)類的中途停留行為及其應(yīng)對(duì)全球變化的反應(yīng)。
然而,盡管 BirdFlow 模型取得了一系列成果,但北美和歐洲一些研究員則對(duì)其使用 eBird 數(shù)據(jù)庫(kù)表示質(zhì)疑,他們認(rèn)為用觀鳥(niǎo)作為收集數(shù)據(jù)方法并不嚴(yán)謹(jǐn)。對(duì)此,BirdFlow 研究人員表示,該團(tuán)隊(duì)正在考慮整合進(jìn)更多數(shù)據(jù),比如衛(wèi)星或 GPS 跟蹤鳥(niǎo)類位置的數(shù)據(jù)。
AI 或?qū)⒊蔀樽匀槐Wo(hù)神
BirdFlow 模型的出現(xiàn),意味著人類在鳥(niǎo)類遷徙相關(guān)研究上,開(kāi)辟出了機(jī)器學(xué)習(xí)這一捷徑。盡管仍處于早期階段,距離自然保護(hù)等落地應(yīng)用也還有一定距離,但這項(xiàng)研究無(wú)疑透露出一個(gè)重要趨勢(shì),AI 正在被廣泛應(yīng)用于自然保護(hù)領(lǐng)域。
卡內(nèi)基梅隆大學(xué)研究人員開(kāi)發(fā)的 PAWS,能為警察生成一個(gè)針對(duì)偷獵者們巡邏的路線;康納爾大學(xué)開(kāi)發(fā)的 Merlin 能根據(jù)鳥(niǎo)類的歌聲和圖像識(shí)別物種;而 Resolve 開(kāi)發(fā)的 TrailGuard AI 則能夠通過(guò)識(shí)別可疑偷獵者的圖像、發(fā)出警報(bào)的方式保護(hù)野生動(dòng)物。
自然生態(tài)系統(tǒng)對(duì)人類的重要性不言而喻,保護(hù)生態(tài)系統(tǒng)也迫在眉睫,而隨著時(shí)間的推移,AI 又會(huì)扮演怎樣的新角色?歡迎大家發(fā)散思維,評(píng)論區(qū)討論。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。