在线看毛片网站电影-亚洲国产欧美日韩精品一区二区三区,国产欧美乱夫不卡无乱码,国产精品欧美久久久天天影视,精品一区二区三区视频在线观看,亚洲国产精品人成乱码天天看,日韩久久久一区,91精品国产91免费

<menu id="6qfwx"><li id="6qfwx"></li></menu>
    1. <menu id="6qfwx"><dl id="6qfwx"></dl></menu>

      <label id="6qfwx"><ol id="6qfwx"></ol></label><menu id="6qfwx"></menu><object id="6qfwx"><strike id="6qfwx"><noscript id="6qfwx"></noscript></strike></object>
        1. <center id="6qfwx"><dl id="6qfwx"></dl></center>

            博客專欄

            EEPW首頁 > 博客 > 圖像分類:來自13個Kaggle項目的經(jīng)驗總結(jié)

            圖像分類:來自13個Kaggle項目的經(jīng)驗總結(jié)

            發(fā)布人:數(shù)據(jù)派THU 時間:2023-04-24 來源:工程師 發(fā)布文章

            任何領(lǐng)域的成功都可以歸結(jié)為一套小規(guī)則和基本原則,當它們結(jié)合在一起時會產(chǎn)生偉大的結(jié)果。


            機器學習和圖像分類也不例外,工程師們可以通過參加像Kaggle這樣的競賽來展示最佳實踐。


            在這篇文章中,我將給你很多資源來學習,聚焦于從13個Kaggle比賽中挑選出的最好的Kaggle kernel。這些比賽是:


            • Intel Image Classification:https://www.kaggle.com/puneet6060/intel-image-classification

            • Recursion Cellular Image Classification:https://www.kaggle.com/c/recursion-cellular-image-classification

            • SIIM-ISIC Melanoma Classification:https://www.kaggle.com/c/siim-isic-melanoma-classification

            • APTOS 2019 Blindness Detection:https://www.kaggle.com/c/aptos2019-blindness-detection/notebooks

            • Diabetic Retinopathy Detection:https://www.kaggle.com/c/diabetic-retinopathy-detection

            • ML Project?—?Image Classification:https://www.kaggle.com/c/image-classification-fashion-mnist/notebooks

            • Cdiscount’s Image Classification Challenge:https://www.kaggle.com/c/cdiscount-image-classification-challenge/notebooks

            • Plant seedlings classifications:https://www.kaggle.com/c/plant-seedlings-classification/notebooks

            • Aesthetic Visual Analysis:https://www.kaggle.com/c/aesthetic-visual-analysis/notebooks


            我們會討論調(diào)試深度學習解決方案的三個主要方面:


            • 數(shù)據(jù)

            • 模型

            • 損失函數(shù)


            還有很多例子項目(和參考資料)供你參考。


            數(shù)據(jù)


            • 圖像預(yù)處理 + EDA


            圖片


            每一個機器學習/深度學習解決方案都從原始數(shù)據(jù)開始。在數(shù)據(jù)處理管道中有兩個基本步驟。


            第一步是探索性數(shù)據(jù)分析 (EDA)。它幫助我們分析整個數(shù)據(jù)集并總結(jié)它的主要特征,比如類分布、大小分布等等。通常使用可視化方法來顯示這種分析的結(jié)果。


            第二步是圖像預(yù)處理,目的是對原始圖像提高圖像數(shù)據(jù)(也稱為圖像特征)的質(zhì)量,通過抑制不必要的扭曲,縮放,增強重要的特征,使數(shù)據(jù)更適合模型并提高性能。


            你可以鉆研這些Kaggle筆記本,看看一些圖像預(yù)處理技術(shù):


            • Visualisation:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline#Building-a-baseline-model-

            • Dealing with Class imbalance:https://www.kaggle.com/rohandeysarkar/ultimate-image-classification-guide-2020

            • Fill missing values (labels, features and, etc.):https://www.kaggle.com/datafan07/analysis-of-melanoma-metadata-and-effnet-ensemble

            • Normalisation?:https://www.kaggle.com/vincee/intel-image-classification-cnn-keras

            • Pre-processing:https://www.kaggle.com/ratthachat/aptos-eye-preprocessing-in-diabetic-retinopathy#3.A-Important-Update-on-Color-Version-of-Cropping-&-Ben s-Preprocessing


            • 數(shù)據(jù)增強


            圖片


            數(shù)據(jù)增強可以通過從現(xiàn)有的訓(xùn)練樣本中生成更多的訓(xùn)練數(shù)據(jù)來擴展我們的數(shù)據(jù)集。通過大量的隨機轉(zhuǎn)換生成新的樣本,這些轉(zhuǎn)換不僅可以生成可信的圖像,而且還反映了真實的場景 —— 稍后將對此進行詳細介紹。


            這種技術(shù)得到了廣泛的應(yīng)用,不僅僅是在訓(xùn)練模型的數(shù)據(jù)樣本太少的情況下。在這種情況下,模型開始記憶訓(xùn)練集,但無法泛化(在從未見過的數(shù)據(jù)上表現(xiàn)很差)。


            通常,當一個模型在訓(xùn)練數(shù)據(jù)上表現(xiàn)很好,但在驗證數(shù)據(jù)上表現(xiàn)很差時,我們稱之為過擬合。為了解決這個問題,我們通常會嘗試獲取新數(shù)據(jù),如果沒有可用的新數(shù)據(jù),則可以使用數(shù)據(jù)增強。


            注:一般的經(jīng)驗法則是始終使用數(shù)據(jù)增強技術(shù),因為它有助于使我們的模型見識更多的變化并更好地泛化。即使我們有一個很大的數(shù)據(jù)集,也要使用數(shù)據(jù)增強,但這是以較慢的訓(xùn)練速度為代價的,因為增強是在線完成的(即在訓(xùn)練期間)。


            此外,對于每個任務(wù)或數(shù)據(jù)集,我們必須使用反映可能的現(xiàn)實場景的增強技術(shù)(例如,如果我們有一個貓/狗探測器,我們可以使用水平翻轉(zhuǎn)、剪裁、亮度和對比度,因為這些增強匹配不同的照片拍攝方式。


            這里是一些Kaggle比賽notebooks,你可以查看流行的數(shù)據(jù)增強技術(shù):


            • Horizontal Flip:https://www.kaggle.com/datafan07/analysis-of-melanoma-metadata-and-effnet-ensemble

            • Random Rotate and Random Dihedral:https://www.kaggle.com/iafoss/pretrained-resnet34-with-rgby-0-460-public-lb

            • Hue, Saturation, Contrast, Brightness, Crop:https://www.kaggle.com/cdeotte/triple-stratified-kfold-with-tfrecords

            • Colour jitter:https://www.kaggle.com/nroman/melanoma-pytorch-starter-efficientnet


            模型


            圖片


            • 開發(fā)一個基線


            在這里,我們使用一個非常簡單的架構(gòu)創(chuàng)建一個基本的模型,沒有任何正則化或dropout層,看看我們是否能超過50%的準確率基線。盡管我們不可能總能達到這個目標,但如果我們在嘗試了多種合理的架構(gòu)后不能超過基線,那么輸入數(shù)據(jù)可能不包含模型進行預(yù)測所需的信息。


            用Jeremy Howard的名言:


            “你應(yīng)該能夠在15分鐘內(nèi)使用50%或更少的數(shù)據(jù)集快速測試你是否正在朝著一個有希望的方向前進,如果沒有,你必須重新考慮一切。”


            • 開發(fā)一個足夠大可以過擬合的模型


            一旦我們的基線模型有足夠的能力超過基線分數(shù),我們就可以增加基線模型的能力,直到它在數(shù)據(jù)集上過擬合為止,然后我們就開始應(yīng)用正則化。我們可以通過以下方式增加模塊容量:


            • 添加更多層

            • 使用更好的結(jié)構(gòu)

            • 更完善的訓(xùn)練流程


            結(jié)構(gòu)


            根據(jù)文獻,以下架構(gòu)的改進提高了模型的容量,但幾乎沒有改變計算復(fù)雜度。


            • Residual Networks

            • Wide Residual Networks

            • Inception

            • EfficientNet

            • Swish activation

            • Residual Attention Network


            大多數(shù)時候,模型容量和精度是正相關(guān)的 —— 隨著容量的增加,精度也會增加,反之亦然。


            訓(xùn)練過程


            下面是一些你可以用來調(diào)整你的模型的訓(xùn)練過程,通過實例項目來看看它們是如何工作的:


            • Mixed-Precision Training

            • Large Batch-Size Training

            • Cross-Validation Set

            • Weight Initialization

            • Self-Supervised Training (Knowledge Distillation)

            • Learning Rate Scheduler

            • Learning Rate Warmup

            • Early Stopping

            • Differential Learning Rates

            • Ensemble

            • Transfer Learning

            • Fine-Tuning


            超參數(shù)調(diào)試


            圖片


            與參數(shù)不同,hyperparameters是由你在配置模型時指定的(即學習率、epoch的數(shù)量、hidden units的數(shù)量、batch size大小等)。


            你可以通過使用hyperparameter調(diào)優(yōu)庫,比如Scikit learn Grid Search,Keras Tuner來自動化這個過程,而不是去手動配置。這些庫會在你指定的范圍內(nèi)嘗試所有的hyperparameter組合,返回表現(xiàn)最好的模型。


            需要調(diào)優(yōu)的超參數(shù)越多,過程就越慢,因此最好選擇模型超參數(shù)的最小子集進行調(diào)優(yōu)。


            并不是所有的模型超參數(shù)都同樣重要。一些超參數(shù)會對機器學習算法的行為產(chǎn)生巨大的影響,進而影響其性能。你應(yīng)該小心地選擇那些對模型性能影響最大的參數(shù),并對它們進行調(diào)優(yōu)以獲得最佳性能。


            正則化


            這種方法迫使模型學習有意義和具有泛化能力的數(shù)據(jù)表示,通過對記憶/過擬合和欠擬合進行懲罰來實現(xiàn),使模型對于它沒見過的數(shù)據(jù)更魯棒。


            解決上述問題的一個簡單方法是獲得更多的訓(xùn)練數(shù)據(jù),因為一個模型訓(xùn)練的數(shù)據(jù)越多,自然就會泛化得越好。


            這里有一些技巧你可以試著減輕過擬合和欠擬合,項目如下:


            • Adding Dropout:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline

            • Adding or changing the position of Batch Norm:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline

            • Data augmentation:https://www.kaggle.com/cdeotte/triple-stratified-kfold-with-tfrecords

            • Mixup:https://arxiv.org/abs/1710.09412

            • Weight regularization:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline

            • Gradient clipping:https://www.kaggle.com/allunia/protein-atlas-exploration-and-baseline


            損失函數(shù)


            圖片


            損失函數(shù)也被稱為成本函數(shù)或目標函數(shù),用于查找目標輸出的模型之間的差異,并幫助模型最小化它們之間的距離。


            這里是一些最流行的損失函數(shù),與項目實例,你會發(fā)現(xiàn)一些技巧,以提高你的模型的能力:


            • Label smoothing

            • Focal loss

            • SparseMax loss and Weighted cross-entropy

            • BCE loss, BCE with logits loss and Categorical cross-entropy loss

            • Additive Angular Margin Loss for Deep Face Recognition


            • 評估 + 錯誤分析


            圖片


            在這里,我們做消融研究,并分析我們的實驗結(jié)果。我們確定了我們的模型的弱點和長處,并確定了未來需要改進的地方。在這個階段,你可以使用以下技術(shù),并在鏈接的示例中查看它們是如何實現(xiàn)的:


            • Tracking metrics and Confusion matrix:https://www.kaggle.com/vincee/intel-image-classification-cnn-keras

            • Grad CAM:https://arxiv.org/pdf/1610.02391v1.pdf

            • Test Time Augmentation (TTA):https://www.kaggle.com/iafoss/pretrained-resnet34-with-rgby-0-460-public-lb


            有許多實驗跟蹤和管理工具,采取最小設(shè)置為你自動保存所有數(shù)據(jù),這使消融研究更容易。


            最后


            有許多方法來調(diào)整你的模型,并且新的想法總是會出現(xiàn)。深度學習是一個快速發(fā)展的領(lǐng)域,沒有什么靈丹妙藥。我們必須做很多實驗,足夠的試驗和錯誤會帶來突破。


            *博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



            關(guān)鍵詞: AI

            相關(guān)推薦

            技術(shù)專區(qū)

            關(guān)閉