車產(chǎn)翻譯模板 機器學習中的正負樣本
日期:2023-03-11 12:39:36 / 人氣: 876 / 發(fā)布者:成都翻譯公司
對于機器學習中的正負樣本問題,之前思考過一次,但是后來又有些迷惑,又看了些網(wǎng)上的總結(jié),記錄在這里。下面摘錄一段博客中的解釋,是針對與SSD訓練中的正負樣本的生成問題:具體的代碼還沒有仔細研究,F(xiàn)asterRcnn也是類似的策略,它們的代碼都值得好好研究一下,但是目前還不知道yolo再選取負樣本的時候有沒有用到什么策略,有時間應該拜讀一下論文。關(guān)于機器學習中的正負樣本問題,我之前想過一次,但后來有點糊涂了。我閱讀了一些在線摘要并記錄在此處。
我們經(jīng)常涉及的任務是檢測和分類。
對于分類問題,正樣本就是我們要正確分類的類別對應的樣本。例如,我們需要對一張圖片進行分類,以確定它是否屬于汽車。那么在訓練過程中,汽車的圖片是一個正樣本。原則上,一個負樣本可以選擇任何其他不是汽車的圖片車產(chǎn)翻譯模板,這樣就可以訓練一個汽車的分類網(wǎng)絡。在這個網(wǎng)絡上測試會發(fā)現(xiàn)車產(chǎn)翻譯模板,它會將一些非汽車圖片誤報為汽車。假陽性圖片是“困難樣本”。在后續(xù)的訓練中,這些硬樣本被加入到負樣本集中進行訓練。*終的網(wǎng)絡模型效果會更好。這個過程被稱為“困難的例子”。Dig”。另外,在選擇負樣本時,原則上,您可以選擇任何非汽車圖片作為負樣本,但更合理的情況應該考慮實際應用場景,例如實際應用是行車記錄儀上拍攝的圖片。那么對于分類,負樣本應該是其他非汽車圖片,如道路、樹木、路燈等。
針對檢測問題,需要判斷哪里有什么東西,也就是位置回歸,還要分類。這時候正樣本就是我們預先標出的bbox box的一部分,但是一般的檢測框架都是按照一定的規(guī)則生成一些預測的bbox,所以在選擇正樣本的時候需要判斷重疊在這些生成的 bbox 和 GT bbox 之間。如果重疊大于某個閾值,則將預測的 bbox 視為正樣本。如果沒有超過這個閾值,就被認為是一個負樣本。以下摘自博客中的解釋,針對SSD訓練中正負樣本的生成:
給定輸入圖像和每個物體的Ground Truth,首先找到每個Ground True Box對應的Default Box中*大的IOU作為正樣本。然后,在剩余的 Default Boxes 中,找到那些與任何 Ground Truth Box 的 IOU 大于 0.5 的 Default Box 作為正樣本。其他被視為負樣本(每個 Default Box 要么是一個正樣本 Box,要么是一個負樣本 Box)。如上圖,兩個默認框匹配貓,一個匹配狗。在訓練過程中,采用了Hard Negative Mining的策略(所有box都按照Confidence Loss進行排序,使得正負例的比例保持在1:3),以平衡正負的比例例子。
引自
具體代碼沒有仔細研究。FasterRcnn 也是一個類似的策略。他們的代碼值得研究。但是目前不知道yolo選擇負樣本的時候有沒有什么策略。如果你有時間,你應該閱讀這篇論文。
相關(guān)閱讀Relate
熱門文章 Recent
- 翻譯類英文簡歷模板 英語翻譯個人簡歷范文精選2023-03-11
- 公司翻譯人員求職簡歷模板 英語翻譯崗位簡歷模板-個人求職簡歷模板-精品簡歷-成功簡歷模板2023-03-11
- 房產(chǎn)證翻譯公證英文模板 英國簽證材料中的翻譯件,如果是自己翻譯的,譯者信息如何填?需2023-03-11
- 國外駕駛本翻譯模板 中國駕照翻譯模板2023-03-11
- 職業(yè)翻譯模板下載 翻譯行業(yè)問題不少2023-03-11
- 東倫敦大學翻譯模板 王思聰、陳奕迅、湯唯、張國榮、江疏影、李治廷2023-03-11
- 結(jié)婚認證書翻譯模板 澳洲結(jié)婚證公證認證的法律意義2023-03-11
- 畢業(yè)證翻譯公證模板 青島市市中公證處2023-03-11
- 戶口本德語翻譯模板 專欄文章2023-03-11
- 寫作訓練求職信模板及翻譯 大學求職信2023-03-11