資源共享分類 |
|
微信:HuangL1121
Q Q:1224848052
團隊:嘉興麥特萊博軟件開發工作室 地址:嘉興港區
|
|
|
神經網絡 |
MATLAB代做|MATLAB專業代做|MATLAB淘寶代做|RPN網絡結構 |
來源:本站 日期:2019/6/27 瀏覽量:936 |
|
|
功能描述:
RPN網絡的作用是輸入一張圖像,輸出一批矩形候選區域,類似于以往目標檢測中的Selective Search一步。網絡結構是基于卷積神經網絡,但輸出包含二類softmax和bbox回歸的多任務模型。網絡結果如下(以ZF網絡為參考模型):
其中,虛線以上是ZF網絡最后一層卷積層前的結構,虛線以下是RPN網絡特有的結構。首先是3*3的卷積,然后通過1*1卷積輸出分為兩路,其中一路輸出是目標和非目標的概率,另一路輸出box相關的四個參數,包括box的中心坐標x和y,box寬w和長h。
(至于之前為什么要用3*3的卷積核,我覺得是和感受野大小相對應的。在原來的ZF模型中,3*3卷積核對應map比例是3/13,相當于在型如1000*600的圖片中采用180左右的感受野。對于1000*600的圖片中大部分目標而言,這個大小的感受野是比較合適的吧。)
從卷積運算本身而言,卷積相當于滑窗。假如輸入圖像是1000*600,則經過了幾次stride后,map大小縮小了16倍,最后一層卷積層輸出大約為60*40大小,那么相當于用3*3的窗口滑窗(注意有padding),對于左邊一支路而言,輸出18個通道,每個通道map大小仍為60*40,代表每個滑窗中心對應感受野內存在目標與否的概率。右支路同理。
二、 anchor機制
anchor是rpn網絡的核心。剛剛說到,需要確定每個滑窗中心對應感受野內存在目標與否。由于目標大小和長寬比例不一,需要多個尺度的窗。Anchor即給出一個基準窗大小,按照倍數和長寬比例得到不同大小的窗。例如論文中基準窗大小為16,給了(8、16、32)三種倍數和(0.5、1、2)三種比例,這樣能夠得到一共9種尺度的anchor,
因此,在對60*40的map進行滑窗時,以中心像素為基點構造9種anchor映射到原來的1000*600圖像中,映射比例為16倍。那么總共可以得到60*40*9大約2萬個anchor。
三、 訓練
RPN網絡訓練,那么就涉及ground truth和loss function的問題。對于左支路,ground truth為anchor是否為目標,用0/1表示。那么怎么判定一個anchor內是否有目標呢?論文中采用了這樣的規則:1)假如某anchor與任一目標區域的IoU最大,則該anchor判定為有目標;2)假如某anchor與任一目標區域的IoU>0.7,則判定為有目標;3)假如某anchor與任一目標區域的IoU<0.3,則判定為背景。所謂IoU,就是預測box和真實box的覆蓋率,其值等于兩個box的交集除以兩個box的并集。其它的anchor不參與訓練。
|
|
|
|
|