Gbjbjbj 2021. 12. 30. 01:11

Fast RCNN은 지난 시간에 배웠던 SPP-NET과 크게 다르지 않았다.

 

SPP-NET과는 다른 Fast RCNN의 주요 특징으로는 SPP-LAYER를 ROI Pooling Layer로 변경했고,

기존 svm을 softmax로 변환하고 multi-task loss함수로 classification과 regression을 함께 최적화 했다는 차이점이 존재한다.


 

ROI Pooling이란

위와 같은 14*14 feature map이 존재하고 각각 8*4 roi와 14*7 roi가 존재한다고 할때

 

 

 

 

 

 

왼쪽과 같이 임의의 ROI를 고정 크기의 Pooling 영역으로 매핑시킨다.


 

 

ROI Pooling을 적용한 fast RCNN의 구조는 다음와 같다

출처 : 딥러닝 컴퓨터 비전 완벽 가이드

 

이전 시간에 배웠던 SPP-NET과는 크게 ROI Pooling부분에서 차이가 난다. SPP-NET에서는 SPP-LAYER가 채널까지 1-D형태로 나타낸 layer였던 반면에 ROI Pooling layer에서는 사이즈의 크기만 고정된뿐 채널의 depth는 feature map의 채널의 depth와 같다는 특징이 있다.


 

Fast RCNN 성능비교

출처 : 딥러닝 컴퓨터 비전 완벽 가이드

 

Fast RCNN은 수행 시간에서 기존의 RCNN보다는 획기적인 성능을 보여주었고 SPP-NET보다도 더 간략화된 구조 때문에 training time이나 test time에서 줄어든 수행시간을 보여주었다.