[Home] AI로 돌아가기

U-Net (Convolutional Neural Network for Image Segmentation)

U-Net 은 바이오메디컬 이미지를 포함한 다양한 이미지 분할 작업에 활용되는 합성곱 신경망 구조이다. U자 형태의 대칭적인 구조를 가지며, 소량의 데이터로도 정밀한 분할이 가능한 것이 특징이다.

1) U-Net의 구조

원래 U-Net은 ISBI cell tracking challenge 2015 대회에서 등장한 모델이다.
U-Net은 인코더와 디코더로 구성된 대칭적인 구조를 갖는다.
1. 인코더는 점진적으로 공간 해상도를 축소하면서 고수준의 특징을 추출하고,
2. 디코더는 이를 이용하여 원래 크기의 분할 결과를 복원한다.
인코더와 디코더 사이에는 스킵 연결(skip connection) 이 존재하여,
저수준 특징 정보를 디코더 단계로 직접 전달함으로써 정확도를 향상시킨다.


U-Net 네트워크는 매우 아름다운(?) 모습을 가지고 있다.
또한 이름도 너무 잘 지어(?) 네트워크 모양이 정말 U 이다.
U-Net 네트워크의 핵심 아이디어는 3가지로 요약할 수 있다.

첫번째, 인코더(Contract path)의 피처맵을 디코더 피처맵에 Concat하여 위치 정보전달
두번째, 데이터셋의 전처리, 변형(deformation)을 이용하여 데이터 수 증가
세번째, 테두리(border line)를 더 잘 분할하기 위해 Weight를 추가한 손실함수(Loss function; 예: Cross-Entropy Loss, Focal Loss, IoU Loss)

U-Net.png
U=Net 구조

2) U-Net의 특징

3) U-Net의 활용

U-Net은 의료 영상 분석(예: CT, MRI, 병변 검출), 위성 영상 처리, 자율주행 차량의 환경 인식, 생물학적 세포 이미지 분석 등 다양한 분야에서 활용된다.