본문 바로가기 사이드메뉴 바로가기 주메뉴 바로가기

주메뉴영역

주메뉴영역

혁신으로 세상을 바꾸는 융복합 대학, DIGIST
Innovative University Changing the World through Convergence
이 페이지를 SNS로 퍼가기

Research

다양한 영상 속 물체 분석에 탁월한 신개념 인공지능 모델 개발

  • 조회. 295
  • 등록일. 2021.10.28
  • 작성자. 대외협력팀

DGIST 황재윤 교수팀, 세계 최고 성능의 물체 분할을 위한 도메인 적응형 딥러닝 기술 개발

리모트 센싱, 의료영상 분야 인공지능 기술 발전에 획기적 기여 예상돼

 

[DGIST 정보통신융합전공 황재윤 교수(우), 이경수 박사과정생(좌)]

 

 DGIST(총장 국양) 정보통신융합전공 황재윤 교수팀이 딥러닝 기술을 활용해 도메인이 상이한 영상에서의 물체 분할을 위한 세계 최고 인공지능 신경망 모듈을 개발했다. 이번 연구 성과는 리모트 센싱, 의료영상 분야 기술 발전에 있어 긍정적인 영향을 줄 것으로 기대된다.

 최근 인공지능의 한 분야인 딥러닝 기법이 고도화되고 그 성능이 가파르게 증가함에 따라 관련 연구가 활발하다. 특히 산업분야에서의 요구가 꾸준히 증가하며, 더 넓고 다양한 분야와 관련된 항공 영상이 획득되었다. 다만, 항공 영상은 촬영하는 시각뿐만 아니라 촬영위치, 도시 등에 따라서 항공영상의 특성을 나타내는 도메인이 달라진다. 이렇게 항공사진들이 모두 각기 다른 도메인을 갖게 되면, 향후 다른 도메인을 갖는 각각의 여러 항공영상을 통합, 종합적인 사진 내 특정 물체 검출이나 영상 예측에 활용이 어려운 한계가 있다.

 이에 황재윤 교수 연구팀은 여러 도메인의 항공영상들의 네트워크 파라미터를 가변적으로 미세조정 한다면 이러한 문제를 해결 할 수 있을 것이란 가설을 세우고 연구를 진행했다. 그 결과, 연구팀은 항공 영상 상의 건물을 정확하게 분할하거나, 다양한 도메인의 항공 영상에서 건물을 정밀하게 탐지하는데 성공했다. 또한 생성적·적대적 신경망의 구조를 확장, 촬영되는 사진에 입력되는 도메인에 맞게끔 인공지능 신경망의 파라미터를 자체적으로 변화할 수 있는 도메인 적응형 신경망도 함께 개발했다.

 연구팀이 개발한 신경망은 다양한 도메인들에 맞춰 자체적으로 파라미터를 변형할 수 있다는 장점을 지닌다. 이에, 여러 도메인의 항공영상에서 건물 검출(segmentation)을 위한 알고리즘을 적용하였을 때, 인공지능 신경망을 학습한 도메인을 포함한 다른 다양한 도메인의 항공영상에서도 건물의 위치와 경계 및 모양을 정확하게 검출할 수 있었다.

 DGIST 정보통신융합전공 황재윤 교수는 이번 연구를 통해 개발한 신경망은 도메인에 따라 신경망이 자가 적응하는 새로운 신경망이라며 향후 관련 기술을 좀 더 개선한다면 리모트 센싱, 의료 영상 등 많은 분야들에 적용되어 인공지능 분야의 발전에 긍정적인 영향을 줄 것으로 기대된다고 말했다.

 한편, 이번 연구 결과는 제1저자인 정보통신융합전공 이경수 석박통합과정생이 참여했다. 아울러 컴퓨터 비전 및 인공지능 분야 최상위 학회인 ‘International Conference on Computer Vision(ICCV) 2021’ 학회에 소개됐다.

 

 

· · ·

 

연구결과개요

Self-Mutating Network for Domain Adaptive Segmentation in Aerial Images

Kyungsu Lee, Haeyun Lee, and JaeYoun Hwang

(International Conference on Computer Vision, 2021)

 

딥러닝의 발전과 성능 향상과 더불어 물류 및 군수 산업의 수요에 따라 항공영상에서의 물체 검출 기술 개발의 필요에 대한 요구가 증가하고 있다. 하지만, 항공영상은 촬영하는 시간 뿐 아니라, 장소 및 도시에 따라서 그 특성을 나타내는 도메인이 달라 하나의 통합된 데이터셋을 구성하는 데 어려움이 있다. 이는, 인공지능 신경망을 하나의 도메인에 대해 학습하였을 때, 다른 도메인의 건물 및 물체 검출을 수행하는 데 있어 충분한 성능이 보장되지 않는 문제점을 지니고 있다. 이를 해결하기 위해 현재의 연구는 단순히 인공지능 신경망의 구조를 바꾸거나 항공영상의 도메인을 변경하는 전처리 방식에 초점을 맞춰왔다. 하지만 기존 방법은 항공영상의 도메인을 완벽하게 일치시킬 수 없을 뿐만 아니라 여전히 남아 있는 도메인 간극 (domain gap)에 의해 건물 검출의 성능이 충분하지 않다는 문제점을 지니고 있다.

본 연구에서는 항공 영상의 도메인을 일치시키는 것이 아닌, 인공지능 신경망의 특성을 입력 도메인에 맞게끔 미세 조정(fine-tuning)하는 새로운 방식을 제안하였다. 이는 생성적 적대적 신경망 기반의 구조를 확장시켜 하나의 도메인에 학습된 네트워크의 파라미터들을 예측 시에 변형하는 방식으로 설계되었다. 제안하는 기법은 여러 도메인의 항공 영상에 적용되었고, 학습되지 않은 도메인의 항공 영상에서도, 건물 위치 및 모양의 검출 성능을 크게 향상하는 것으로 확인되었다.

 

 

· · ·

 

 

연구결과문답

Q. 이번 성과 무엇이 다른가?

기존의 연구들은 여러 도메인의 항공 영상을 하나의 도메인으로 변형하는 기법을 시도하였다. 하지만, 기존 연구는 다양한 도메인에 대해 일관적인 도메인으로 변경하는 데 제한적이라는 한계점을 지니고 있다. 이번 연구는 입력 영상의 도메인에 맞게 인공지능 신경망의 파라미터를 자체적으로 변형하는 기법을 기반으로 설계하였고, 다양한 도메인의 항공영상에 적용하여 건물 검출을 시도하였을 때, 기존 연구의 한계를 뛰어넘는 성능 향상을 보였다.

Q. 어디에 쓸 수 있나?

항공영상은 지도를 활용하는 산업에서 많이 활용되고 있으나, 그 숫자가 많고 도메인이 다양하여, 모든 도메인에 대해 인공지능 신경망을 학습하는 것은 제한적이다. 본 연구에서 제안된 인공지능 신경망은 하나의 도메인에 대해 학습되더라도, 다른 도메인의 항공 영상에서도 높은 정확도로 건물 검출을 가능하게 하여, 다양한 항공 영상을 지니고 있는 도메인 적응 기법이 활용되는 산업에서 정밀한 물체 검출이 필요한 경우 활용하면 효과적이다.

Q. 실용화까지 필요한 시간은?

본 연구에서 고안된 신경망은 당장 사용이 가능하지만, 알고리즘의 정확도 향상과 안정적인 성능을 제시하기 위해 최적화를 진행 중이다.

Q. 실용화까지 필요한 과제는?

여러 도메인의 항공영상에서 건물 검출이 정밀하게 가능하다는 것을 보였으나, 입력 영상의 도메인에 맞게 인공지능 신경망의 파라미터를 미세 조정하는 데 시간이 오래 걸린다는 단점을 지니고 있다. 실용화를 위해서는 알고리즘의 속도를 개선할 필요성이 있다.

Q. 연구를 시작한 계기는?

항공영상은 산업적으로나 전략적으로 매우 중요하기에 항공영상 분석에 관한 연구가 활발하게 진행되고 있으나, 관련 연구는 아직 높은 성능에 도달하지 못하였다. 기존 연구들의 검토를 바탕으로 항공영상에서 물체의 검출을 좀 더 정밀하게 수행할 수 있는 방법을 고려하였고, 건물 경계 부분의 정보를 활용하고자 하는 아이디어를 떠올리게 되었다. 이를 바탕으로 인공지능 신경망을 설계하는 데부터 연구를 시작하였다.

Q. 어떤 의미가 있는가?

하나의 도메인의 항공 영상에 대해 학습시킨 인공지능 신경망을 여러 도메인의 항공영상에서 건물의 위치와 모양을 정밀하게 검출이 가능하다는 것을 의미한다. 이를 여러 도메인에서의 물체 검출에 활용하면 더 많은 산업에 기여를 할 수 있을 것이다.

Q. 꼭 이루고 싶은 목표는?

보편적인 상황에도 적용 가능한 신경망을 개발하는 것이 목표이다. 

 

· · ·

 

그림설명

[그림 1] 인공지능 신경망 구조


 

[그림 2] 여러 도메인의 항공 영상에서 건물 추출 인공지능 망 및 결과 


 
(그림설명) 다양한 도메인의 항공영상을 통해 인공지능 신경망을 학습한 후 다른 도메인의 항공 영상에서 건물 검출한 결과 및 경계를 나타낸다. 가장 마지막 열의 영상이 본 연구진이 개발한 인공지능 신경망을 통해 검출한 결과이며, 다른 첨단 모델 (state-of-the-art) 신경망 모델들과 비교하였을 때, 더 나은 성능을 보였다.
 
 
 
 

 
콘텐츠 담당 담당부서  :   대외협력팀 ㅣ 053-785-1135