Toggle menu
Toggle personal menu
Not logged in
Your IP address will be publicly visible if you make any edits.

정모/2022.05.12: Difference between revisions

From ZeroWiki
No edit summary
No edit summary
Line 35: Line 35:
# 지정된 부분들만을 잘라서 분류하고
# 지정된 부분들만을 잘라서 분류하고
# 그 중 좋은 것들로만 추려낸다
# 그 중 좋은 것들로만 추려낸다
* 다만 이 방법은 비효율적이다. 2000개의 roi를 전부 cnn에 넣어야 하기 때문임.
* 다만 이 방법은 비효율적이다. 2000개의 roi를 전부 cnn에 넣어야 하기 때문임.
* 이 문제를 해결하기 위해 roi-pooling 같은 기법을 활용해 cnn 순전파 작업을 이미지 하나당 한 번만 할 수 있도록 한 네트워크도 나왔음 (fast r-cnn, sppnet.. 등)
* 이 문제를 해결하기 위해 roi-pooling 같은 기법을 활용해 cnn 순전파 작업을 이미지 하나당 한 번만 할 수 있도록 한 네트워크도 나왔음 (fast r-cnn, sppnet.. 등)
Line 47: Line 48:


= 참여자 =  
= 참여자 =  
[[김도엽]], [[임지민]], [[정우현]], [[최민준]], [[김동욱]], [[김은솔]], [[방석현]], [[이민욱]]
[[김도엽]], [[김동영]], [[방석현]], [[이민욱]], [[이승찬]], [[임지민]], [[채승운]], [[최민준]], [[한성민]]
 
= 2022 카톡방 =
이번 주말내로 개설
 
= 삼성디지털/IT학회 연계 프로그램 =
추가 내용 전달되는대로 해줄 예정


= 댓글 =
= 댓글 =

Revision as of 12:22, 23 May 2022

OMS

  • 김동영 학우님 : 컴퓨터는 객체를 어떻게 탐지할까?

내용

객체 탐지?

  • 컴퓨터 비전 분야에서 흔히 object detection이라고 불림
  • 오래 전부터 연구되어 온 주제이며, 2012년 alexnet이란 딥러닝 네트워크가 등장하기 전까지도 많은 방법이 시도되어 왔음
  • 이번 발표는 딥러닝 이후, 즉 r-cnn 이후를 중심으로 다룰 예정임

이미지 분류

  • 컴퓨터 비전의 가장 중요한 작업은, 당연하게도 이미지를 분류하는 작업이고, 객체 탐지 또한 이미지 분류 문제를 포함함
  • 이미지 인식의 문제는 영상의 다양성에서 비롯됨. 사진이 찍힌 위치, 빛, 자세 등에 따라 컴퓨터는 같은 종류의 이미지를 아주 다르게 인식함
  • 이를 해결하기 위해 데이터 기반의 방법론이 등장함. 가장 대표적인 것이 kNN 분류기이고, 이 분류기는 각각의 test 데이터의 주변에 어떤 클래스의 train 데이터가 가장 많은지를 판단해서 분류함. - 직관적인 분류기
  • kNN보다 조금 더 효율적인 svm은, 데이터를 기반으로 선형 분류기를 만드는 방법임 (기본적으로 svm은 이진 분류기임)
  • 다만 위의 두 방법 모두 raw-pixel을 사용하기 때문에 성능은 둘 다 그렇게 좋지 못함

특징 추출

  • 그래서, 분류 이전에 그 이미지의 특징을 추출하는 작업이 선행되어야 함. 딥러닝 이전에는 이미지의 gradient를 사용해 특징을 추출하기도 했음.
  • 딥러닝 또한 결국은 특징을 추출하는 네트워크임. 이미지가 들어오면 특징 벡터를 출력하는 변환기, 또는 함수라고 봐야 함.
  • 이미지 분류에서 좋은 성능을 보이는 딥러닝 네트워크인 cnn이 등장한 후, 이를 어떻게 객체 탐지로 일반화시킬 수 있을지에 대한 연구가 이어짐. 그 과정에서 최초로 나온 논문이 r-cnn이고, 머신러닝 기법과 딥러닝 기법을 동시에 활용해 객체를 탐지하는 방법을 제시함.

객체 탐지

  • 객체 탐지에서 수행해야 할 작업은 결국 두 가지임.
      • 객체의 위치를 잡고,
      • 그 위치의 객체가 무엇인지 판단
  • 위에서 계속 분류에 대한 이야기를 했으니, 이제 객체의 위치만 나오면 그 부분만 짤라서 cnn에 넣으면 특징 벡터가 나오고, 그럼 svm이든 kNN이든 분류기를 사용해 분류하면 됨
  • 남은 건 객체가 어디있는지 찾는 문제이고, selective search나 sliding window 방법을 사용하면 해결할 수 있음.
  • 그리고 2000개의 roi(regoin of interest) 중 괜찮은 것들로만 추리는 작업(non maximum suppression)이 이뤄지면 정말 끝임

정리

  1. 객체가 있을 법한 곳을 찾고
  2. 지정된 부분들만을 잘라서 분류하고
  3. 그 중 좋은 것들로만 추려낸다
  • 다만 이 방법은 비효율적이다. 2000개의 roi를 전부 cnn에 넣어야 하기 때문임.
  • 이 문제를 해결하기 위해 roi-pooling 같은 기법을 활용해 cnn 순전파 작업을 이미지 하나당 한 번만 할 수 있도록 한 네트워크도 나왔음 (fast r-cnn, sppnet.. 등)

스터디 진행상황 보고

안자구뭐해 [koco] 데중어설 발불 너두노드 코하자

참여자

김도엽, 김동영, 방석현, 이민욱, 이승찬, 임지민, 채승운, 최민준, 한성민

댓글

Describe 정모/2022.05.12 here