Video Object Segmentation using Space-Time Memory Networks

Intro 안녕하세요, Lunit의 박종찬 연구원 입니다. 오늘 소개해드릴 논문은 연세대/Adobe Research에서 연구한 video object segmentation관련 논문입니다. 본 연구를 수행한 팀은 이미 video segmentation에서 DAVIS 2018 challenge 1등[1]을 한 전력이 있습니다.. 본 연구는 이미 어느 정도 유명세를 타서 아시는 분도 많을텐데, 작년에 Adobe MAX 2018 Sneaks에서 “Fask Mask”라는 이름으로 데모를 선보인 적 있고, GTC2019에서 Top Poster Award를 받았습니다.…

Read More

Towards Universal Object Detection by Domain Attention

Intro. 최근 들어 General AI, Universal feature representation 등 여러 종류의 domain이나 task를 동시에 수행할 수 있는 방법론에 대한 관심이 증가하고 있습니다. 여러 domain을 동시에 수행하는 하나의 모델을 설계하는 방법론을 multi-domain leraning이라는 명칭으로 다양한 연구가 진행되고 있으며, image classification 분야에서는 visual decathlon [1] 데이터셋을 기점으로 해마다 뛰어난 연구결과들이 나오고 있습니다. 이러한 흐름은 지난 글에 자세히…

Read More

FickleNet:Weakly and Semi-supervised Semantic Image Segmentation using Stochastic Inference

안녕하세요, 박천성 연구원입니다. 요즘 weakly and semi-supervised learning에 대한 연구를 진행중인데, classification 혹은 detection 에 대한 연구는 많은 반면 semantic segmentation에 대해선 많지 않았던것 같습니다. 그러던 와중 최근 서울대학교 연구실에서 CVPR 2019에 publish한 연구결과를 발견하여 이번 포스트를 작성하게 되었습니다.  소개해드릴 논문은 “FickleNet:Weakly and Semi-supervised Semantic Image Segmentation using Stochastic Inference, Lee et al” 입니다. 먼저…

Read More

Revisiting Self-Supervised Visual Representation Learning

Introduction Many, if not all, of the near-human or super-human performances achieved by deep learning algorithms are powered by equally impressive annotation efforts. While there is nothing inherently wrong with the supervised learning approach, the question remains whether we can either A) move towards requiring far less supervision (semi-supervised learning) or B) go complete label-free…

Read More

StyleGAN: A Style-Based Generator Architecture for GANs

본 포스트는 최근 NVIDIA에서 발표하여 놀라운 성능으로 화제가 된 StyleGAN에 대해 소개합니다. Introduction 최근 Generative Adversarial Network (GAN) 를 기반으로 한 이미지 합성 기술은 BEGAN, PGGAN 등을 거치며 눈부신 발전을 거듭하고 있습니다. 그러나 Generator를 통한 이미지 합성 과정은 여전히 block box로 여겨지며, 이로 인해 합성되는 이미지의 attribute (성별, 연령, 헤어스타일 등) 을 조절하기가 매우 어렵다는 한계가 있습니다.…

Read More

MentorNet: Regularizing Very Deep Neural Networks on Corrupted Labels

Introduction 딥러닝은 일반적으로 대량의 데이터를 기반으로 학습을 진행합니다 (data-driven). 다양한 딥러닝의 분류 중, 높은 인식 성능을 자랑하는 지도학습의 경우 대량의 데이터-정답 쌍(data-label pair)가 필요합니다. 작은 데이터셋은 손글씨 데이터셋인 MNIST, 작은 이미지로 이루어진 CIFAR 10/100, 그리고 대형 데이터셋으로는 ImageNet, COCO, OpenImage등 많은 이미지에 사람이 직접 라벨을 달아주었습니다. 이러한 라벨링 과정은 인식 성능을 매우 높게 끌어올렸지만, 사람이…

Read More

Multi-Task Learning as Multi-Objective Optimization

Introduction 사람은 방의 사진을 볼 때 방의 구조가 어떻게 되고, 어떤 물건들이 있고, 그것들이 현재 카메라의 위치에서 얼마나 떨어져 있는지를 동시에 파악합니다. 우리는 사진을 단순히 2차원의 그림이나 패턴으로 생각하지 않습니다. 왜냐면 단순히 관측된 사진의 정보보다 더 많은 현실에서의 정보를 실제로 그 공간에 살면서 얻기 때문입니다. 오늘 소개할 “Multi-Task Learning as Multi-Objective Optimization” (NeurIPS 2018) 논문의…

Read More

CyCADA: Cycle-Consistent Adversarial Domain Adaptation

이번 포스트에서는 ICML 2018에서 발표된 논문인 “CyCADA: Cycle-Consistent Adversarial Domain Adaptation”라는 논문에 대해 소개드리고자 합니다.   Background 본격적으로 논문을 소개하기에 앞서 domain adaptation에서 풀고자 하는 문제가 어떤 것인지 간단하게 설명하고 넘어가겠습니다.  Unsupervised Domain Adaptation 자율주행 자동차 개발을 위해서 차와 사람을 구분하는 알고리즘을 개발한다고 가정해보겠습니다. 이를 위해 한국 여러 도시를 돌아다니면서 도로 데이터를 모았고, 이러한 데이터로…

Read More