Weight Standardization

본 포스트는 최근 발표된 새로운 normalization 기법인 Weight Standardization에 대해 소개합니다. Introduction Normalization은 머신러닝에서 데이터의 불필요한 정보를 제거하고 학습을 용이하게 하기 위해 매우 중요한 요소입니다. 특히 Batch Normalization (BN)은 딥러닝 모델의 학습을 안정시키고 가속화함으로써 성능을 크게 향상시켰고, ResNet을 비롯한 대부분의 state-of-the-art 모델에서 필수적인 요소로 사용되고 있습니다. 그러나 BN은 minibatch 단위로 normalization을 수행하기 때문에 모델의 성능이 large batch size에…

Read More

Video Object Segmentation using Space-Time Memory Networks

Intro 안녕하세요, Lunit의 박종찬 연구원 입니다. 오늘 소개해드릴 논문은 연세대/Adobe Research에서 연구한 video object segmentation관련 논문입니다. 본 연구를 수행한 팀은 이미 video segmentation에서 DAVIS 2018 challenge 1등[1]을 한 전력이 있습니다.. 본 연구는 이미 어느 정도 유명세를 타서 아시는 분도 많을텐데, 작년에 Adobe MAX 2018 Sneaks에서 “Fask Mask”라는 이름으로 데모를 선보인 적 있고, GTC2019에서 Top Poster Award를 받았습니다.…

Read More

Towards Universal Object Detection by Domain Attention

Intro. 최근 들어 General AI, Universal feature representation 등 여러 종류의 domain이나 task를 동시에 수행할 수 있는 방법론에 대한 관심이 증가하고 있습니다. 여러 domain을 동시에 수행하는 하나의 모델을 설계하는 방법론을 multi-domain leraning이라는 명칭으로 다양한 연구가 진행되고 있으며, image classification 분야에서는 visual decathlon [1] 데이터셋을 기점으로 해마다 뛰어난 연구결과들이 나오고 있습니다. 이러한 흐름은 지난 글에 자세히…

Read More

FickleNet:Weakly and Semi-supervised Semantic Image Segmentation using Stochastic Inference

안녕하세요, 박천성 연구원입니다. 요즘 weakly and semi-supervised learning에 대한 연구를 진행중인데, classification 혹은 detection 에 대한 연구는 많은 반면 semantic segmentation에 대해선 많지 않았던것 같습니다. 그러던 와중 최근 서울대학교 연구실에서 CVPR 2019에 publish한 연구결과를 발견하여 이번 포스트를 작성하게 되었습니다.  소개해드릴 논문은 “FickleNet:Weakly and Semi-supervised Semantic Image Segmentation using Stochastic Inference, Lee et al” 입니다. 먼저…

Read More

Revisiting Self-Supervised Visual Representation Learning

Introduction Many, if not all, of the near-human or super-human performances achieved by deep learning algorithms are powered by equally impressive annotation efforts. While there is nothing inherently wrong with the supervised learning approach, the question remains whether we can either A) move towards requiring far less supervision (semi-supervised learning) or B) go complete label-free…

Read More

StyleGAN: A Style-Based Generator Architecture for GANs

본 포스트는 최근 NVIDIA에서 발표하여 놀라운 성능으로 화제가 된 StyleGAN에 대해 소개합니다. Introduction 최근 Generative Adversarial Network (GAN) 를 기반으로 한 이미지 합성 기술은 BEGAN, PGGAN 등을 거치며 눈부신 발전을 거듭하고 있습니다. 그러나 Generator를 통한 이미지 합성 과정은 여전히 block box로 여겨지며, 이로 인해 합성되는 이미지의 attribute (성별, 연령, 헤어스타일 등) 을 조절하기가 매우 어렵다는 한계가 있습니다.…

Read More

MentorNet: Regularizing Very Deep Neural Networks on Corrupted Labels

Introduction 딥러닝은 일반적으로 대량의 데이터를 기반으로 학습을 진행합니다 (data-driven). 다양한 딥러닝의 분류 중, 높은 인식 성능을 자랑하는 지도학습의 경우 대량의 데이터-정답 쌍(data-label pair)가 필요합니다. 작은 데이터셋은 손글씨 데이터셋인 MNIST, 작은 이미지로 이루어진 CIFAR 10/100, 그리고 대형 데이터셋으로는 ImageNet, COCO, OpenImage등 많은 이미지에 사람이 직접 라벨을 달아주었습니다. 이러한 라벨링 과정은 인식 성능을 매우 높게 끌어올렸지만, 사람이…

Read More

Multi-Task Learning as Multi-Objective Optimization

Introduction 사람은 방의 사진을 볼 때 방의 구조가 어떻게 되고, 어떤 물건들이 있고, 그것들이 현재 카메라의 위치에서 얼마나 떨어져 있는지를 동시에 파악합니다. 우리는 사진을 단순히 2차원의 그림이나 패턴으로 생각하지 않습니다. 왜냐면 단순히 관측된 사진의 정보보다 더 많은 현실에서의 정보를 실제로 그 공간에 살면서 얻기 때문입니다. 오늘 소개할 “Multi-Task Learning as Multi-Objective Optimization” (NeurIPS 2018) 논문의…

Read More