본문 바로가기

논문 리뷰/Image Classification

(6)
[논문 리뷰] Densely Connected Convolutional Networks (DenseNet) 기존 CNN 기반 네트워크기존 CNN 기반 네트워크는 다음과 같은 식으로 구성됩니다:이 식에서 xl은 lll번째 레이어의 출력을, Hl은 l−1번째 레이어와 l번째 레이어 사이의 non-liear transformation 함수를 나타냅니다. 따라서 이 식은 L−1번째 레이어의 출력을 Hl에 매핑하여 l번째 레이어의 출력을 얻는 것을 의미합니다. 기존 CNN이 가지는 문제점은 네트워크가 깊어짐에 따라 Vanishing gradient 문제가 크게 발생하는 것입니다.이를 해결하고자 ResNet, Highway Networks, FractalNet 등 여러 모델이 제안되었습니다. 기존 ResNet 네트워크기존 ResNet은 다음과 같은 식으로 구성됩니다. l번째 layer output을 얻기 위해  L-1..
[논문 리뷰] Deep Residual Learning for Image Recognition(ResNet) 기존의 신경망 구조에서는 네트워크의 깊이를 깊게 할수록 성능이 향상되지 않고 오히려 성능이 저하되는 현상이 발견되었습니다. 이러한 현상은 네트워크가 깊어질수록 최적화가 어려워지는 Degradation Problem 때문입니다. 깊은 네트워크는 복잡한 모델을 학습할 수 있는 잠재력이 있음에도 불구하고, 최적화 과정에서 문제를 겪어 성능이 저하되는 것입니다.이 문제를 해결하기 위해, Kaiming He와 그의 연구팀은 Residual Learning이라는 새로운 학습 방식을 제안하였습니다. Residual Learning은 네트워크가 학습해야 하는 목표를 단순화하여 최적화를 용이하게 만듭니다. 이를 통해 깊은 네트워크에서도 안정적으로 학습이 가능하게 되었습니다.ResNet & Residual Learning..
[논문 리뷰] Going deeper with convolutions(GoogLeNet) 이번 포스팅에서는 2014년 ILSVRC에서 우승한 모델인 GoogLeNet, 또는 Inception에 대해 살펴보겠습니다. 이 모델의 이름은 영화 “인셉션(Inception)”에서 영감을 받았는데, 인셉션이 꿈속의 꿈을 다루는 것처럼 GoogLeNet은 네트워크 내부에 네트워크를 구축하는 개념을 담고 있습니다.Methods for Improving Network Performance가장 간단한 네트워크 성능 향상 방법은 네트워크의 높이와 너비를 증가시키는 것입니다. 하지만 이 접근법에는 몇 가지 문제가 있습니다.파라미터 수의 증가로 인한 과적합 위험: 네트워크의 크기가 커질수록 학습해야 할 파라미터의 수가 기하급수적으로 증가하여 overfitting에 취약해집니다.계산 자원의 급격한 증가: 네트워크의 ..
[논문 리뷰] VERY DEEP CONVOLUTIONAL NETWORKS FOR LARGE-SCALE IMAGE RECOGNITION(VGGNet) 논문 링크: https://arxiv.org/pdf/1409.1556.pdf VGG(Visual Geometry Group)Net은 2014년 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)에서 준우승을 기록한 모델입니다. VGGNet은 간단한 CNN 기본 아키텍처만을 사용하여 구조가 단순하고 구현이 쉬워, 다양한 분야에서 기본 모델로 널리 사용되고 있습니다. 대표적인 버전으로는 convolution layer가 13개인 VGG16과 16개인 VGG19가 있습니다. ArchitectureVGG16의 구조는 다음과 같습니다:Input Image Size: 224x224x3 (R, G, B)Convolution Layers: 모든 convolution ..
[논문 리뷰] ImageNet Classification with Deep Convolutional Neural Networks(AlexNet) AlexNet은 2012년 ILSVRC(ImageNet Large Scale Visual Recognition Challenge)에서 우승한 모델로, 딥러닝과 컴퓨터 비전 분야에 큰 변화를 가져온 혁신적인 모델입니다. 이전 대회의 우승 알고리즘이 얕은 구조를 가졌던 것과 달리, AlexNet은 CNN 기반의 딥러닝 알고리즘을 사용하여 뛰어난 성능을 보였습니다. AlexNet은 26.2%의 top-5 error를 기록한 2위 모델에 비해 15.3%의 top-5 error로 우승을 차지했습니다.Datasets본 논문에서는 ILSVRC-2010에서 제공한 데이터셋을 실험에 사용했습니다. 직사각형의 이미지가 주어졌을 때, 높이(짧은 변)를 기준으로 256으로 rescale 한 뒤, 중심을 기준으로 crop하여 ..
[논문 리뷰] Gradient Based Learning Applied to Document Recognition(LeNet-5) 1998년에 발표된 Yann LeCun의 논문 "Gradient Based Learning Applied to Document Recognition"은 신경망과 기계 학습을 사용한 패턴 인식 시스템에 대한 혁신적인 접근을 제시했습니다. 이 논문에서 제안된 LeNet 모델은 손글씨 숫자 인식 문제를 해결하기 위해 최초로 제안된 Convolutional Neural Network(CNN)로, 오늘날 널리 사용되는 딥러닝 기술의 기초가 되었습니다. 전통적 인식 방법의 문제점전통적인 숫자 인식 시스템은 Feature Extractor와 Classifier로 구성되어 있으며, 이 접근 방식에는 몇 가지 주요 문제가 존재합니다.Feature Extractor의 한계:설계자가 직접 설계해야 하며, 설계자의 경험과 지..