CNN 역전파를 이해하는 가장 쉬운 방법The easiest way to understand CNN backpropagation
본 문서의 목적은 CNN(Convolution Neural Network)의 역전파Back propagation 알고리즘을 정리하기 위해 간단한 CNN 모델을 정의하고 정의된 모델에 해당하는 수식을 완전히 유도하는 것이다. 정식 논문은 현학적 표현 때문에 수학 및 배경지식이 많지 않은 비전공자가 읽기 힘들고 인터넷에 있는 많은 보조 문서들은 CNN을 전체적으로 조망하지 않고 일부 수식만을 설명 하기 때문에 초심자로써 CNN 역전파 알고리즘에 대해 포괄적으로 이해하기가 매우 어렵다. 더구나 그런 문서들은 사용하는 기호와 인덱스 기술 방법이 모두 다르고 (수식에 rot180() 이나 flip(), up-sampling()같은 잘모르는 연산자가 등장한다거나, 인덱스를 0부터 쓰는 문서와 1부터 쓰는 문서를 함께 보면 보는 입장에서 매우 혼란스러움), 거의 모두 영어로 되어 있어 초심자의 접근을 더욱 어렵게 만든다. 따라서 CNN 역전파 알고리즘을 처음부터 끝까지 하나의 문서에 통일된 기호를 사용하여 기술한 한글 문서가 있으면 좋겠단 생각을 하였고, 이 문서를 작성하였다.
jekyll 블로그에서 작성된 글이 아닌 별도의 html로 적성되어 다음 링크를 통해 문서를 공유한다.