공학관련 분야를 공부하다 보면 벡터를 행렬로 미분한다든지 행렬을 행렬로 미분한다든지 하는 경우가 가끔 있는데

(대표적인 경우가 뉴럴네트워크의 역전파 알고리즘에서 벡터를 행렬로 미분하는 경우)

이 때를 대비해서 간략하게 벡터, 행렬에 대한 미분을 정리하였다.

참고문헌에 있는 훌륭한 문서들에 이런 형태의 미분에 대한 결과가 모두 정리되어 있는데

자세한 증명 과정이 없기 때문에 글 하단에 요긴하게 써먹을 수 있는 주요 공식 몇가지를

자세히 풀어서 전개했다.

전체 글은 jupyter notebook으로 작성되어 있어서 아래 링크를 통해 nbviewer로 공유한다.

Derivatives for vectors, matrices