Steady Blog

미분 (극한,적분,테일러 전개 URL 필요 - ing) 본문

스터디/수학

미분 (극한,적분,테일러 전개 URL 필요 - ing)

우유먹고쑥 2021. 10. 14. 19:19

서론

막상 자료를 정리해야지 라고 생각하니, 어떤 것부터 진행해야 하나가 고민이 되었다.

SLAM RoadMap에서 제시하는 수학과 관련된 내용은 4가지인데, 눈앞에 보인, 확률 통계를 시작해보자 라고 생각했다가, 차근차근 시작하는게 목적이지 않았나 라고 생각이 들었다.

따라서, 나는 기초 수학 -> 지수 로그 -> 선형대수 -> 확률 통계 순으로 진행을 해볼까 한다.

 

자료를 정리하는 순서는 고등 수학에서 배우는 순서가 이러지 않았나.. 라는 생각으로 순서를 정했고.

기초 수학은 3가지 항목으로 진행할 계획이다.

 

1. 미분

2. 적분

3. 테일러 전개( Taylor expansion )

 

자.. 이제 첫 번째 정리 시작해보겠다.


미분

미분은 최적화를 수행하는데 필요한 지식이다. 

왜냐하면, '입력된 값을 어떻게 수정하면, 가장 최적의 값이 될까"를 알 수있는 방법이기 때문이다.

 

예시를 하나 들자면, 아래 그림은 y=x^2+2 라는 함수의 최소값을 구한다면, 어떻게 해야 할까?

음.. 직관적으로 생각해보면, x에 임의의 값들을 넣어보면 결국 최솟값을 찾을수 있게 될 것이다.

 

조금 더 생각해보면, 제시된 함수는 2차 방정식이고, 아래로 볼록인 그래프가 그려지니,

어떤 특별한 지점에서 x에 0일때 가장 최소의 값이 되겠구나. 라고 생각할거 같고, 결국 x가 0 일 때, 최솟값을 갖게구나 라고 생각이 될 수 있다.

 

그런데, 이렇게 그래프를 그려서 최솟값을 찾다보면.. 매번 번거롭기도 하고.. 좀 직관적이지도 않은것 같다.

 

작성하다보니 나도 머리가 이상하게 느껴진다..

기울기를 말하고 싶었는데, 조금 어렵게 작성하고 있는 느낌이다.

 

결론을 미리 말하자면, 기울기가 가장 작은 지점을 찾는 방법이 미분이다.

즉, y의 변화량에 따라 x의 변화량이 미분이다.

 

음.. 조금 풀어쓰고 싶어졌다. 다른 사람이 정리한 부분을 보면서 정리하겠다.

미분의 기초에 대해서 작성한 두우우부 님의 블로그에서 작성된 이미지이다.

 

두우우부님께서 작성하신 내용은, 적당한 점 θ1, θ2, θ3에서 이 그래프에 접하는 직선(접선)을 기준으로 이동에 따라 기울기가 어떻게 변화하는를 설명하며, 미분을 이끌어 내었다.

 

 


의도한 기울기를 표현하는 적절한 이미지가 있어, 첨부하였다.

By Brnbrnz - Own work, 참조: BY-SA 4.0, http://me2.do/FyY0uk1n

위 그림처럼, 미분은 움직이고 변화하는 대상의 순간적인 변화를 의미한다.

자 그럼, 이를 식으로 설명해보겠다.

(지금부터 나오는 자료는 다크프로그래머 님의 자료, 주말에 코드를 직접 작성하는 형태로 추가 스터디를 진행 - web을 통해서 작성하는 형태로 진행할 예정 - 2021.10.20 ver)

 

왼쪽그림을 보면, y=2x의 기울기는 2를 바로 알수 있다. (why? 기울기 = y축의 변화량/x축의 변화량 = (4-2)/(2-1) = 2)

오른쪽의 경우는 기울기를 표현하기가 참 애매하다는것을 느끼는데, 이 때 순간 변화률(즉, 미분)의 개념이 드러난다.

(이 순간, 극한의 내용도 정리해야 할 필요를 느껴버렸다.)

 

오른쪽의 경우는, x가 a->b로 이동할 때 y의 변화율을 찾으면 된다.

즉, 오른쪽 그래프는 y= f(x)를 표현하는 그래프이기 때문에, x 구간 [a,b]에서 변화률은 =  ( f(b) - f(a) ) / ( b - a ) = 평균 기울기를 의미한다. 

△x는 구간에서의 x의 변화량을 나타낼 때 쓰는 표현이다 (극한의 개념으로 본다면, dx로 표현된다.)

위 예에서 x는 a- > b로 변했음으로, x의 변화량인 △x는 b-a가 된다. (△x = b-a)

 


(여기서부터는 극한의 개념을 알아야 하는 부분이다. - 내용 정리해서 URL 필요)

위에 설명된 내용은 평균 기울기, 즉, 평균 변화율로 소개되었는데, 우리가 알고자 하는건 순간의 변화이다

즉, 아래 그림과 같이 순간적인 변화율을 알고 싶은것이다.

 

위 곡선 예에서 x = a에서의 순간변화율 f'(a)는 다음과 같이 구할 수 있다. (이를 y에 대한 편미분이라고 표현함)

 

 

그런데, x = a 한점에서가 아니라 모든 점에서의 순간변화율을 구하고 싶으면 어떻게 하는가? (즉, 이 함수의 순간 변화율은 어떻게 되는가?를 의미)

그냥 x를 특정 값으로 국한시키지 않고 x 자체에 대해 일반적으로 순간변화율을 구하면 된다.

 

 

이상으로 미분에 대한 기본적인 개념은 설명은 다 했다. 이러한 미분(순간변화율)은 어떤 시스템(함수)이 있을 때,

이 시스템이 어떤 변수(요인)에 의해 어떻게 영향을 받는지를 분석하는 가장 핵심적인 도구로 사용된다.

 

 

 

추가 1) 편미분 표기법 

Z= f(x,y, ....)에 대해서, z를 x에 대해 편미분을 하면 아래 기호처럼 표현할 수 있음

예제 1)

위 수식을 x에 대해 편미분 하면? 아래 수식으로 된다.

 


 

출처 및 참고 URL

 

1. 미분 설명 1) https://doooob.tistory.com/190?category=878050 

 

[딥러닝 입문 - 3] 미분의 기초 (1/3)

 미분의 기초 3.1 미분과 함수 최소화의 관계 앞장에서 미분이 목적 함수의 최소화에 도움이 된다고 소개했습니다. 이번 장에서는 먼저 구체적인 예를 통하여 그것을 직관적으로 이해해 봅시다.

doooob.tistory.com

2. 미분설명 2) https://darkpgmr.tistory.com/45  (늘 많이 배우고 찾게 되는 다크프로그래머님)

 

미분 적분 제대로 알자

미분과 적분, 줄여서 미적분... 미적분이 중요하다고는 하지만 과연 얼마나 많은 이들이 미분 적분의 의미를 제대로 이해하면서 사용하고 있을지 모르겠다. 이 글은 미분 적분에 대한 가장 기본

darkpgmr.tistory.com

 

3. 편미분 표기 : https://m.blog.naver.com/sw4r/221946248471

 

[미적분학 (Calculus)] 편미분 (Partial Derivative)이란?

수학에서, 여러 변수에 대한 함수의 편미분이라는 것은 여러 변수들 중 하나에 대해서 미분하고, 나머지는 ...

blog.naver.com