Data scientist/Machine Learning

수학적 개념 이해(2)

맨사설 2021. 8. 19. 14:25
728x90

 

◎ 이산형 확률분포

 

◇ 베르누이 시행 : 실험의 결과의 범주가 2가지인 경우 (성공 / 실패) 

베르누이 식

◇ 이항분포 : 성공확률이 p인 베르누이 시행을 독립적으로 n번 시행했을 때 성공한 횟수의 분포

이항분포 식

◇ 다항분포 : k개 범주의 다항 시행을 n번 반복했을 때, 각 범주가 나타나는 획수의 분포

다항분포 식

 

◇ 포아송분포 : 주어진 단위 구간 내에 평균적으로 발생하는 사건의 횟수가 정해져 있을 때, 동일 단위에서의 발생 횟수

포아송분포 식

 

 

◎ 연속형 확률분포

 

◇ 지수분포 : 평균 소요시간이 u인 사건이 발생하기까지 걸리는 소요시간

지수분포 식

◇ 정규분포 

정규분포 식

 

 

 

◎ 통계적 추론

 

◇ 점추정 (Point estimation) : 추정량을 통해 모수를 추정

 

◇ 구간 추정 (Point estimation) : 일정 신뢰수준 하에서 모수를 포함할 것으로 예상되는 구간을 제시

 

◆ 대립가설 (H1) : 입증하여 주장하고자하는 가설

 

◆ 귀무가설 (H0) : 대립가설의 반대가설.

 

오류의 종류

 

◆ 검정 통계량 : 이 값을 기준으로 귀무가설 기각여부를 결정

 

◆ 기각역 : 검정통계량이 취하는 구간 중 귀무가설을 기각하는 구간

 

 

◆ 단측검정 VS 양측검정

 

◆ 유의확률 (P-value) : 주어진 검정통계량값을 기준으로 해당 값보다 대립가설을 더 선호하는 검정통계량 값이 나올 확률, 유의확률 값이 유의수준보다 낮으면 귀무가설 기각

 

 

 

 

◎ 검정통계량과 관련된 분포

 

 

◇ Z 통계량

Z 통계량 식

◇ t 분포

t 분포 식

◇ 카이제곱 분포

 

◇ F 분포

 

 

 

◎ 미분 개념

  • 미분값은 접선의 기울도함수를 통하여 미분가능한 함수의 극대값, 극소값을 구할 수 있다.

헷갈리기 쉬운 내용

 

 

△ Likelihood function (가능도함수/우도함수)

   

   ▼ 확률분포함수 : 무수를 알 때, 확률변수의 실현값을 예측하고자 한다.

   ▼ 가능도함수 : 확률변수의 실현값을 알 때, 모수를 추정하고자 한다.

 

 

△ Maximum Likelihood Estimator (MLE) : Likelihood를 최대로 만드는 모수의 값

 

 

 

◎ 벡터, 행렬 연산 및 미분

 

▲ Matrix

 

▲ Vector : 행 또는 열의 수가 1인 경우, 전자는 row vector, 후자는 column vector

 

▲ Transpose and symmetric

Transpose와 symmetric의 정의

▲ Identity matrix

Identity matrix의 예

▲ Diagonal matrix

Diagonal matrix

▲ Trace

 

▲ 행렬식 (determinant) 구하기

행렬식 구하는 방정식

 

○ Matrix 미분

 

미분 표기법의 종류

 

728x90

'Data scientist > Machine Learning' 카테고리의 다른 글

회귀분석(2)_Code  (0) 2021.08.19
회귀분석(1)  (0) 2021.08.19
수학적 개념 이해(1)  (0) 2021.08.19
Machine Learning_basic(2)  (0) 2021.08.18
Machine Learning_basic(1)  (0) 2021.08.18