Data scientist/Machine Learning

K-NN + Python_Code

맨사설 2021. 8. 25. 20:49
728x90

 

K-Nearest Neighbors

  • K-최근접 이웃(K-Nearest Neighbor, KNN)은 지도 학습 알고리즘 중 하나입니다.
  • 데이터가 주어지면 그 주변(이웃)의 데이터를 살펴본 뒤 더 많은 데이터가 포함되어 있는 범주로 분류하는 방식입니다.

 

K의 특징
종속 변수별 설정 방법
거리 선택 방법

 

 수학적 개념 이해

ⓐ Cross-validation : 과적합, sample loss를 해결하기 위해 사용

 

- k-fold cross validation

에러 추정식

※ Test error : 데이터에 따라 최적의 k가 존재

 

차원의 저주가 knn에서 발생할 수 있으며 그럴때 차원 축소 후 knn 진행

 

 

728x90

'Data scientist > Machine Learning' 카테고리의 다른 글

SVM + Python_Code  (0) 2021.08.26
LDA + Python_Code  (0) 2021.08.25
Naive Bayes + Python_Code  (0) 2021.08.25
PCA + Python_Code  (0) 2021.08.23
회귀분석(4)_로지스틱 회귀분석  (0) 2021.08.21