변수 선택이란 종속변수에 유의미한 영향을 미칠 것으로 생각되는 독립변수를 선택하여 변수의 개수를 줄이는 방법을 의미한다.
변수 선택의 장점은 다음과 같다.
1. 모델의 학습속도가 빨라진다.
2. 모델의 복잡성이 줄어들고 사용자가 모델을 해석하기 더 쉽다.
3. 모델의 정확성이 향상될 수 있다.
4. 과적합을 줄일 수 있다.
변수선택 방법
1. 필터 방법
전처리 과정 중에 각종 통계량을 이용해서 불필요한 특징들을 걸러내는 방법
2. 래퍼 방법
2-1. 전진 선택법
가장 유의미한 변수를 하나씩 추가하는 방법
2-2. 후진 제거법
모두 적합한 모형에서 변수를 하나씩 제거하는 방법
2-3. 단계적 방법
아무것도 적합하지 않은 모형에서 변수를 하나씩 적합하면서 그 전 단계에서 적합된 변수들의 유의미성을 다시 한번 더 검증하는 방법
2-4. AIC
AIC=2ln(L)+2k 값이 작을수록 더 좋은 모형이라고 판단
3. 임베디드 방법
모형 학습과정에서 변수 선택을 같이 포함하는 방법
예시)라쏘(LASSO)
댓글 없음:
댓글 쓰기