2024년 2월 21일 수요일

변수 선택

 변수 선택이란 종속변수에 유의미한 영향을 미칠 것으로 생각되는 독립변수를 선택하여 변수의 개수를 줄이는 방법을 의미한다.

변수 선택의 장점은 다음과 같다.

1. 모델의 학습속도가 빨라진다.

2. 모델의 복잡성이 줄어들고 사용자가 모델을 해석하기 더 쉽다.

3. 모델의 정확성이 향상될 수 있다.

4. 과적합을 줄일 수 있다.


변수선택 방법

1. 필터 방법

전처리 과정 중에 각종 통계량을 이용해서 불필요한 특징들을 걸러내는 방법

2. 래퍼 방법

2-1. 전진 선택법

가장 유의미한 변수를 하나씩 추가하는 방법

2-2. 후진 제거법

모두 적합한 모형에서 변수를 하나씩 제거하는 방법

2-3. 단계적 방법

아무것도 적합하지 않은 모형에서 변수를 하나씩 적합하면서 그 전 단계에서 적합된 변수들의 유의미성을 다시 한번 더 검증하는 방법

2-4. AIC

AIC=2ln(L)+2k 값이 작을수록 더 좋은 모형이라고 판단

3. 임베디드 방법

모형 학습과정에서 변수 선택을 같이 포함하는 방법

예시)라쏘(LASSO)



댓글 없음:

댓글 쓰기