2024년 2월 21일 수요일

변수 변환

분석 목적에 맞게 데이터를 변환하는 것을 변수변환이라고 부른다.

1. 카테고리 임베딩

범주형에서 연속형으로 변환, 예를 들어 학생 이름의 범주값을 학생의 나이, 주민등록번호, 학생번호 등으로 변환하여 사용

2. 더미변수화

남자면 0, 여자면 1로 변환하는 방법

3. 데이터 구간화

나이를 10대, 20대, 30대 등 범주화하는 방법

4. 데이터 정형화/정량화

문서와 같은 데이터를 단어 빈도수로 정형화하는 방법

5. 정규화

최소-최대 표준화, Z-표준화 등등

6. 표준화

로그변환, 루트 제곱근 변환 등

7. 버닝(Burning)

데이터 값을 몇 개의 Bin으로 분할하여 계산하는 방법

댓글 없음:

댓글 쓰기