1. 분산을 이용해서 이상값 검출
2. 가능도를 이용해서 이상값 검출
3. 근접 이웃 기반 이상치 탐지
4. 밀도를 기반으로 한 탐지
5. 사분위수
이상값을 처리하는 방법으로는 삭제, 대체, 스케일링, 정규화 방법 등이 있다.
이상값의 원인 : 표본추출 오류, 고의적인 이상값, 데이터 입력 오류, 실험오류, 측정오류 등
댓글 없음:
댓글 쓰기