[공통] 속성 정보
개요
각 속성의 우측에 톱니 바퀴 아이콘을 클릭하면 해당 속성의 자세한 정보를 확인할 수 있습니다.


속성 타입
변경가능한 타입의 경우 활성화되어 표시됩니다.
변경불가능한 타입의 경우 비활성화되어 표시됩니다.
수치형 타입으로 기본 설정 되었지만, 실제로는 범주형 타입인 경우는 범주형 타입으로 변경 가능합니다.
고유한 범주의 개수가 데이터 수의 10%미만이어야 가능합니다.
예시 : 실제로는 범주형인 변수를 숫자로 표기한 경우 등
- 수치형 타입으로 기본 설정 되었고, 시스템 상 범주형 타입으로 변경 불가능 한 경우도 있습니다.
- 예시 : 데이터 수에 비해 고유한 범주의 수가 많은 경우 등
- 예시 : 데이터 수에 비해 고유한 범주의 수가 많은 경우 등
데이터 타입 분포
해당 속성 내 데이터의 숫자, 문자, 결측치 데이터의 비율을 보여줍니다.
데이터 분포
수치형
- 해당 속성의 데이터 분포를 히스토그램으로 보여줍니다.
범주형
- 해당 속성의 데이터 중 가장 많은 비율을 차지하는 범주순으로 보여줍니다.
- 가로로 스크롤하면 더 많은 데이터를 확인할 수 있습니다.
결측치 처리 방법
한 건의 데이터는 여러가지 속성으로 구성됩니다. 각 데이터에 대해 하나 이상의 속성이 결측된 경우, 해당 데이터는 결측 데이터로 평가됩니다.
수치형
- 총 6가지 옵션을 제공합니다.
- 해당 행 제거하기
- 결측치가 존재하는 해당 데이터를 제거합니다.
- 결측치가 예측 불가능하고, 데이터가 충분히 많은 경우 유효합니다.
- 이전값으로 채우기
- 결측치를 해당 속성의 이전번 데이터로 채웁니다.
- 연속된 결측치가 존재하는 경우 가장 인접한 이전 순서의 데이터로 채웁니다.
- 생산 중 동일 값으로 셋팅 할 때, 중복 작성 하지 않는 경우 등에 유효합니다.
- 이후값으로 채우기
- 결측치를 해당 속성의 다음번 데이터로 채웁니다.
- 연속된 결측치가 존재하는 경우 가장 인접한 다음 순서의 데이터로 채웁니다.
- 생산 중 동일 값으로 셋팅 할 때, 중복 작성 하지 않는 경우 등에 유효합니다.
- 0으로 대체하기
- 결측치를 0으로 채웁니다.
- 0을 별도 기록하지 않는 경우 등에 유효합니다.
- 평균으로 대체하기
- 결측치를 해당 속성의 평균값으로 채웁니다.
- 일반적으로 유사한 값을 사용하는 경우 등에 유효합니다.
- 결측치 보간하기
- 결측치를 이전 순번과 다음 순번의 데이터를 활용해 예상하여 채웁니다.
- 결측치를 예상 할 수 없고, 데이터가 부족한 경우 유효합니다.
- 해당 행 제거하기
범주형
- 총 3가지 옵션을 제공합니다.
- 해당 행 제거하기
- 이전값으로 채우기
- 결측치가 존재하는 해당 데이터를 제거합니다.
- 결측치가 예측 불가능하거나, 데이터가 충분히 많은 경우 유효합니다.
- 이후값으로 채우기
- 결측치를 해당 속성의 이전번 데이터로 채웁니다.
- 연속된 결측치가 존재하는 경우 가장 인접한 이전 순서의 데이터로 채웁니다.
- 생산 중 동일 값으로 셋팅 할 때, 중복 작성 하지 않는 경우 등에 유효합니다.