머신러닝에 사용되는 raw 데이터는 대부분 가공되어 있지 않습니다. 데이터 전처리(feature engineering)는 효율적인 학습을 위해 반드시 필요한 작업입니다. 데이터 전처리 방법은 여러가지가 있지만 기본적인 결측치 처리, 데이터 라벨링, 데이터 스케일링을 소개합니다. 1. 결측치 처리 데이터 셋에서 일부 데이터의 값이 존재하지 않는 경우 이를 결측치라고 합니다. 결측치는 학습에 문제가 될 수 있기 때문에 결측치 처리(변경 또는 삭제)는 중요한 작업입니다. import numpy as np import pandas as pd df = pd.DataFrame([ [42, 'male', 12, 'reading', 'class2'], [35, 'unknown', 3, 'cooking', 'class1..