본문 바로가기

data2

[ML]성능 평가 평가의 중요도 머신러닝은 간단히 말해서 주어진 학습 데이터의 피처와 레이블을 학습하여 새로운 미지의 데이터를 정확히 예측할 수 있도록 하는 기법이라 볼 수 있다. 그리고 이러한 예측 성능에 대한 평가는 머신러닝 알고리즘 모델 또는 데이터 전처리의 개선 필요성에 대한 지표가 되어준다. 그래서 우리가 머신러닝을 공부하면서 꼭 알아야하는 것이 성능 평가이다. 분류 성능 평가 머신러닝에는 크게 지도 학습과 비지도 학습이 있다. 우리가 우선 알아볼 성능 평가는 지도 학습에 속하는 분류에 대한 평가이다. 분류는 주어진 레이블(정답값)을 통해 새롭게 주어지는 데이터에 대한 정답을 예측한다. 평가 지표 정확도(Accuracy) 위의 분류에 대한 정의를 통해 가장 먼저 떠오르는 평가는 무엇일까? 아마 대부분의 사람들이 .. 2020. 8. 7.
Pandas 입문기 - 2 DataFrame & Series 데이터분석을 위해 수집, 전처리 등의 과정을 가장 효율적으로 할 수 있는 방법이 무엇일까? 바로 행렬로 이루어진 표이다. 그리고 판다스에선 이것을 Data Frame과 Series 로 표현한다. Series 파이썬의 리스트에 정수로 만들어진 인덱스를 기본값으로 설정하여 준다. >>> import pandas as pd >>> s = pd.Series([9,8,7]) >>> s[0] 9 >>> s[1] 8 >>> s 0 9 1 8 2 7 dtype: int64그러면 왜 그냥 리스트를 쓰지 않고 Series 를 사용할까? 왜냐하면 딕셔너리의 특징을 일부 포함하기 때문이다. 예를 들어 index와 value의 값의 구분지을 수 있고 index 범위값을 따로 확인할 수 있기 때.. 2020. 7. 30.