본문 바로가기

IT/AI3

[ML]성능 평가 평가의 중요도 머신러닝은 간단히 말해서 주어진 학습 데이터의 피처와 레이블을 학습하여 새로운 미지의 데이터를 정확히 예측할 수 있도록 하는 기법이라 볼 수 있다. 그리고 이러한 예측 성능에 대한 평가는 머신러닝 알고리즘 모델 또는 데이터 전처리의 개선 필요성에 대한 지표가 되어준다. 그래서 우리가 머신러닝을 공부하면서 꼭 알아야하는 것이 성능 평가이다. 분류 성능 평가 머신러닝에는 크게 지도 학습과 비지도 학습이 있다. 우리가 우선 알아볼 성능 평가는 지도 학습에 속하는 분류에 대한 평가이다. 분류는 주어진 레이블(정답값)을 통해 새롭게 주어지는 데이터에 대한 정답을 예측한다. 평가 지표 정확도(Accuracy) 위의 분류에 대한 정의를 통해 가장 먼저 떠오르는 평가는 무엇일까? 아마 대부분의 사람들이 .. 2020. 8. 7.
Pandas 입문기 - 2 DataFrame & Series 데이터분석을 위해 수집, 전처리 등의 과정을 가장 효율적으로 할 수 있는 방법이 무엇일까? 바로 행렬로 이루어진 표이다. 그리고 판다스에선 이것을 Data Frame과 Series 로 표현한다. Series 파이썬의 리스트에 정수로 만들어진 인덱스를 기본값으로 설정하여 준다. >>> import pandas as pd >>> s = pd.Series([9,8,7]) >>> s[0] 9 >>> s[1] 8 >>> s 0 9 1 8 2 7 dtype: int64그러면 왜 그냥 리스트를 쓰지 않고 Series 를 사용할까? 왜냐하면 딕셔너리의 특징을 일부 포함하기 때문이다. 예를 들어 index와 value의 값의 구분지을 수 있고 index 범위값을 따로 확인할 수 있기 때.. 2020. 7. 30.
Pandas 입문기-1 인공지능을 배우고 싶어요! "뭐부터 배워야 하지?"라는 막연한 생각 모두가 한번쯤은 했을거다. 나도 그랬다.. (뭐 대단한 말을 하려는 것 같지만** 나도 초짜다..기대하고 왔다면 살포시 **뒤로가기를 누르자) 작년 여름,나는 막연히 딥러닝에 대해 배우고 싶어서 딥러닝 스터디 모임에 들어가 Coursera에 올라와 있는 Andrew Ng 교수의 딥러닝 강의를 들었다. (이거 진짜 유명하다 진짜다) Andrew Ng 교수님이다. 벌써부터 강의를 잘 하실 것 같은 느낌이 들지 않는가 하지만, 새로운 것에 대한 배움의 즐거움도 잠시 스터디가 끝나고 바쁜 학교 생활을 하면서 끈을 계속 붙잡지 못하였다(핑계다) 이제 진지하게 다시 시작을 하려고 하니 그래도 나름 강의 좀 봤다고 무엇을 먼저 배워야 겠다는 확신이 .. 2020. 7. 17.