본문 바로가기

overfitting2

머신러닝(Machine Learning) 10장 - Training-Testing data set - 머신러닝(Machine Learning) 10장- Training-Testing data set - Machine Learning의 특정 모델을 학습시키기 위해서는 training data set이 필요하다. 하지만 training data set만으로 학습을 한 후 바로 실제 데이터를 사용에 투입되는 것은 아니다. 다른 데이터를 활용해서 이 학습 모델이 제대로 동작하는지에 대한 test 과정이 필요하다. 이 때 필요한 데이터 값이 testing data set이다. 만약 다음과 같은 데이터가 주어진다고 생각을 해보자. 집의 크기에 따른 가격의 차이를 나타내는 data set이다. 만약 다음의 data set을 모두 training data set으로 사용해서 특정 머신러닝 모델을 학습시킨다고 생각을 해.. 2017. 5. 29.
머신러닝(Machine Learning) 9장 - Learning rate, data preprocessing, overfitting - 머신러닝(Machine Learning) 9장- Learning rate, data preprocessing, overfitting - Linear regression이나 logistic regression의 방법을 사용할 때 cost function을 최소화시키기 위해서 우리는 Gradient descent algorithm을 사용했다. Gradient descent는 기울기의 크기가 줄어드는 쪽으로 가는 것이 cost function이 최소가 되는 지점을 찾아간다는 생각에서 나온 알고리즘이다. Gradient descent algorithm을 사용할 때 cost 값의 미분한 값 앞에 알파라는 값이 오게 되는데 이 값이 Learning rate이다. Learning rate은 어느 정도의 크기로 기울기.. 2017. 5. 29.