우리가 하려는 것은 파라메터 Θ0과 Θ1의 값들을 이용해서 이러한 직선을 구해, 여기에 그린 이 직선처럼 직선이 자료와 얼마나
잘 일치하는지를 보는 것입니다.
우리가 어떻게 값들, Θ0, Θ1이 데이터와 얼마나
잘 일치하는지를 알 수 있을까요?
훈련집합의 예시에서 파라메터 Θ0과 Θ1을 고르는 것은, hx, 즉 x값과 같다고 예측한 값은 y값과 가장 비슷한 값입니다.
그래서 이 훈련집합에서, 우리는 몇몇 숫자들의 예시를 가지고 있고,x값이 집을 선택하게 되고, 이것을 통해 우리는 실제로어떤 가격에 팔리는지(y)에 대해 알 수 있습니다.그래서, 파라메터 값을 선택해서,최소한 훈련집합에서, x값이 주어진다면 우리는 y값에 대한 예측을 할 수 있습니다.
이것을 공식화해본다면 회귀에서, 우리가 하려는 것은 < 최소화문제 >를 풀려고 하는 것입니다.
최소값(minimize)을 Θ0, Θ1이라고 적고, 이 값을 작게 만들려고 합니다.
h(x)와 y간의 차이를 작게 만들어야 합니다.그리고 저는 가설의 결과값과 실제 집의 가격의 차이의차이의 제곱을 최소화할 것입니다.
(x(i), y(i)) 기호: i번째 훈련 예시
실제 훈련집합에서 i=1부터 m까지의 차이의 제곱의 합계를 구하려고 하는 것입니다.
이 값은i번의 집의 입력 값에 대한 가설을 예측한 것입니다. -> h(x¡)
거기에 실제 팔려고 하는 집의 실제 가격을 빼 줍니다. -> y(¡)
<훈련집합의 합을 최소화하는 과정>
이 차의 제곱의 1부터 m까지 합
=> 예측된 집 가격과 실제 팔리는 가격의차의 제곱
m값: 훈련집합의 크기
+ 그리고 수학을 조금 더 쉽게 해보자면,이 합에 1/m을 곱합니다. 평균값을 최소화하기 위해 1/2m을 최소화해보겠습니다.
맨 앞에 1/2값을 놓는 것은좀 더 쉬워 보이게 되고, 어떤 값의 반을 최소화하는 것은Θ0, Θ1값을 최소화 하는 것과 같은 값의 과정을 보여줄 것입니다.