위 동영상 참고
지난번 거 복습
왼쪽에 있을때에는 오른쪽으로 점점 이동하도록,
오른쪽에 있을 때에는 왼쪽으로 점점 이동하도록 한다.
이번엔 여러개의 변수 가지고 예측해보려고 한다.
이전과 똑같은 방법은 안되겠다.
어떻게 하면 될까?
생각보다 간단하게 이렇게 해주면 된다.
그러면 cost function은?
더 많을 때는 어떻게 해야할까?
이렇게 하면 되겠다.
근데 이렇게 보니 항이 엄청 많아지면 엄청 길어지겠다.
더 잘 처리할 수 있는 방법이 없을까?
matrix라는 걸 이용하면 된다.
matrix의 곱셈을 먼저 알아보자
이 matrix를 이용하여 우리의 hypothesis를 표현할 수 있다.
이렇게 matrix로 간단히 표현 할 수가 있겠다
XW라고 표현!
그럼 실제 데이터를 가지고 해보자
다음과 같을 것이다.
그런데 좀더 자세히 보면 데이터가 5개 일텐데,
저 데이터 한줄을 instance라고 부른다.
이 instance가 나중에 천개 만개가 되면 어떻게 할까?
matrix의 장점이 여기에 있다.
x는 많아져도 w는 그대로 이다
이것이 장점이라 할 수 있겠다
3은 변수의 개수가 3개 였기 때문이고
5는 이런 데이터 샘플, instance의 개수가 5개 였기 때문이다.
전에 수학 수업에서 들었던 거지만 저 곱셈이 가능하려면
저렇게 '3' 처럼 겹쳐야지 가능하다
이렇게 주어지면 weight의 크기를 결정해야겠지?
예상대로 3 by 1이 될 것이다.
표현하면 [3,1] 이겠지
만약 instance의 개수가 5개가 아니라면 n으로 표현할 수 있겠다.
numpy에서는 -1로 표현하고
tensorflow에서는 None이라고 표현한다.
이처럼 n개의 instance와
3개의 x 개체가 있는 경우에 데이터를 받아들인다고 했을 때
w에 해당되는게 뭔지 알수 있겠다
[3, 2]겠지!
총정리를 하면 앞으로 matrix를 많이 사용하게 될거다
theory에서는 보통 x와 곱해지는 W..의 의미로 Wx로 표현하지만
하지만
실제로 구현할 때에는 XW로 쓰면 바로 matrix 곱만으로 계산이 가능하기 때문에 XW 같은 모양으로 많이 쓴다.
수학적인 의미는 같다~