참고영상 : https://www.youtube.com/watch?v=MFAnsx1y9ZI&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=14&ab_channel=SungKim 여러개의 클래스가 있을때 그것을 예측하는 Multinomial classification 그중에서도 가장 많이쓰는 softmax regression에 대해서 알아보자 linear한 hypothesis를 가지고 출발했었다 이 것의 단점은 return 하는 값이 100, 200 같은 실수이기 때문에 0이냐 1이냐를 고르는 것에는 적합하지 않았다. 그래서 이것을 하나의 Z라고 놓고 큰 값을 압축을 해서 g(z)를 0이나 1사이의 값으로 나오면 좋겠다는 생각을 했다 z값이 엄청 커지고 작아져..
아아아!!! 저번에 데이터 불러오는게 안되어가지고 머리 아팠었는데 오늘 스터디 실습시간에 제대로 배웠다. 기록해둬야지! 일단 내 구글 계정 드라이브에다가 데이터를 올려놓는다. 그리고 왼쪽에 파일 버튼을 누르면 나오는 세개 아이콘 중에 3번째꺼를 누르면 계정을 연결하겠냐고 물어본다. OK 눌러주면 저렇게 불러온다. 일단 맨 위에 from google.colab import drive drive.mount('/content/drive') 이 코드를 작성해주고 path라고 경로 넣어줄 변수를 하나 만들어 준다음 오른쪽 마우스를 클릭해서 경로복사를 해준다 그리고 path에 넣어주고 데이터인 xy 에 path를 넣어준다. 그러면 끝! 잘 동작된다. # lab 05 Logistic Classifi..
참고영상 https://www.youtube.com/watch?v=2FeWGgnyLSw&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=13&ab_channel=SungKim logistic regression 을 tensorflow를 통해 구현해보는 시간 맨 처음부터! 일단 우리가 가지고 있는 데이터는? x_data 안에 들어가있는 각각 리스트들은 하나의 인스턴스를 말할거다 그리고 y_data의 결과값은 0 아니면 1로만 나온다고 하자. 그 다음 feed-dict 를 사용하기 위해선 placeholder를 사용해야 한다. X 와 Y를 만들었다. shape에 주의 해야 한다. 더 많은 x_data , y_data를 줄수도 있으니 None(n)으로 설정해 둔거고 X..
참고영상 https://www.youtube.com/watch?v=6vzchGYEJBc&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=13&ab_channel=SungKim 이번엔 cost function과 cost 를 최소화하는 gradient decent 에 대해 정리하려고 한다. 저번에 linear hypothesis 일때에는 저런모양으로 그래프가 나타났었다 이것의 장점은 어느곳에서 시작하던지 최소값을 갖는 w(weight)을 알아낼 수 있다는 것! 근데 이제 우리의 H(x) 꼴이 좀 변화했다!(sigmoid 함수를 이용하기로 했었다) 우리는 0과 1사이의 결과만 나오길 바랐기 때문에 오른쪽 처럼 H(x)를 적어줬었다. 그런데 이건 cost function..
참고영상 https://www.youtube.com/watch?v=PIjno6paszY&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=12&ab_channel=SungKim 이전에 배웠던 linear regression 에 대해 짚고 넘어가자 cost 는 가설과 실제 값의 차이를 평균을 내는것 cost 를 최소화 하는 weight을 찾아내기 -> 경사타고 내려가는 알고리즘 한발짝에 얼마나 움직일까 = 알파 (러닝 rate) classification도 유사하다 이전의 regression은 그냥 숫자를 예측하는거라면 classification은 둘중에 하나를 골라주는 거다. -스팸인지 아닌지를 알려주는 것 -페이스북의 피드에서 보여줄것만 보여주는..
참고 영상 https://www.youtube.com/watch?v=o2q4QNnoShY&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=10&ab_channel=SungKim 이번엔 데이터들을 실제 파일에서 읽어오는걸 해보려고 한다. 데이터가 많아지면서 데이터들을 소스코드에 일일이 다 써넣기가 복잡해진다. 읽어오려면 어떻게 할까? numpy에 있는 loadtxt라는 함수를 이용하면 된다. loadtxt(파일이름, ','로 나누겠다, 데이터 타입) 단점이 있다면 이 데이터들의 타입이 다 같아야 하겠다. 데이터를 가져올때 보니까 슬라이싱을 이용한다. 슬라이싱은 파이썬 리스트의 강력한 기능이다. 이미 알고있지! 잘 알아둬야한다. numpy로 가면서 더 막강한 인덱싱와..
multi-variable 을 사용할 수 있으면 실제로 가지고 있는 데이터에 적용해볼수 있다. 다음과 같은 데이터가 있다. 마지막 기말고사 시험인 Y를 예측하는 모델을 만들 거다 x가 많을 수록 예측을 잘할 수 있겠지? hypothesis를 자연스럽게 세워보자 그러면 마찬가지로 cost는 오른쪽에 결과를 보면 cost가 상당히 높다가 4로 낮게 떨어지는 걸 볼 수 있다 2000 Cost 일때를 보면 prediction의 값이 왼쪽 위에 있는 y_data(기대하는 값)와 유사하다. 수렴한다고 볼 수 있겠다. 근데 윗 부분이 너무 복잡하다. 이런방법은 이제 사용하지 않는다. 이걸 대체할 것이 matrix이다. matrix를 구현해보자 x_data를 위처럼 묶어서 써줘도 된다. 그담에 placehold..
https://www.youtube.com/watch?v=kPxpJY6fRkY&list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm&index=8&ab_channel=SungKim 위 동영상 참고 지난번 거 복습 왼쪽에 있을때에는 오른쪽으로 점점 이동하도록, 오른쪽에 있을 때에는 왼쪽으로 점점 이동하도록 한다. 이번엔 여러개의 변수 가지고 예측해보려고 한다. 이전과 똑같은 방법은 안되겠다. 어떻게 하면 될까? 생각보다 간단하게 이렇게 해주면 된다. 그러면 cost function은? 더 많을 때는 어떻게 해야할까? 이렇게 하면 되겠다. 근데 이렇게 보니 항이 엄청 많아지면 엄청 길어지겠다. 더 잘 처리할 수 있는 방법이 없을까? matrix라는 걸 이용하면 된다. matrix의 곱셈..
참고 : https://www.youtube.com/playlist?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 이번에는 저번에 배운걸 tensorflow로 구현해보는 시간 원래는 Wx 뒤에 +b 가 있을 수 있지만 여기선 생략하고 생각해보자 범위는 -30에서 50으로 변경하면서 결과를 본다 plt 라는 거는 import 하면 그래프를 그릴 수 있다. 저런식으로! 그래프 모양이 나타나겠지. cost를 최소화 하는 W는 1이겠다. 그래프를 더 자세히 살펴보자. 저번 시간에 봤던 것 처럼 기울기가 양수 일때에는 w를 -방향으로 이동하면서 cost 값을..
참고 : https://www.youtube.com/playlist?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 저번꺼 복습. 간단하게 하기위해 b는 지웠다 W가 1일때 cost는 0이 되는구나 W가 0일때 cost는 대강 4.67 W가 2일때 cost도 4.67정도.. 그러면 이걸 함수로 한번 그려보면 이런 형태가 나오게 된다. 우리의 목표는 cost를 최소화 시키는 W를 찾아내는 거였다. gradient descent algorithm 경사 내려감 알고리즘 이러한 알고리즘을 다음과 같이 부른다! 제일 낮은 지점을 찾는 방법은? 경사도를 따라서 한칸씩 내려가본다. w를 조금씩 조금씩 바꾸어가면서 co..
참고 : https://www.youtube.com/playlist?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 이전에 배웠던 hypothesis 와 cost function 기억하기~ cost function은 W와 b에 따라서 작아질수도 커질수도 있는데 학습을 해서 cost 를 최소화 시킨다고 할 수 있다. tensorflow의 기본 3가지 순서 tensorflow를 통해 그래프를 빌딩하고 sess.run을 통해 그래프를 실행시키고 실행 결과가 값을 돌려주는.. 그런 순서! x와 y의 데이터가 주어진다. variable 이라는 노드를 사..
참고 : https://www.youtube.com/playlist?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com Predicting exam score : regression 10시간 공부했더니 90점을 맞았다 9시간을 공부했더니 80점을 맞았다 .... 등등의 데이터를 가지고 학습을 하는 걸 training 이라고 한다 7시간했다면 -> regression 이 예측해준다 (Linear) Hypothesis 한번 그래프를 만들어본다. 데이터를 바탕으로. 저렇게 일차방정식이 되겠구나 하고 가설을 세운다. 저 중에 어떤 선이 제일 좋은가? Whi..
참고 : https://www.youtube.com/playlist?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com TensorFlow! 구글에서 만든 머신러닝 오픈소스 프레임 워크 python 을 쓸 수 있다. What is a Data Flow Graph? 노드들은 연산 및 데이터 엣지들은 data arrays, 데이터를 연결하는 선 그리고 tensorflow 까는 건 여길보고 했다했다 https://blog.naver.com/33sea2020/222248477322 [모두를 위한 딥러닝 01] anaconda로 tensorflow 설치하기..
참고 : https://www.youtube.com/playlist?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com What is ML? 스팸필터... rule 이 정말 많음. -> 정확하게 분류 어려움 그래서 1959년 Arthur Samuel 이라는 사람이 프로그램 자체가 학습을 해서 수행하는 걸 생각해냄 Supervised / Unsupervised Learning 으로 나뉨 training set (데이터들..) 이 있는 것은 Supervised learning (그 예로 강아지 사진이 이미 주어졌다던지..) 자동적으로 비슷한걸 그룹핑하는 것은..
학회에 한 선배님이 딥러닝 스터디/세미나를 열어주셨다 그래서 참여하게 되었는데... 앞으로 한 학기동안 을 통해 공부를 해보려고 한다. https://www.youtube.com/playlist?list=PLlMkM4tgfjnLSOjrEJN31gZATbcj_MpUm 모두를 위한 딥러닝 강좌 시즌 1 www.youtube.com 빡셀 것 같지만...ㅎㅎ 언제나 그랬듯 블로그에 잘 정리해두려고한다. 이 분야가 내 진로가 될지 안될지는 모르겠지만(요즘 정말 다 찔러보고있다. 웹, 앱...) 한 번 해보기로 한 이상 잘 해보자! (21.3.22 시작) 빠이링