Book report/Deep Learning from Scratch 5

Chapter 6. 학습 관련 기술들

◎ 밑바닥부터 시작하는 딥러닝(1)¶ ● chapter 6. 학습 관련 기술들¶ 6.1 매개변수 갱신 최적화(Optimization) : 매개변수의 최적값을 찾는 것 확률적 경사 하강법(SGD)이란 매개변수의 기울기를 구해, 기울어진 방향으로 매개변수 값을 갱신하는 일을 몇 번이고 반복해서 점점 최적의 값을 도출해내는 방법 In [1]: # SGD 구현하기 class SGD: def __init__(self, lr=0.01): self.lr = lr # learning rage(학습률) def update(self, parms, grads): for key in params.keys(): params[key] -= self.lr*grads[key] SGD의 단점 SGD는 단순하고 구현도 쉽지만, 문제에 ..

Chapter 5. 오차역전파법

◎ 밑바닥부터 시작하는 딥러닝(1)¶ ● chapter 5. 오차역전파법¶ 신경망의 가중치 매개변수의 기울기를 효율적으로 계산하는 '오차역전파법(backpropagation)' 5.1 계산 그래프 계산 그래프는 계산 과정을 그래프로 나타낸 것이며 노드(node)와 에지(edge)로 표현됩니다. 계산 그래프로 풀다 계산을 왼쪽에서 오른쪽으로 진행하는 단계를 순전파(forward propagation)이라고 한다. 오른쪽에서 왼쪽으로 진행하는 단계는 역전판(backward propagation)이라고 한다. 국소적 계산 계산 그래프의 특징은 '국소적 계산'을 전파함으로써 최종 결과를 얻는다는 점에 있다. 국소적 계산은 결국 전체에서 어떤 일이 벌어지든 상관없이 자신과 관계된 정보만으로 결과를 출력할 수 있다..

Chapter 4. 신경망 학습

◎ 밑바닥부터 시작하는 딥러닝(1)¶ ● chapter 4. 신경망 학습¶ 학습이란 훈련 데이터로부터 가중치 매개변수의 최적값을 자동으로 획득하는 것을 뜻한다. 손실 함수는 신경망이 학습할 수 있도록 해주는 지표이다. 손실 함수의 결괏값을 가장 작게 만드는 가중치 매개변수를 찾는 것이 학습의 목표 4.1 데이터에서 학습한다! 신경망의 특징은 가중치 매개변수의 값을 데이터를 보고 자동으로 결정하는 특징이 있다. +신경망은 모든 문제를 주어진 데이터 그대로를 입력 데이터로 활용해 'end-to-end'로 학습할 수 있다. 기계학습은 사람의 개입을 최소화하고 수집한 데이터로부터 패턴을 찾습니다. 딥러닝을 종단간 기계학습(end-to-end machine learning)이라고도 한다. 기계학습 문제는 데이터를..

Chapter 3. 신경망

◎ 밑바닥부터 시작하는 딥러닝(1)¶ ● chapter 3. 신경망¶ ANO, OR 게이트의 진리표를 보면서 인간이 적절한 가중치 값을 정해야 하는 단점이 있었습니다. 신경망은 가중치 매개변수의 적절한 값을 데이터로부터 자동으로 학습하는 능력이 있습니다. 3.1 퍼셉트론에서 신경망으로 신경망은 입력층, 출력층, 은닉층으로 구성 입력 신호의 총합을 출력 신호로 변환하는 함수를 활성화 함수라 한다. 3.2 활성화 함수 임계값을 경계로 출력이 바뀌는 함수를 계단 함수라 한다. 신경망에서 자주 이용하는 활성화 함수인 시그모이드 함수는 h(x) = 1 / (1+exp(-x))로 나타낸다. In [1]: import numpy as np import matplotlib.pylab as plt # 계단 함수 구현하기..

Chapter 2. 퍼셉트론

https://book.naver.com/bookdb/book_detail.nhn?bid=11492334 밑바닥부터 시작하는 딥러닝 직접 구현하고 움직여보며 익히는 가장 쉬운 딥러닝 입문서!『밑바닥부터 시작하는 딥러닝』은 라이브러리나 프레임워크에 의존하지 않고, 딥러닝의 핵심을 ‘밑바닥부터’ 직접 만들어보며 book.naver.com 해당 책에 대한 정보이며 해당 책을 읽고 학습한 내용을 단원별로 공유하고자 합니다. ◎ 밑바닥부터 시작하는 딥러닝(1)¶ ● chapter 1. 헬로 파이썬¶ 1.1 파이썬이란? 오픈 소스 + 무료인 배우기 쉬운 프로그래밍 언어 넘파이 + 사이파이 = 수치 계산과 통계 처리를 다루는 데 탁월한 라이브러리 카페 + 텐서플로 + 체이너 + 테아노 = 딥러닝 프레임워크 1.2 파..