목록분류 전체보기 (114)
#wannabeeeeeee the best DataScientist

◎ 밑바닥부터 시작하는 딥러닝(1)¶ ● chapter 5. 오차역전파법¶ 신경망의 가중치 매개변수의 기울기를 효율적으로 계산하는 '오차역전파법(backpropagation)' 5.1 계산 그래프계산 그래프는 계산 과정을 그래프로 나타낸 것이며 노드(node)와 에지(edge)로 표현됩니다. 계산 그래프로 풀다계산을 왼쪽에서 오른쪽으로 진행하는 단계를 순전파(forward propagation)이라고 한다.오른쪽에서 왼쪽으로 진행하는 단계는 역전판(backward propagation)이라고 한다. 국소적 계산계산 그래프의 특징은 '국소적 계산'을 전파함으로써 최종 결과를 얻는다는 점에 있다.국소적 계산은 결국 전체에서 어떤 일이 벌어지든 상관없이 자신과 관계된 정보만으로 결과를 출력할 수 있다는 것이다..

◎ 밑바닥부터 시작하는 딥러닝(1)¶ ● chapter 4. 신경망 학습¶ 학습이란 훈련 데이터로부터 가중치 매개변수의 최적값을 자동으로 획득하는 것을 뜻한다.손실 함수는 신경망이 학습할 수 있도록 해주는 지표이다.손실 함수의 결괏값을 가장 작게 만드는 가중치 매개변수를 찾는 것이 학습의 목표 4.1 데이터에서 학습한다!신경망의 특징은 가중치 매개변수의 값을 데이터를 보고 자동으로 결정하는 특징이 있다.+신경망은 모든 문제를 주어진 데이터 그대로를 입력 데이터로 활용해 'end-to-end'로 학습할 수 있다.기계학습은 사람의 개입을 최소화하고 수집한 데이터로부터 패턴을 찾습니다.딥러닝을 종단간 기계학습(end-to-end machine learning)이라고도 한다. 기계학습 문제는 데이터를 훈련 데이..

09-1 순차 데이터와 순환 신경망¶ 순환 신경망¶ ☆ 순차 데이터(sequential data)는 텍스트나 시계열 데이터와 같이 순서에 의미가 있는 데이터 ☆ 완전 연결 신경망이나 합성곱 신경망은 하나의 샘플(또는 하나의 배치)을 사용하여 정방향 계산을 수행하고 나면 그 샘플은 버려지고 다음 샘플을 처리할 때 재사용하지 않습니다. ☆ 입렵 데이터의 흐름이 앞으로만 전달되는 신경망을 피드포워드 신경망(feedforward neural network)이라 한다. ☆ 순환 신경망(RNN)은 완전 연결 신경망 + 이전 데이터의 흐름을 순환하는 고리, 이전 타임스텝의 샘플을 기억하지만 오래될수록 순환되는 정보는 희미해 진다. ☆ 순환 신경망(RNN)은 순환층을 1개 이상 사용한 신경망 ☆ 타임스텝(timeste..

08-1 합성곱 신경망의 구성 요소¶ ☆ 합성곱 : 밀집층과 비슷하게 입력과 가중치를 곱하고 절편을 더하는 선형 계산이지만 밀집층과 달리 합성곱은 입력 데이터 전체에 가중치를 적용하는 것이 아니라 일부에 가중치를 곱한다. ☆ 합성곱 층의 뉴런에 있는 가중치 개수는 하이퍼파라미터이다. ☆ 합성곱 신경망(CNN)에서는 뉴런을 필터(filter) 또는 커널(kernel)이라고 부른다. ☆ 합성곱 계산을 통해 얻은 출력을 특성 맵(feature map)이라고 부른다. In [1]: # 케라스 합성곱 층 from tensorflow import keras keras.layers.Conv2D(10,kernel_size=(3,3),activation='relu') # keras.layers.Conv2D(필터 개수, ..

# import basic library import numpy as np import pandas as pd import sklearn from sklearn.experimental import enable_iterative_imputer from sklearn.linear_model import LinearRegression from sklearn.model_selection import StratifiedKFold from sklearn.model_selection import train_test_split from sklearn.metrics import roc_auc_score from xgboost import XGBRegressor from xgboost import XGBClassifier..

https://www.kaggle.com/c/tabular-playground-series-sep-2021/overview/description Tabular Playground Series - Sep 2021 | Kaggle www.kaggle.com ◎ Setting¶ 1. Calling Basic Libraries¶ In [2]: pip install catboost Requirement already satisfied: catboost in c:\work\envs\datascience\lib\site-packages (0.26.1) Requirement already satisfied: six in c:\work\envs\datascience\lib\site-packages (from catboo..

# 데이터 축소 def reduce_usage(df, verbose=True): numerics = ['int16', 'int32', 'int64', 'float16', 'float32', 'float64'] start_mem = df.memory_usage().sum() / 1024**2 for col in df.columns: col_type = df[col].dtypes if col_type in numerics: c_min = df[col].min() c_max = df[col].max() if str(col_type)[:3] == 'int': if c_min > np.iinfo(np.int8).min and c_max < np.iinfo(np.int8).max: df[col] = df[col]...