분류 전체보기 108

2021 상반기 삼화페인트

페인트에 전혀 관심이 없던 저는 영업관리 직무에서 통계, 데이터분석 관련 자격증 소유자를 우대한다는 공고를 보고 지원을 했습니다. 회사 네임도 안 볼 수는 없지만, 당시는 저는 제가 원하는 직무에서 일만 할수 있다면 회사는 상관없다는 마음이었습니다. 그렇게 서류에 합격하고 필기는 AI 역량검사로 진행했습니다. 다른 AI 역량검사와 다를 게 없었습니다. AI 역량검사에서 합격한 후 서울 본사에서 면접을 진행했습니다. 면접자 4명과 지원자 4명으로 대면 면접을 진행했으며 당시 면접자 중 한 분은 오진수 삼화페인트 대표님도 계셨습니다.(여담으로 대표님의 당시 이미지는 인자하신 분 같았습니다.) 영업관리 직무에 면접을 보러온 사람은 총 4명 중 1명 채용을 목표로 두고 있었던 거 같았습니다. 자기소개를 시작으로..

면접 2022.10.02

[파이썬 머신러닝 완벽가이드] 07. 군집화

01. K-평균 알고리즘 이해¶ K-평균은 군집 중심점(centroid)이라는 특정한 임의의 지점을 선택해 해당 중심에 가장 가까운 포인트들을 선택하는 군집화 기법입니다. 군집 중심점은 선택된 포인트의 평균 지점으로 이동하고 이동된 중심점에서 다시 가까운 포인트를 선택, 다시 중심점을 평균 지점으로 이동하는 프로세스를 반복적으로 수행합니다. 모든 데이터 포인트에서 더이상 중심점의 이동이 없을 경우에 반복을 멈추고 해당 중심점에 속하는 데이터 포인트들을 군집화하는 기법입니다. K-평균의 장점 : 군집화에서 가장 많이 활용되는 알고리즘, 알고리즘이 쉽고 간결하다. K-평균의 단점 : 거리 기반 알고리즘으로 속성의 개수가 매우 많을 경우 군집화 정확도가 떨어집니다.(PCA로 차원 감소를 적용해야 할 수도 있습..

Python_folium을 활용한 지도 시각화

In [1]: # 기본 라이브러리 import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt from statsmodels.formula.api import ols # 지도 시각화를 위한 라이브러리 import folium import requests import json In [ ]: # 서울 행정구역 web 사이트 연결 r = requests.get('https://raw.githubusercontent.com/vuski/admdongkor/master/ver20220401/HangJeongDong_ver20220401.geojson') c = r.content seoul_geo = json.l..

[파이썬 머신러닝 완벽가이드] 06. 차원 축소

01. 차원 축소(Dimension Reduction) 개요¶ 차원 축소는 매우 많은 피처로 구성된 다차원 데이터 세트의 차원을 축소해 새로운 차원의 데이터 세트를 생성하는 것입니다. 일반적으로 차원이 증가할수록 데이터 포인트 간의 거리가 기하급수적으로 멀어지게 되고, 희소(sparse)한 구조를 가지게 됩니다. 또한 수백 개 이상의 피처로 구성된 데이터 세트의 경우 상대적으로 적은 차원에서 학습된 모델보다 예측 신뢰도가 떨어집니다. 피처가 많을 경우 개별 피처간에 상관관계가 높을 가능성도 큽니다. 다중 공선성 문제는 모델의 예측 성능이 저하시킵니다. 차원 축소해 피처 수를 줄이면 더 직관적으로 데이터를 해석할 수 있다. 또한 차원 축소를 할 경우 학습 데이터의 크기가 줄어들어서 학습에 필요한 처리 능력..

[파이썬 머신러닝 완벽가이드] 05. 회귀

01. 회귀 소개¶ 회귀 분석은 유전적 특성을 연구하던 영국의 통계학자 갈톤(Galton)이 수행한 연구에서 유래했다는 것이 일반론입니다. 회귀 분석은 데이터 값이 평균과 같은 일정한 값으로 돌아가려는 경향을 이용한 통계학 기법으로 일례로 사람의 키는 평균 키로 회귀하려는 경향을 가진다는 자연의 법칙입니다. 회귀는 여러 개의 독립변수와 한 개의 종속변수 간의 상관관계를 모델링하는 기법을 통칭합니다. 머신러닝 관점에서 독립변수는 피처에 해당되며 종속변수는 결정 값입니다. 즉, 머신러닝은 주어진 피처와 결정 값 데이터 기반에서 학습을 통해 최적의 회귀 계수를 찾아내는 것입니다. 회귀 계수가 선형이나 아니냐에 따라 선형 회귀와 비선형 회귀로 나눌 수 있으며 독립변수의 개수가 한 개인지 여러 개인지에 따라 단일..

당일 주가 정보 크롤링

◎ 주식정보 크롤링¶ In [1]: # 라이브러리 불러오기 from selenium import webdriver from selenium.webdriver.common.keys import Keys from selenium.webdriver.support.ui import WebDriverWait from selenium.webdriver.support import expected_conditions as EC from selenium.webdriver.common.by import By from selenium.webdriver.chrome.options import Options from bs4 import BeautifulSoup import time import pandas as pd from ..

2020 하반기 SBI 저축은행

그동안 정부에서 진행하는 데이터 구축 사업에 인턴으로 근무하면서 동시에 2020년 하반기 SBI 저축은행 대졸 신입 채용에 통계 직무로 지원하였습니다. 당시 서류와 함께 AI 역량 검사까지 동시에 진행하였으며 거의 처음으로 AI 역량 검사가 진행되던 시기라 낯설었습니다. 아무 정보도 없는 채 그렇게 기본적인 면접 질문과 게임을 진행한 AI 역량 검사를 진행하고 서류에 합격하여 서울로 시험을 치러 갔습니다. 당시 시험은 국어 + 수학의 NSC 같은 시험과 직무 시험을 쳤는데 직무 실험이 TESAT보다는 어려운 수준의 경제 시험이어서 당황했습니다. TESAT는 공부하여 2급 자격증을 가지고 있던 저는 당시 SBI 저축은행에서 쳤던 경제 시험이 상경 계열 지원자에게 원하는 수준이라고 생각할 정도로 어려웠습니다..

면접 2022.07.10