분류 전체보기 108

그로스 해킹(2)

04장 지표¶4.1 지표 활용하기¶ 그로스 해킹 : 목표 지표를 선정하고 그 지표를 개선하기 위해 진행하는 일련의 활동 지표는 속성에 따라 스톡(Stock) 형태의 지표와 플로(Flow) 형태의 지표로 분류 스톡(Stock) : 저량 지표, 특정 시점의 스냅숏에 해당하는 지표(누적 가입자 수, 누적 거래액 등) 플로(Flow) : 유량 지표, 시작과 끝에 대한 시간 범위 존재, 일정 시간 동안의 변화량(1월1일 가입자 수, 일 평균 수량 등) 일반적으로 플로 형태의 지표가 스독 지표에 비해 더 많은 정보 가짐 지표 속성에 따라 지표를 모니터링하는 방식이나 대시보드 설계 등이 전혀 달라진다. 허무 지표(Vanity metric) : 행동을 이끌어내지 못하는 의미 없는 지표, 겉으로는 많은 일을 한 것처럼 ..

그로스 해킹(1)

01장 그로스 해킹이란?¶1.1 그로스 해킹 그거, 우리도 해 봅시다.¶ 그로스 해킹(Growth Hacking) : 성장할 수 있는 방법을 '해킹'하는 것 린 스타트업(Lean Startup) : 아이디어를 빠르게 제품으로 만들고 고객이 제품에 대해 어떻게 반응하는지를 측정한 후, 그 결과를 통해 배움을 얻고 지속적으로 제품을 개선해 나가는 제품 개발 방법론⇒ 아이디어 - 개발 - 측정 - 개선으로 이어지는 피드백 순환고리(feedback loop)를 빠르게 진행하면서 점진적으로 개선하는 것 린 스타트업은 그로스 해킹과 일맥상통하는 측면이 있다. 1.2 그로스 해킹의 지름길이 있을까?¶ 그로스 해킹은 각 서비스의 사용 맥락이나 시장 상황을 반영해서 진행할 때만 의미가 있다. 1.3 그로스 해킹 이해하기..

딥러닝 및 심화 내용 면접 질문&답변

○ 딥러닝 및 심화 내용 ■ 딥러닝은 무엇인가요? 딥러닝과 머신러닝의 차이는? 더보기 머신러닝은 주어진 데이터를 인간이 먼저 처리합니다. 사람이 먼저 컴퓨터에 특정 패턴을 추출하는 방법을 지시하고, 그 이후 컴퓨터가 스스로 데이터의 특징을 분석하고 축적합니다. 반면에 딥러닝은 머신러닝에서 사람이 하던 패턴 추출 작업이 생략됩니다. 컴퓨터가 스스로 데이터를 기반으로 학습할 수 있도록 정해진 신경망을 컴퓨터에 주고, 어린아이가 학습하는 것처럼 경험 중심으로 학습을 수행합니다. ■ Cost Function과 Activation Function은 무엇인가요? 더보기 모델은 데이터에 대한 예측을 얼마나 어떻게 잘하고 있는지 알아야 학습방향을 수정할 수 있는데 이때 모델의 예측값과 데이터값의 차이에 대한 함수를 c..

면접 2023.07.18

분석 및 머신러닝 면접 질문&답변

○ 분석 및 머신러닝 ■ 좋은 feature란 무엇인가요. 이 feature의 성능을 판단하기 위한 방법에는 어떤 것이 있나요? 더보기 지도 학습에서 좋은 feature란 라벨과 상관성이 높은 특징이라고 할 수 있습니다. 다시 말해, 해당 feature의 값을 알면 라벨에 대한 엔트로피가 작아지는 것이 좋은 feature의 특징입니다. ⇒ 좋은 feature의 성능을 판단하는 방법으로는 ⓐ F-통계량, 상관관계 등의 통계량을 활용하는 방법 ⓑ 상호정보량과 조건부 엔트로피 등의 정보공학에서 사용하는 지표를 활용하는 방법 ⓒ 결정 나무 및 결정 나무 기반의 앙상블을 사용해서 특징의 중요도를 계산하는 방법 ⓓ 학습된 모델에 특징을 임의로 섞었을 때 성능의 손실 정도를 바탕으로 계산하는 방법 등이 있습니다. ■..

면접 2023.07.13

통계 및 수학 면접 질문&답변

○ 통계 및 수학 ■ 고유값(eigen value)와 고유벡터(eigen vector)에 대해 설명해주세요. 그리고 왜 중요할까요? 더보기 정방 행렬 A를 선형 변환으로 봤을 때, 선형 변환 A에 의한 변환 결과가 자기 자신의 상수 배가 되는 0이 아닌 벡터를 고유벡터(eigenvector)라고 하고, 이 상수배 값을 고유값(eigenvalue)이라고 합니다. 고유값, 고유 벡터는 정방 행렬에 대해서만 정의됩니다. 고유값과 고유벡터는 정방행렬의 대각화와 밀접한 관련이 있다. 행렬을 고유벡터와 고유값으로 이루어진 행렬들로 대각화 분해하면 (eigen decomposition) 이를 이용하여 해당 행렬의 거듭제곱, 역행렬, 대각합, 행렬의 다항식 등을 매우 효율적으로 계산할 수 있기 때문에 중요하다. ■ 샘..

면접 2023.07.11

02. 데이터 분석 준비하기(1)

02. 데이터 분석 준비하기¶ ◇ 08. 분석 프로젝트 준비 및 기획¶ 8.1 데이터 분석의 전체 프로세스¶ 데이터 분석의 궁극적인 목표는 의사결정 프로세스를 최적화하는 것 일반적인 데이터 분석 프로젝트의 프로세스 : 설계 단계 ⇒ 분석 및 모델링 단계 ⇒ 구축 및 활용 단계 설계 단계 : 무엇을 하고자 하는지를 명확히 정의하고 프로젝트를 수행할 인력 구성, 실무자와 분석가 간 협의체계가 잘 이루어져야함 분석 및 모델링 단계 : 데이터 분석 단계에서는 데이터 추출, 검토, 가공, 모델링 등의 세부 절차와 부분 반복이 필요, 특히 모델의 비즈니스 적합성을 심도 있게 분석하고 성능을 평가하는 것이 중요, 이러한 절차에는 KDD 분석 방법론, CRISP-DM 방법론, SAS사의 SEMMA 방법론 등 다양한 기..

01. 데이터 기초체력 기르기

01. 데이터 기초체력 기르기¶ ◇ 01. 통계학 이해하기¶ 1.1 왜 통계학을 알아야 할까?¶ 데이터 과학의 프로세스 : 데이터 수집 ⇒ 데이터 가공 ⇒ EDA(데이터 시각화) ⇒ M/L 모델링 ⇒ 결과 해석 및 적용 1.2 머신러닝과 전통적 통계학의 차이¶ 머신러닝의 주된 목적은 예측(Prediction)이고 통계학의 주된 목적은 해석(Explanation) 통계학은 모델의 기초 체력과 같은 것이고 이를 바탕으로 복잡하고 정교한 머신러닝 모델을 만드는 것 1.3 통계학의 정의와 기원¶ 통계학(Statistics)은 자료를 수집, 분석하여 그 분석 결과를 통해 효율적인 의사결정을 하는 기법을 연구하는 학문 골턴 : 사분위수, 백분율, 표준편차 중앙값, 회귀를 발견한 사람 칼 피어슨(Karl Pearso..