목록전체 글 (123)
#wannabeeeeeee the best DataScientist
몬테카를로(Monte Carlo) 몬테카를로(Monte Carlo, MC) 방법은 표본을 반복적으로 샘플링하여 기댓값을 근사하는 통계적 기법입니다. 강화 학습에서는 환경의 전이 확률을 모르더라도, 직접 경험한 에피소드의 평균 반환값(return) 을 통해 가치 함수 또는 Q 함수를 추정하는 데 사용됩니다. 1. 몬테카를로 방법의 핵심 아이디어어떤 확률 변수 X의 기댓값 E[X]를 알고 싶을 때, 확률 분포를 정확히 몰라도 다음처럼 샘플링을 통해 근사할 수 있습니다.즉, 샘플 수 N이 커질수록 실제 기댓값에 가까워집니다. 이를 강화 학습에서는 환경을 여러 차례 시뮬레이션(=에피소드 생성)하여 사용합니다. 2. 강화 학습에서의 몬테카를로 방법몬테카를로는 모델을 모르는 환경(model-free) 에서 매..
강화학습(Reinforcement Learning, RL)을 이해하는 핵심은 MDP(마르코프 결정 과정)이며,MDP를 해결하는 가장 중요한 도구가 바로 벨만 방정식(Bellman Equation)입니다. 또한, 벨만 방정식을 이용해 최적 정책을 찾는 대표적인 모델 기반(Model-based) 알고리즘이동적 계획법(Dynamic Programming, DP)이며, 이는가치 반복(Value Iteration)정책 반복(Policy Iteration)두 가지 알고리즘으로 구성됩니다. 1. 벨만 방정식(Bellman Equation)벨만 방정식은 "현재 상태의 가치"를 즉각적인 보상 + 다음 상태의 할인된 가치의 합으로 재귀적으로 정의합니다. 1-1. 가치 함수(V)의 벨만 방정식가치 함수 Vπ(s)는“정책 π..
군집화 기반 추천 시스템 (Clustering-based Recommender Systems)이웃 기반(Neighborhood) 협업 필터링은 직관적이지만, 사용자 수나 아이템 수가 많아질수록 계산 복잡도가 급격히 증가하는 문제가 있습니다.이를 완화하기 위한 접근법이 바로 군집화(Clustering) 기반 방법입니다. 핵심 아이디어: 비슷한 사용자끼리 미리 k개의 그룹(cluster) 로 묶고, 그룹 내부에서만 유사도 계산을 수행하자. 즉, 모든 사용자 간 유사도를 계산하지 않고, “같은 클러스터 내 이웃끼리만 비교”하여 계산 효율성을 높입니다. 단계 요약Clustering (ex. K-means)사용자들을 k개의 클러스터로 묶음Intra-cluster Similarity같은 클러스터 내에서만 유사도 ..
메모리 기반 추천 시스템(Memory-based Recommender Systems)추천 시스템은 크게 메모리 기반과 모델 기반으로 나뉩니다.그중 메모리 기반(Memory-based) 방식은 가장 기본적이면서도 직관적인 협업 필터링(CF) 접근법입니다. 지금도 추천 시스템의 핵심 개념을 이해할 때 출발점으로 자주 사용됩니다. 핵심 아이디어 비슷한 사용자는 비슷한 아이템을 좋아한다.비슷한 아이템은 비슷한 평가를 받는다.이 단순한 가정을 바탕으로 메모리 기반 방식은 두 가지로 나뉩니다:구분설명사용자 기반(User-based)나와 비슷한 사람들의 선호를 이용해 추천아이템 기반(Item-based)내가 좋아한 아이템과 비슷한 아이템을 찾아 추천사용자 기반 이웃 방법 (User-based Neighborhood ..
오프라인 평가를 위한 정확도 지표 정리추천 시스템의 목표는 단순히 “무엇을 추천했는가”가 아닙니다.“얼마나 정확하게 사용자의 선호를 반영했는가” 바로 이 부분을 평가하는 것이 핵심입니다.예측 정확도 지표 (Prediction Accuracy Metrics)사용자의 선호도를 수치로 예측하는 경우, 머신러닝의 회귀 평가 지표가 그대로 활용됩니다.지표수식특징MSE (Mean Square Error)(실제값−예측값)² / n값이 작을수록 좋음. 이상치(outlier)에 민감.RMSE (Root Mean Square Error)√((실제값−예측값)² / n)MSE의 루트를 취해 해석 용이. 큰 오차에 더 민감.MAE (Mean Absolute Error) 실제값−예측값의 절대 RMSE는 "큰 오차"를 더 중요하게..
추천 시스템 평가 지표를 배우는 이유추천 시스템의 궁극적인 목표는 사용자 만족 극대화입니다.그렇다면 어떤 알고리즘이 더 “좋은 추천”을 하는지, 즉 정말로 사용자에게 도움이 되는지를 알아야합니다. 👉 그래서 평가 지표(Evaluation Metrics) 가 중요합니다. 왜 추천 시스템을 평가해야 할까? Ⅰ. 사용자 경험 향상 추천 시스템의 핵심 목표는 단 하나, 사용자를 만족시키는 것입니다.평가 지표를 통해 “어떤 추천이 실제로 도움이 되는가?”를 판단하고, 그 결과를 바탕으로 시스템을 개선할 수 있습니다. Ⅱ. 모델 선택 추천 알고리즘은 다양합니다.(ex. 협업 필터링, 콘텐츠 기반 추천, 딥러닝 기반 추천 등)이 중에서 어떤 알고리즘이 더 효과적인지 객관적으로 비교하려면, 공통의 기준이 필요합니다...
추천 시스템, 왜 이렇게 중요한가? 요즘 온라인 서비스에는 정말 엄청난 양의 선택지가 있습니다.아마존에는 약 1,200만 개의 상품넷플릭스에는 17,000편 이상의 콘텐츠하지만 우리의 시간·예산·주의력은 한정적너무 많은 선택지 앞에서 오히려 피로감을 느끼고, 결국 아무것도 고르지 못하는 경우도 많습니다. 👉 바로 이 ‘선택 피로(Decision Fatigue)’ 를 줄여주는 기술이 추천 시스템(Recommender System) 입니다.추천 시스템이 중요한 이유많은 사람들이 이렇게 생각합니다.“선택지가 많으면 좋지 않아?” 하지만 실제로는 선택지가 많을수록 결정하기 어렵고,그 과정이 길어질수록 이탈 확률이 높아집니다. 결국 핵심은사용자가 ‘빠르고 정확하게’ 마음에 드는 아이템을 찾을 수 있게 만드는 것..