분류 전체보기 108

[파이썬 머신러닝 완벽가이드] 08. 텍스트 분석(2)

06. 토픽 모델링(Topic Modeling) - 20 뉴스그룹¶ 토픽 모델링이란 문서 집합에 숨어 있는 주제를 찾아내는 것 사람이 수행하는 토픽 모델링은 더 함축적인 의미로 문장을 요약하는 것에 반해, 머신러닝 기반의 토픽 모델은 숨겨진 주제를 효과적으로 표현할 수 있는 중심 단어를 함축적으로 추출 머신러닝 기반의 토픽 모델링에 사용되는 기법은 LSA(Latent Semantic Analysis)와 LDA(Latent Dirichlet Allocation) In [1]: from sklearn.datasets import fetch_20newsgroups from sklearn.feature_extraction.text import CountVectorizer from sklearn.decomposi..

[파이썬 머신러닝 완벽가이드] 08. 텍스트 분석(1)

◎ NLP이냐 텍스트 분석이냐?¶ NLP(National Language Processing)는 머신이 인간의 언어를 이해하고 해석하는 데 더 중섬을 두고 기술이 발전 텍스트 마이닝이라고도 불리는 텍스트 분석은 비정형 텍스트에서 의미 있는 정보를 추출하는 것에 좀 더 중점을 두고 발전 룰 기반 시스템에서 머신러닝의 텍스트 데이터를 기반으로 변경되면서 기술적 발전이 가능해짐 ※ 텍스트 분석 집중 기술 영역 텍스트 분류 : 문서가 특정 분류 또는 카테고리에 속하는 것을 예측하는 기법을 통칭. 스팸 메일 검출 같은 프로그램으로 지도학습을 적용 감성 분석 : 텍스트에서 나타나는 감정/판단/믿음/의견/기분 등의 주관적인 요소를 분석하는 기법을 총칭. 리뷰, 여론조사 등의 다양한 영역에서 활용되는 지도학습과 비지도..

[데이콘] 제2회 코스포 x 데이콘 도서 추천 알고리즘 AI경진대회(코드)

In [1]: # 기본 라이브러리 import import pandas as pd import numpy as np import seaborn as sns import matplotlib.pyplot as plt import statistics from sklearn.metrics import mean_squared_error In [2]: # 데이터 불러오기 (train, test, sample_submission) train= pd.read_csv('C:/Users/20229069/Desktop/superdata/train.csv', encoding='UTF-8') test= pd.read_csv('C:/Users/20229069/Desktop/superdata/test.csv', encoding='..

2021 하반기 경남은행

디지털 직무에 집중적으로 지원하고 있던 저는 2021년 하반기 경남은행에 지역 인재 전형으로 지원했습니다. 서류는 웬만하면 다 붙여줘서 AI 면접까지 치르게 하는 것 같았으며(제 뇌피셜입니다.) AI 면접 또한 다른 기업에서 진행하는 AI 면접과 다를 게 없었습니다. 그렇게 서류+AI 면접을 합격하고 필기를 서울에 가서 쳤습니다. 직무기초소양(대부분이 사고력 문제) + 금융/경제/경영 기초상식(TESAT 수준) + 디지털 기초상식(책에서 나오는 기본 디지털 상식 또는 사회 현상)으로 구성됐으며 먼가 합격할 것이라는 느낌이 그냥 느낌 적으로 왔습니다. 그렇게 경남은행 본점에서 3개의 면접을 진행했습니다. 4명이 한 조가 되었으며 면접 순서는 무작위 같았습니다. 저는 상황면접을 처음으로 봤습니다. 상황면접이..

면접 2022.10.09

숫자 짝꿍

https://school.programmers.co.kr/learn/courses/30/lessons/131128 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 프로그래머스에서 난이도 Lv.1에서 가장 정답률이 낮은 숫자 짝꿍을 한번 도전해 봤습니다. def solution(X, Y): answer = "" --SORT와 REMOVE를 쓰기 위해 리스트로 모두 만들기 df = [] X1=[] Y1=[] --리스트에 값 넣기 for i in X: X1.append(i) for i in Y: Y1.append(i) --일치하는 값 발생 시 df 리스트에 넣..

Ccode/Coding_Test 2022.10.07

2021 상반기 우리은행

2021년 상반기 우리은행에 디지털/IT 직무에 지원을 해 운 좋게 1차 인터뷰까지 간 바가 있어 관련 경험을 공유하고자 글을 적습니다. 우리은행 같은 경우 전용 사이트에서 합격자 유무를 알려줘 시간이 지난 지금 해당 사이트도 없어졌으며 메일에는 지원 내용만 남아있는 점 양해 부탁합니다..ㅎ 5대 은행(KB, 신한, 우리, 하나, NH) 중 신한카드와 하나카드를 제외한 처음으로 우리은행에 서류에 합격해 얼떨떨했습니다. (TMI : 당시 서류조차도 못 뚫어서 역시 지방대 늙은이는 필기시험을 칠 기회도 안 주는구나 하고 생각하고 있었습니다. 물론 지금도 그렇게 생각하고 있지만...) 그렇게 필기시험을 치기 위해 서울로 올라갔습니다. 언어(20%), 수리(60%), 경제(20%) 정도의 비율이었을 것입니다. ..

면접 2022.10.03