Ccode 17

Netflix 데이터 간략히 EDA 해보기

쥬피터로 아래 파일을 열어 보시면 더 예쁘게 나와요~ 실제 데이터이며 따로 분석해보실 분은 다운로드하여서 해보세요~ In [1]: # 기본 라이브러리 불러오기 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt 1. 데이터 파악하기¶ In [2]: df = pd.read_csv('../my room/data2/netflix_titles.csv', encoding='utf-8') # 불러와서 한번 보기 df.head() Out[2]: show_id type title director cast country date_added release_year rating duration listed_in..

AP_CGV 사이트에서 영화 리뷰 crawling

쥬피터로 아래 파일을 열어 보시면 더 예쁘게 나와요~ 1. 상영 중인 영화 평점 추출하기¶ 1.1 원하는 웹페이지 선정하기¶ 국내 3대 메이저 영화관 개수 CGV는 171개 롯데시네마는 130개 메가박스는 101개 가장 인기있는 영화관은 CGV라 판단하여 CGV 웹페이지 선정!! In [1]: url = "http://www.cgv.co.kr/movies/" # CGV 웹페이지 들고오기 # 해당 페이지의 page source를 직접 가져옵니다. from urllib.request import urlopen # import requests 구문도 가능 source = urlopen(url).read() 1.2 beautifulsoup를 이용해서 태그에서 정보 가져오기¶ In [2]: import bs4 s..

공공데이터를 이용한 카페 상권 분석(2021 Ver.)

https://www.data.go.kr/tcs/dss/selectFileDataDetailView.do?publicDataPk=15083033 소상공인시장진흥공단_상가(상권)정보_20210630 영업 중인 전국 상가업소 데이터를 제공합니다. (상호명, 업종코드, 업종명, 지번주소, 도로명주소, 경도, 위도 등) www.data.go.kr 해당 사이트에 접속해서 다운 받은 후 같이 진행해 봐요~ 쥬피터로 아래 파일을 열어 보시면 더 예쁘게 나와요~ 공공데이터를 이용한 카페 상권분석(2021 Ver.)¶ In [2]: # 먼저 필요한 라이브러리를 불러옵니다. import numpy as np import pandas as pd import matplotlib.pyplot as plt import seabo..