전체 글 108

SQL_함수

◎ SQL_특징 #을 통해 주석 처리한 Python과 달리 SQL에서는 --를 통해 주석처리를 한다. 여러 줄로 긴 주석은 /*로 시작해서 끝날 때 *과 /를 (붙여서 써) 주면 됩니다. (Python과 동일) SQL 구문은 대소문자 구분이 없음 단순 계산을 위한 의미 없는 dummy 테이블을 생산할 때 dual 사용 ◎ SQL_다양한 연산자 -- 산술 연산자 SELECT 10, 10+3, 10-3, -10, 10*3, 10/3 FROM dual; SELECT 10*10-10; # FROM daul; 문 생략 가능 -- 문자 관련 함수 SELECT CONCAT('교보','생명'), SUBSTR('데이터분석', 1, 3), TRIM(' 올여름의 할 일은 모르는 사람의 그늘을 읽는 일 '); -- CONCA..

Data scientist/SQL 2021.08.06

Netflix 데이터 간략히 EDA 해보기

쥬피터로 아래 파일을 열어 보시면 더 예쁘게 나와요~ 실제 데이터이며 따로 분석해보실 분은 다운로드하여서 해보세요~ In [1]: # 기본 라이브러리 불러오기 import numpy as np import pandas as pd import seaborn as sns import matplotlib.pyplot as plt 1. 데이터 파악하기¶ In [2]: df = pd.read_csv('../my room/data2/netflix_titles.csv', encoding='utf-8') # 불러와서 한번 보기 df.head() Out[2]: show_id type title director cast country date_added release_year rating duration listed_in..

SQL_TABLE

◎ SQL_TABLE 테이블이란 관계형 데이터베이스에서 데이터를 관리 및 저장하는 장소 반드시 테이블 생성 시 기본키를 설정해야 한다. 기본키는 특정 집합에서 특정 행을 유일하게 식별할 수 있는 속성의 집합 (기본키는 중복되면 안 된다.) ※ 정규형 테이블을 정의하는 기본 형태 즉 제대로 된 형태를 뜻한다 -> 테이블 갱신 시 부정합이 발생하기 어려운 형태 정규화가 제대로 되지 않아 관리의 어려움을 겪는 시스템이 다수 존재 ▲ 제1 정규형(1NF) 위반 - 테이블의 셀에 여러 개의 값을 포함하지 않는다. ▲ 제2정규형(2NF) 위반 - 부분함수 종속성을 허용하지 않음 - 기본키를 구성하는 열의 일부에만 함수속 종속이 존재하는 것 ▲ 제3정규형(3NF) 위반 - 기본 키를 제외한 일반 컬럼끼리 함수 종속이..

Data scientist/SQL 2021.08.05

SQL_기본

◎ SQL_SELECT # CUSTOMERS 테이블에서 3개의 변수 뽑아내기 SELECT CUSTOMER_ID , NAME , CREDIT_LIMIT FROM CUSTOMERS ; # CUSTOMERS 테이블에서 전체 내용 보기 SELECT * FROM CUSTOMERS ; # DUMMP TABLE 생성 SELECT (10 + 5) / 2 AS VAL FROM DUAL ; ◎ SQL_ORDER BY # ORDER BY문은 정렬 구문으로 기본값은 ASC (생략 가능) # ASC : 오름차순, DESC : 내림차순 SELECT NAME , ADDRESS , CREDIT_LIMIT FROM CUSTOMERS ORDER BY NAME DESC # NAME변수를 내림차순 정리 ; # 두개의 변수가 ORDER BY..

Data scientist/SQL 2021.08.04

SQL_데이터베이스

◎ 데이터베이스 컴퓨터 시스템에 전자적으로 저장된 체계적 데이터의 모음 점점 더 대용량의 데이터를 저장하고 조회하는 요구 상항이 증대됨에 따라 데이터베이스라는 개념 도입 데이터베이스 발명 이전에는 텍스트 파일 형태로 정장 및 관리, 공유의 어려움, 파일로 주고받으며 데이터의 유실 가능성 존재 현재 모든 것이 데이터베이스로 관리 ◎ 데이터베이스 관리 시스템 Database management system (DBMS)는 다수의 사용자들이 데이터베이스 내의 데이터를 접근할 수 있도록 해주는 소프트웨어 도구의 집합 ※ 데이터베이스 시스템의 특징 ⓐ 실시간 접근성 : 수 초 내에 결과를 서비스한다. ⓑ 계속적인 변화 : 데이터 값은 시간에 따라 항상 바뀐다. ⓒ 동시 공유 : 여러 사용자에게 동시에 공유, 동시는..

Data scientist/SQL 2021.08.04

AP_CGV 사이트에서 영화 리뷰 crawling

쥬피터로 아래 파일을 열어 보시면 더 예쁘게 나와요~ 1. 상영 중인 영화 평점 추출하기¶ 1.1 원하는 웹페이지 선정하기¶ 국내 3대 메이저 영화관 개수 CGV는 171개 롯데시네마는 130개 메가박스는 101개 가장 인기있는 영화관은 CGV라 판단하여 CGV 웹페이지 선정!! In [1]: url = "http://www.cgv.co.kr/movies/" # CGV 웹페이지 들고오기 # 해당 페이지의 page source를 직접 가져옵니다. from urllib.request import urlopen # import requests 구문도 가능 source = urlopen(url).read() 1.2 beautifulsoup를 이용해서 태그에서 정보 가져오기¶ In [2]: import bs4 s..

Python_matplotlib 한글 깨짐 해결하기.

쉽고 간단하게 해결 방법을 제시하고자 한다. 해당 파일을 다운로드하고 원하는 곳에 위치시킨 뒤 import matplotlib.font_manager as fm path = 'C:\\Users\\Desktop\\my room\\NanumBarunGothic.ttf' fontprob=fm.FontProperties(fname=path,size=18) ######################################################################## plt.barh(index, v1) plt.yticks(index, a, fontsize=13,fontproperties=fontprob, rotation=0) plt.show() # 선언문마다 fontproperties=fontp..

NO! Bugs! 2021.08.01