Data scientist/SQL 7

SQL_important

◎ Select절 주의사항 ◎ 문법 정리 ※ where절에 and와 or를 함께 쓸때는, 반드시 ()로 의미 단위끼리 묶는다!! ※ where절은 문자의 경우 대소문자를 구분한다. ※ between 연산자를 사용하는 것보다 비교 연산자를 사용하여 쿼리를 작성하는 것이 성능 측면에서 좋다. ※ 만약 검색하고자 하는 문자에 '%'나 '_'가 있을 경우에는 ESCAPE '\'를 같이 작성해야 한다. ※ ORDER BY 구문은 DBMS에게 큰 부담을 주는 명령어이기 떄문에 SQL에서 피해야 하는 명령어이다. ◎ Group by절 주의사항 ※ SELECT 절에 사용된 급룹 함수 이외의 칼럼이나 표현식은 반드시 GROUP BY 절에 사용되어야 한다. ※ GROUP BY 절에 사용된 칼럼은 SELECT 절에 사용되지..

Data scientist/SQL 2021.11.07

SQL_함수(2)

◎ SQL_Order by -- ORDER BY를 활용한 관측치 정렬 SELECT * FROM world.country ORDER BY SurfaceArea; -- ORDER BY 뒤에 기준이 될 변수를 입력 -- 오름차순이 기본값 SELECT * FROM world.country ORDER BY Continent, Population DESC; -- 입력한 변수 순서대로 정렬. DESC는 각각의 변수에만 영향을 미침 -- 내림차순으로 정렬시에는 변수이름 뒤에 DESC를 추가로 입력 --Q1. sales.payments 테이블에서 2004년 1월 1일 이후 결제건으로 --연도/월, customerNumber별 결제 건수 및 amount의 합계 계산 후 --연도/월(오름차순), amount 합의 내림차순으..

Data scientist/SQL 2021.08.09

SQL_Practice_기온 데이터 분석

◎ 기온 데이터 생성 https://data.kma.go.kr/stcs/grnd/grndTaList.do?pgmNo=70 기상자료개방포털[기후통계분석:통계분석:기온분석] 지점별로 기온의 시계열 분석을 확인합니다. 일, 월, 연의 평균기온, 최저기온, 최고기온을 각각 조회할 수 있습니다. * (그래프) 평균최고(최저)기온: 일최고(최저)기온의 월평균 * '지역/지점' data.kma.go.kr 해당 페이지에서 1904년 1월 1일부터 2021년 8월 4일까지의 기온 데이터 검색 csv파일로 저장 후 SQL Developer를 사용해 분석 -- csv파일의 내용을 넣을 테이블을 생성 CREATE TABLE TB_TEMPER_DATA ( STD_DE CHAR(10) , AREA_CD CHAR(3) , AVG_..

Data scientist/SQL 2021.08.08

SQL_함수

◎ SQL_특징 #을 통해 주석 처리한 Python과 달리 SQL에서는 --를 통해 주석처리를 한다. 여러 줄로 긴 주석은 /*로 시작해서 끝날 때 *과 /를 (붙여서 써) 주면 됩니다. (Python과 동일) SQL 구문은 대소문자 구분이 없음 단순 계산을 위한 의미 없는 dummy 테이블을 생산할 때 dual 사용 ◎ SQL_다양한 연산자 -- 산술 연산자 SELECT 10, 10+3, 10-3, -10, 10*3, 10/3 FROM dual; SELECT 10*10-10; # FROM daul; 문 생략 가능 -- 문자 관련 함수 SELECT CONCAT('교보','생명'), SUBSTR('데이터분석', 1, 3), TRIM(' 올여름의 할 일은 모르는 사람의 그늘을 읽는 일 '); -- CONCA..

Data scientist/SQL 2021.08.06

SQL_TABLE

◎ SQL_TABLE 테이블이란 관계형 데이터베이스에서 데이터를 관리 및 저장하는 장소 반드시 테이블 생성 시 기본키를 설정해야 한다. 기본키는 특정 집합에서 특정 행을 유일하게 식별할 수 있는 속성의 집합 (기본키는 중복되면 안 된다.) ※ 정규형 테이블을 정의하는 기본 형태 즉 제대로 된 형태를 뜻한다 -> 테이블 갱신 시 부정합이 발생하기 어려운 형태 정규화가 제대로 되지 않아 관리의 어려움을 겪는 시스템이 다수 존재 ▲ 제1 정규형(1NF) 위반 - 테이블의 셀에 여러 개의 값을 포함하지 않는다. ▲ 제2정규형(2NF) 위반 - 부분함수 종속성을 허용하지 않음 - 기본키를 구성하는 열의 일부에만 함수속 종속이 존재하는 것 ▲ 제3정규형(3NF) 위반 - 기본 키를 제외한 일반 컬럼끼리 함수 종속이..

Data scientist/SQL 2021.08.05

SQL_기본

◎ SQL_SELECT # CUSTOMERS 테이블에서 3개의 변수 뽑아내기 SELECT CUSTOMER_ID , NAME , CREDIT_LIMIT FROM CUSTOMERS ; # CUSTOMERS 테이블에서 전체 내용 보기 SELECT * FROM CUSTOMERS ; # DUMMP TABLE 생성 SELECT (10 + 5) / 2 AS VAL FROM DUAL ; ◎ SQL_ORDER BY # ORDER BY문은 정렬 구문으로 기본값은 ASC (생략 가능) # ASC : 오름차순, DESC : 내림차순 SELECT NAME , ADDRESS , CREDIT_LIMIT FROM CUSTOMERS ORDER BY NAME DESC # NAME변수를 내림차순 정리 ; # 두개의 변수가 ORDER BY..

Data scientist/SQL 2021.08.04

SQL_데이터베이스

◎ 데이터베이스 컴퓨터 시스템에 전자적으로 저장된 체계적 데이터의 모음 점점 더 대용량의 데이터를 저장하고 조회하는 요구 상항이 증대됨에 따라 데이터베이스라는 개념 도입 데이터베이스 발명 이전에는 텍스트 파일 형태로 정장 및 관리, 공유의 어려움, 파일로 주고받으며 데이터의 유실 가능성 존재 현재 모든 것이 데이터베이스로 관리 ◎ 데이터베이스 관리 시스템 Database management system (DBMS)는 다수의 사용자들이 데이터베이스 내의 데이터를 접근할 수 있도록 해주는 소프트웨어 도구의 집합 ※ 데이터베이스 시스템의 특징 ⓐ 실시간 접근성 : 수 초 내에 결과를 서비스한다. ⓑ 계속적인 변화 : 데이터 값은 시간에 따라 항상 바뀐다. ⓒ 동시 공유 : 여러 사용자에게 동시에 공유, 동시는..

Data scientist/SQL 2021.08.04