친절한 SQL 튜닝
-
친절한 SQL 튜닝_5장.소트 튜닝_2친절한 SQL 튜닝 2020. 9. 18. 12:09
소트 튜닝 5.2. 소트가 발생하지 않도록 SQL 작성 5.2.1 Union vs. Union All SQL에 Union을 사용하면 옵티마이저는 상단과 하단 두 집합 간 중복을 제거하려고 소트 작업을 수행한다. 반면, Union All은 중복을 확인하지 않고 두 집합을 단순히 결합하므로 소트 작업을 수행하지 않는다. 따라서 될 수 있으면 Union All을 사용해야 한다. 그런데 Union을 Union All로 변경하려다 자칫 결과 집합이 달라질 수 있으므로 주의해야 한다. Union 대신 Union All을 사용해도 되는지를 정확히 판단하려면 데이터 모델에 대한 이해와 집합적 사고가 필요하다. 그런 능력이 부족하면 알 수 없는 데이터 중복, 혹시 모를 데이터 중복을 우려해 중복 제거용 연산자를 불필요하..
-
친절한 SQL 튜닝_5장.소트 튜닝_1친절한 SQL 튜닝 2020. 9. 18. 12:05
소트 튜닝 5.1. 소트 연사에 대한 이해 5.1.1 소트 수행 과정 소트는 기본적으로 PGA에 할당한 Sort Area에서 이루어진다. 메모리 공간인 Sort Area가 다 차면, 디스크 Temp 테이블스페이스를 활용한다. Sort Area에서 작업을 완료할 수 있는지에 따라 소트를 두 가지 유형으로 나눈다. 메모리 소트(In-Memory Sort) : 전체 데이터의 정렬 작업을 메모리 내에서 완료하는 것을 말하며, ‘Internal Sort’라고도 한다. 디스크 소트(To-Disk Sort) : 할당받은 Sort Area 내에서 정렬을 완료하지 못해 디스크 공간까지 사용하는 경우를 말하며, ‘External Sort’라고도 한다. 소트 연산은 메모리 집약적(Memory-intesive)일 뿐만 아니라..
-
친절한 SQL 튜닝_4장.조인 튜닝_4친절한 SQL 튜닝 2020. 9. 13. 13:19
조인 튜닝 4.4 서브쿼리 조인 4.4.1 서브쿼리 변환이 필요한 이유 서브쿼리(Subquery)는 하나의 SQL문 안에 괄호로 묶은 별도의 쿼리 블록(Query Block)을 말한다. 쿼리에 내장된 또 다른 쿼리다. 서브쿼리를 DBMS마다 조금씩 다르게 분류하는데, 오라클은 아래 세 가지로 분류한다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 SELECT c.고객번호, c.고객명, t.평균거래, t.최소거래, t.최대거래 , (SELECT 고객분류명 FROM 고객분류 WHERE 고객분류코드 = c.고객분류코드) -> 스칼라 서브쿼리 FROM 고객 c , (SELECT 고객번호, AVG(거래금액) 평균거래 , MIN(거래금액) 최소금액, MAX(거래금액) 최대거래 FROM 거래 WH..
-
친절한 SQL 튜닝_4장.조인 튜닝_3친절한 SQL 튜닝 2020. 9. 13. 10:48
조인 튜닝 4.3. 해시 조인 4.3.1 기본 메커니즘 해시 조인(Hash Join)도 소트 머지 조인처럼 두 단계로 진행된다. 1. Build 단계 : 작은 쪽 테이블(Build Input)을 읽어 해시 테이블(해시 맵)을 생성한다. 2. Probe 단계 : 큰 쪽 테이블(Probe Input)을 읽어 해시 테이블을 탐색하면서 조인한다. NL 조인과 소트 머지 조인에서 사용했던 아래 SQL로 해시 조인 과정을 설명해 보자. 해시 조인은 use_hash 힌트로 유도한다. 아래 SQL에 사용한 힌트는, 사원 테이블 기준으로 (ordered) 고객 테이블과 조인할 때 해시 조인 방식을 사용하라(use_hash)고 지시하고 있다. 1 2 3 4 5 6 7 8 SELECT /*+ ordered use_hash(..
-
친절한 SQL 튜닝_4장.조인 튜닝_2친절한 SQL 튜닝 2020. 9. 12. 10:41
조인 튜닝 4.2 소트 머지 조인 4.2.1 SGA vs. PGA 오라클 서버 프로세스는 SGA에 공유된 데이터를 읽고 쓰면서, 동시에 자시만의 고유 메모리 영역을 갖는다. 각 오라클 서버 프로세스에 할당된 메모리 영역을 PGA(Process/Program/Private Global Area)라고 부르며, 프로세스에 종속적인 고유 데이터를 저장하는 용도로 사용한다. 할당받은 PGA 공간이 작아 데이터를 모두 저장할 수 없을 때는 Temp 테이블스페이스를 이용한다. PGA는 다른 프로세스와 공유하지 않은 독립적인 메모리 공간이므로 래치 메커니즘이 불필요하다. 따라서 같은 양의 데이터를 읽더라도 SGA 버퍼캐시에서 읽을 때보다 휠씬 빠르다. 4.2.2 기본 메커니즘 소트 머지 조인(Sort Merge Joi..
-
친절한 SQL 튜닝_4장.조인 튜닝_1친절한 SQL 튜닝 2020. 9. 12. 10:37
조인 튜닝 4.1. NL 조인 4.1.1 기본 메커니즘 1 2 3 4 5 6 7 for(int i=0; i= ‘19960101’ AND c.관리사원번호 = e.사원번호 cs ordered 힌트는 FROM 절에 기술한 순서대로 조인하라고 옵티마이저에 지시할 때 사용한다. use_nl 힌트는 NL 방식으로 조인하라고 지시할 때 사용한다. 위에서는 ordered와 use_nl(c) 힌트를 같이 사용했으므로 사원 테이블(-> Driving 또는 Outer Table) 기준으로 고객 테이블(-> Inner 테이블)과 NL 방식으로 조인하라는 뜻이다. 세 개 이상 테이블을 조인할 때는 힌트를 아래처럼 사용한다. 1 2 3 SELECT /*+ ordered use_nl(B) use_nl(C) use_hsah(D) *..
-
친절한 SQL 튜닝_3장.인덱스 튜닝_4친절한 SQL 튜닝 2020. 9. 6. 12:44
인덱스 튜닝 3.4 인덱스 설계 3.4.1 인덱스 설계가 어려운 이유 인덱스가 많으면 구첵적으로 아래와 같은 문제가 생긴다. - DML 성능 저하(-> TPS 저하) - 데이터베이스 사이즈 증가(-> 디스크 공간 낭비) - 데이터베이스 관리 및 운영 비용 상승 테이블에 인덱스가 여섯 개 달려 있으면, 신규 데이터를 입력할 때마다 여섯 개 인덱스에도 데이터를 입력해야 한다. 테이블과 달리 인덱스는 정렬 상태를 유지해야 하므로 수직적 탐색을 통해 입력할 블록부터 찾는다, 찾은 블록에 여유 공간이 없으면 인덱스 분할(Index Split)도 발생한다. 데이터를 지울 때도 마찬가지다. 여섯 개 인덱스에서 레코드를 일일이 찾아 지워줘야 한다. 핵심 트랜잭션이 참조하는 테이블에 대한 DML 성능 저하는 TPS 저하..
-
친절한 SQL 튜닝_3장.인덱스 튜닝_3친절한 SQL 튜닝 2020. 9. 5. 10:18
인덱스 튜닝 3.3 인덱스 스캔 효율화 3.3.1 인덱스 탐색 루트 블록에는 키 값을 갖지 않는 특별한 레코드가 하나 있다. 가장 왼쪽에 ‘LMC(Leftmost Child)’ 레코드다. LMC는 자식 노드 중 가장 왼쪽 긑에 위치한 블록을 가리킨다. LMC가 가리키는 주소로 찾아간 블록에는 ‘키 값을 가진 첫 번째 레코드보다 작거나 같은 값’을 갖는 레코드가 저장돼 있다. 수직적 탐색은 스캔 시작점을 찾는 과정이다. 3.3.2 인덱스 스캔 효율성 인덱스 선행 컬럼이 조건절에 없가나 ‘=’ 조건이 아니면 인덱스 스캔 과정에 비효율이 발생한다. 인덱스 스캔 효율설 측정 인덱스 스캔 효율이 좋은지 나쁜지는 어떻게 알 수 있을까? 조건절 데이터를 일일이 조회해 보는 방법도있지만, SQL 트레이스를 통해 쉽게 ..