1.9Distinct

중복값을 없애는 DISTINCT 키워드

DISTINCT로 중복 없이 고유한 값만 추출하기

데이터를 조회할 때, 중복된 값은 제외하고 고유한 값만 보고 싶을 때가 있다. 이럴 때 DISTINCT 키워드를 사용한다.

sql
SELECT DISTINCT department
FROM products;

products 테이블에서 중복된 department는 제거하고 고유한 department 값들만 한번씩 나온다.

즉, department가 같은 여러 열이 있더라도 해당 열들은 하나의 department 데이터로 표현된다.

고유한 값이 몇 개인지 알고 싶다면 COUNT(DISTINCT ...)를 사용한다.

sql
SELECT COUNT(DISTINCT department)
FROM products;

둘 다 중복 제거를 하지만, 사용 방식과 목적에 차이가 있다.

GROUP BY는 DISTINCT를 대체할 수 있지만, 반대로 DISTINCT는 GROUP BY를 대체할 수 없다.

DISTINCT로 한 컬럼뿐 아니라 여러 컬럼의 조합이 고유한지도 판단할 수 있다.

sql
SELECT DISTINCT department, name
FROM products;

⇒ 단, 이렇게 하면 COUNT 같은 집계 함수(aggregate operator)는 사용이 안 된다.

sql
SELECT DISTINCT department COUNT(*)
FROM products;
-- 에러 발생

sql
SELECT department, COUNT(*)
FROM products
GROUP BY department;