📌SQL 문법 - 집계 함수(Aggregation Functions)와 데이터를 요약

📊 집계 함수로 데이터 요약하기

데이터가 많을수록 전체 내용을 요약해서 파악하는 게 중요합니다.
이럴 때 사용하는 것이 바로 집계 함수(Aggregation Functions)!

이번 글에서는 SQL에서 자주 사용하는 집계 함수들과 함께,
GROUP BY, HAVING 절을 활용한 그룹 단위 분석까지 쉽게 설명할게요.

✅ 집계 함수란?

집계 함수는 여러 행(Row)을 입력받아 하나의 결과값으로 요약해주는 함수입니다.
주로 숫자 데이터를 합산하거나 평균을 구할 때 사용해요.

🔢 주요 집계 함수 종류

함수	설명	예시
`COUNT()`	행의 개수 (NULL 제외)	`COUNT(*)`, `COUNT(column)`
`SUM()`	총합	`SUM(saleprice)`
`AVG()`	평균	`AVG(price)`
`MAX()`	최대값	`MAX(price)`
`MIN()`	최소값	`MIN(price)`

🧪 기본 사용 예시

-- 전체 도서 개수
SELECT COUNT(*) FROM Book;

-- 고객 ID가 3인 사람의 총 구매 금액
SELECT SUM(saleprice)
FROM Orders
WHERE custid = 3;

-- 도서 평균 가격
SELECT AVG(price)
FROM Book;

-- 가장 비싼 도서 가격
SELECT MAX(price) FROM Book;

🔀 GROUP BY로 그룹별 요약

GROUP BY 절은 데이터를 그룹 단위로 묶어 집계할 수 있게 해줍니다.

-- 고객별 총 구매 금액
SELECT custid, SUM(saleprice)
FROM Orders
GROUP BY custid;

• GROUP BY 뒤에 오는 컬럼 기준으로 그룹을 나눠,
• 각 그룹에 대해 집계 함수가 적용됩니다.

🎯 HAVING으로 그룹 조건 추가

• WHERE는 행 단위 조건,
• HAVING은 그룹 단위 조건입니다.

-- 2회 이상 구매한 고객만 보기
SELECT custid, COUNT(*)
FROM Orders
GROUP BY custid
HAVING COUNT(*) >= 2;

🔁 WHERE vs HAVING 차이

	WHERE 절	HAVING 절
적용 시점	GROUP BY 이전	GROUP BY 이후
적용 대상	개별 행(Row)	그룹(Group)
집계 함수 사용	❌ 사용 불가	✅ 사용 가능
사용 목적	원하는 행 필터링	원하는 그룹 필터링
함께 쓰는 절	SELECT, FROM, ORDER BY 등과 함께	GROUP BY와 함께 사용

📦 실전 예제 모음

-- 출판사별 도서 평균 가격 구하기
SELECT publisher, AVG(price) AS avg_price
FROM Book
GROUP BY publisher;

-- 평균 가격이 15,000원 이상인 출판사만
SELECT publisher, AVG(price)
FROM Book
GROUP BY publisher
HAVING AVG(price) >= 15000;

-- 고객 이름 + 총 구매 금액 출력
SELECT name, SUM(saleprice)
FROM Customer C, Orders O
WHERE C.custid = O.custid
GROUP BY name;

📌 정리 요약

	설명
집계 함수	여러 행을 하나의 값으로 요약 (`COUNT`, `SUM`, `AVG`, `MAX`, `MIN`)
GROUP BY	특정 컬럼 기준으로 데이터를 묶어서 집계 수행
HAVING	그룹핑된 결과에 조건 추가 (`HAVING COUNT(*) > 2` 등)
WHERE vs HAVING	WHERE는 행 필터 / HAVING은 그룹 필터, 적용 시점이 다름

📘 학습 팁
• SELECT에 없는 컬럼은 GROUP BY에 반드시 포함돼야 함
• HAVING 없이 GROUP BY만 써도 집계 가능
• COUNT(*) vs COUNT(column)의 차이도 꼭 구분하자!

📊 집계 함수로 데이터 요약하기

데이터가 많을수록 전체 내용을 요약해서 파악하는 게 중요합니다.
이럴 때 사용하는 것이 바로 집계 함수(Aggregation Functions)!

이번 글에서는 SQL에서 자주 사용하는 집계 함수들과 함께,
GROUP BY, HAVING 절을 활용한 그룹 단위 분석까지 쉽게 설명할게요.

-- 전체 도서 개수 SELECT COUNT(*) FROM Book; -- 고객 ID가 3인 사람의 총 구매 금액 SELECT SUM(saleprice) FROM Orders WHERE custid = 3; -- 도서 평균 가격 SELECT AVG(price) FROM Book; -- 가장 비싼 도서 가격 SELECT MAX(price) FROM Book;

📦 실전 예제 모음

-- 출판사별 도서 평균 가격 구하기 SELECT publisher, AVG(price) AS avg_price FROM Book GROUP BY publisher; -- 평균 가격이 15,000원 이상인 출판사만 SELECT publisher, AVG(price) FROM Book GROUP BY publisher HAVING AVG(price) >= 15000; -- 고객 이름 + 총 구매 금액 출력 SELECT name, SUM(saleprice) FROM Customer C, Orders O WHERE C.custid = O.custid GROUP BY name;

📌 정리 요약

	설명
집계 함수	여러 행을 하나의 값으로 요약 (`COUNT`, `SUM`, `AVG`, `MAX`, `MIN`)
GROUP BY	특정 컬럼 기준으로 데이터를 묶어서 집계 수행
HAVING	그룹핑된 결과에 조건 추가 (`HAVING COUNT(*) > 2` 등)
WHERE vs HAVING	WHERE는 행 필터 / HAVING은 그룹 필터, 적용 시점이 다름

📘 학습 팁
• SELECT에 없는 컬럼은 GROUP BY에 반드시 포함돼야 함
• HAVING 없이 GROUP BY만 써도 집계 가능
• COUNT(*) vs COUNT(column)의 차이도 꼭 구분하자!