대표적인 파이썬 통계 라이브러리 정리

Python
avatar
2025.04.10
·
4 min read

라이브러리

1. Pandas
데이터 처리와 분석을 위한 라이브러리로, 데이터 프레임을 다루기 위한 다양한 기능을 제공

2. NumPy
수치 데이터를 처리하기 위한 라이브러리로, 특히 다차원 배열을 효과적으로 다룰 수 있음

3. SciPy
고급 수학, 과학 및 공학 계산을 위한 라이브러리로, 통계 함수와 확률 분포 등을 제공

4. Statsmodels
통계 모델을 만들고, 회귀 분석, 시계열 분석, 가설 검정 등을 수행하는 데 사용

5. Matplotlib
데이터 시각화를 위한 라이브러리로, 그래프와 플롯을 그릴 때 사용

6. Seaborn
Matplotlib 기반의 고급 시각화 라이브러리로, 통계적 플롯을 쉽게 그릴 수 있음

7. scikit-learn
머신러닝 라이브러리지만, 통계적 분석 및 데이터 전처리에도 많이 사용

1. Pandas

https://pandas.pydata.org/
맥컴
수학전공 재무분석
데이터 분석 및 통계
DataFrame 과 Series 객체를 제공
R의 data.frame 과 비슷 – 테이블 형태

2. Numpy

https://numpy.org/
Numerical
Python 의 준말
수학, 과작 연산작업을 위한 라이브러리로 수치해석 및 통계관련 기능을 구현할 때 기본적으로 사용.
Numpy 는 C, Fortran으로 작성되어 실행 속도가 빠른 편자료의 기본적인 배열 구조를 제공하며 행렬 연산 등을 지원.
Pandas, Matplolib, Scipy, Sklearn 등 여러 라이브러리와 같이 사용되는 경우가 많음

3. Scipy

https://scipy.org/
수학
및 과학 기술 분야의 다양한 연산 등을 지원하는 라이브러리.
미적, 적분, 방정식 해를 구하는 등에 사용평균, 표준편차, 사분위수 등 기술통계량과 다향 통계분석을 지원

4. Statsmodels

http://www.statmodels.org/stable/index.html
통계적인
모델 분석에 대한 기능을 제공.

5. Matplotlib

https://matplotlib.org/
그래프나
2차원 데이터 등 시각화 하는 기능을 지원합니다.

6. Seaborn

https://seaborn.pydata.org/
matplotlib을
기반으로 만들어진 고급 데이터 시각화 라이브러리
통계 데이터를 시각적으로 더 쉽고, 더 예쁘게, 더 이해하기 쉽게 표현

7. Scikit-learn

https://scikit-learn.org/stable/
기계학습
라이브러리
각 알고리즘에 대한 상세한 정보와 다양한 옵션
문서사용자 가이드 https://scikit-learn.org/stable/user_guide.html
API
문서 https://scikit-learn.org/stable/modules/classes.html
Numpy
와 Scipy를 사용합니다.







- 컬렉션 아티클