라이브러리
1. Pandas
데이터 처리와 분석을 위한 라이브러리로, 데이터 프레임을 다루기 위한 다양한 기능을 제공
2. NumPy
수치 데이터를 처리하기 위한 라이브러리로, 특히 다차원 배열을 효과적으로 다룰 수 있음
3. SciPy
고급 수학, 과학 및 공학 계산을 위한 라이브러리로, 통계 함수와 확률 분포 등을 제공
4. Statsmodels
통계 모델을 만들고, 회귀 분석, 시계열 분석, 가설 검정 등을 수행하는 데 사용
5. Matplotlib
데이터 시각화를 위한 라이브러리로, 그래프와 플롯을 그릴 때 사용
6. Seaborn
Matplotlib 기반의 고급 시각화 라이브러리로, 통계적 플롯을 쉽게 그릴 수 있음
7. scikit-learn
머신러닝 라이브러리지만, 통계적 분석 및 데이터 전처리에도 많이 사용
1. Pandas
https://pandas.pydata.org/
맥컴 수학전공 재무분석
데이터 분석 및 통계
DataFrame 과 Series 객체를 제공
R의 data.frame 과 비슷 – 테이블 형태
2. Numpy
https://numpy.org/
Numerical Python 의 준말
수학, 과작 연산작업을 위한 라이브러리로 수치해석 및 통계관련 기능을 구현할 때 기본적으로 사용.
Numpy 는 C, Fortran으로 작성되어 실행 속도가 빠른 편자료의 기본적인 배열 구조를 제공하며 행렬 연산 등을 지원.
Pandas, Matplolib, Scipy, Sklearn 등 여러 라이브러리와 같이 사용되는 경우가 많음
3. Scipy
https://scipy.org/
수학 및 과학 기술 분야의 다양한 연산 등을 지원하는 라이브러리.
미적, 적분, 방정식 해를 구하는 등에 사용평균, 표준편차, 사분위수 등 기술통계량과 다향 통계분석을 지원
4. Statsmodels
http://www.statmodels.org/stable/index.html
통계적인 모델 분석에 대한 기능을 제공.
5. Matplotlib
https://matplotlib.org/
그래프나 2차원 데이터 등 시각화 하는 기능을 지원합니다.
6. Seaborn
https://seaborn.pydata.org/
matplotlib을 기반으로 만들어진 고급 데이터 시각화 라이브러리
통계 데이터를 시각적으로 더 쉽고, 더 예쁘게, 더 이해하기 쉽게 표현
7. Scikit-learn
https://scikit-learn.org/stable/
기계학습 라이브러리
각 알고리즘에 대한 상세한 정보와 다양한 옵션
문서사용자 가이드 https://scikit-learn.org/stable/user_guide.html
API 문서 https://scikit-learn.org/stable/modules/classes.html
Numpy 와 Scipy를 사용합니다.