데이터 시각화 2

TIL_24.08.16_EDA

▶탐색적 데이터 분석(EDA)    - 데이터의 시각화, 기술통계 등의 방법을 통해      데이터를 이해하고 탐구하는 과정   ● 기술 통계를 통한 EDA 예시        - describe() 메소드를 하여 기초통계량 확인          (* include = 'all' 옵션을 사용하면 범주형 데이터도 확인가능)    ● 시각화를 이용한 EDA 예시        1) countplot : 범주형 자료의 빈도 수 시각화           - 범주형 데이터의 각 카테고리별 빈도수 나타날 때           -  x축 : 범주형 자료           -  y축 : 자료의 빈도수        2) barplot : 범주형 자료의 시각화           - 범주형 데이터의 각 카테고리에 따른 수치 데..

TIL_24.07.23_데이터 시각화 2

● Box plot    - 연속형 데이터의 분포와 이상치를 시각화하는 데 주로 사용    - 데이터의 중앙값, 사분위수(25%, 50%, 75% 위치의 값), 최소값,      최대값, 이상치를 한눈에 파악할 수 있다. 예시코드)import matplotlib.pyplot as pltimport numpy as np# 데이터 생성np.random.seed(10)data = [np.random.normal(0, std, 100) for std in range(1, 4)]# 박스 플롯 그리기plt.boxplot(data)plt.xlabel('Data')plt.ylabel('Value')plt.title('Box Plot')plt.show()  ■ Box plot의 구성요소     □ 상자(box) : 데이..