데이터전처리 3

TIL_24.07.19_데이터 전처리3

▶ 데이터 병합    ● concat() 함수          - axis : 연결하고자 하는 축(방향)을 지정                     기본 값은 0으로 , 위 아래로 연결하는 경우에 해당,                     1로 설정하면 좌,우로 연결# 두 개의 데이터프레임을 생성했다고 가정하고# 위 아래로 데이터프레임 연결result_vertical = pd.concat([df1,df2], axis = 0)# 좌우로 데이터프레임 연결result_horizontal = pd.concat([df1, df2], axis = 1)     ● merge() 함수        ○ left 와 right : 병합할 데이터 프레임 중 병합되는 기준이 되는              왼쪽과 오른쪽 데이터 ..

TIL_24.07.18_데이터 전처리 2

▶데이터 선택     ● .iloc[로우,컬럼] : 인덱스 번호로 선택하기         - 행번호(로우)와 열번호(컬럼)를 통해 특정 행과 열 데이터를 선택할 수 있다.import pandas as pd# 샘플 데이터프레임 생성data = { 'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50], 'C': [100, 200, 300, 400, 500]}df = pd.DataFrame(data)selected_data = df.iloc[1:4, 0:2]#인덱스 1부터 3까지의 행과, 인덱스 0부터 1까지의 열을 가져온다.print(selected_data) ● .loc[로우, 컬럼] : 이름으로 선택하기      - 인덱스가 번호가 아니고 특정 문자일 경우..

TIL_24.07.17_데이터 전처리 1

일단 먼저,데이터 전처리와 시각화를 배우기 전에,'무엇을 위해 ~ 이런 형태의 데이터가 필요하다' 라는 것을 먼저 정의할 필요가 있다.  ▶데이터 전처리   - 내가 원하는 데이터를 보기 위해 하는 모든 활동 = 데이터 전처리     ● how?         - 데이터를 통해 무엇을 확인할 것인지?         - 어떤 의사결정을 위해 필요한지?         - 데이터를 통해 무엇을 얻고자 하는지, 그 목적을 달성하기 위해             데이터 전처리가 필요하다. ▶ pandas      - 데이터를 조작하고 쉽게 분석할 수 있게 도와주는 라이브러리       - 대용량 데이터 처리가 가능 : pandas는 데이터를 메모리에 로드하고,          다양한 연산에 대한 빠른 처리가 가능, ..