▶Machine Learning
- 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘
- 전체 데이터에서 패턴을 파악하기 위한 방법
▶왜 머신러닝은 발전했을까?
- 통계 : 모집단(전체 집단)의 성질을 표본 집단으로부터 알기 위한 추론 방법
- 데이터 처리 기술의 발전 : 데이터 처리 관련된 툴들이 많아졌다.
▶ 머신러닝 종류
- Supervised Learning(지도학습) : 문제와 정답을 모두 알려주고 공부시키는 방법
- Unsupervised Learning(비지도학습) : 답을 가르쳐주지 않고 공부시키는 방법
- Reinforcement Learning(강화학습): 보상을 통해 상은 최대화 벌은 최소화하는
방향으로 행위를 강화하는 학습
* VS code 로 실습할 때 패키지 활용
● Python 패키지 관리자 : pip
- pip는 python 프로그래밍 언어를 위한 표준 패키지 관리자
- pip 명령어를 통해 해당 패키지를 설치 삭제 가능
○ pip install {라이브러리명}를 통해 설치
○ terminal을 열어 실행 (Terminal - New Terminal)하는 방법이 기본
○ Jupyter 버전에 따라 ' ! ' 없이 설치 가능
* Terminal을 이용한 라이브러리 설치 & 삭제
● 설치
● 삭제
○ 삭제 시에는 중간에 Y 입력
▶ 선형 회귀
● y는 종속변수, 결과 변수
● x는 독립변수, 원인변수, 설명변수
● 머신러닝/딥러닝에서 사용하는 선형회귀 식
● w: 가중치
● b: 편향(Bias)
* 머신러닝/딥러닝 모델에서 오차 항은 명시적으로 다루지 않음
* 결국 전달하려고 하는 의미는, 회귀계수 혹은 가중치를 값을 알면
x가 주어졌을 때 y를 알 수 있다는 것
▶ 회귀분석 평가 지표 - MSE
- Mean Squared Error(MSE) 평균제곱오차
: 숫자 예측문제는 머신러닝이든 딥러닝이든 어떤 모델을 만들어도
위 MSE 지표를 최소화하는 방향으로 진행하고 평가
▶ 선형회귀만의 평가 지표 - R Square
- 전체 모형에서 회귀선으로 설명할 수 있는 정도
- 모형이 설명을 얼마나 갖는가 : 결정계수(R Square)값
* SSR : 제곱합 회귀
SSE : 제곱합 잔차
SST : 제곱합 총합 (SSR + SSE)
ex) 만약 r2 가 약 94가 나왔다면
이 모형은 전체 데이터의 94%의 설명력을 가지고 있다는 뜻.
'데이터분석 study > ML_기초' 카테고리의 다른 글
TIL_24.08.13_분류분석- 로지스틱회귀 (0) | 2024.08.13 |
---|---|
TIL_24.08.12_선형회귀 적용, 심화 (0) | 2024.08.12 |