데이터분석 study/ML_기초

TIL_24.08.08_머신러닝은 무엇인가

justdata 2024. 8. 8. 17:19

▶Machine Learning 

- 관측된 패턴을 기반으로 의사 결정을 하기 위한 알고리즘 

- 전체 데이터에서 패턴을 파악하기 위한 방법

 

▶왜 머신러닝은 발전했을까?

    - 통계 : 모집단(전체 집단)의 성질을 표본 집단으로부터 알기 위한 추론 방법

    - 데이터 처리 기술의 발전 : 데이터 처리 관련된 툴들이 많아졌다.

    

▶ 머신러닝 종류

    - Supervised Learning(지도학습) : 문제와 정답을 모두 알려주고 공부시키는 방법

    - Unsupervised Learning(비지도학습) : 답을 가르쳐주지 않고 공부시키는 방법

    - Reinforcement Learning(강화학습): 보상을 통해 상은 최대화 벌은 최소화하는

       방향으로 행위를 강화하는 학습

 

 


 

   * VS code 로 실습할 때 패키지 활용

      ● Python 패키지 관리자 : pip

         - pip는 python 프로그래밍 언어를 위한 표준 패키지 관리자 

         - pip 명령어를 통해 해당 패키지를 설치 삭제 가능 

            ○ pip install {라이브러리명}를 통해 설치

            terminal을 열어 실행 (Terminal - New Terminal)하는 방법이 기본

            Jupyter 버전에 따라 ' ! ' 없이 설치 가능

 

    * Terminal을 이용한 라이브러리 설치 & 삭제

      ● 설치

     

   

       ● 삭제

              ○ 삭제 시에는 중간에 Y 입력

 

         

 

 


선형 회귀 

    ● y는 종속변수, 결과 변수

    x는 독립변수, 원인변수, 설명변수 

 

      ● 머신러닝/딥러닝에서 사용하는 선형회귀 식

 

         ● w: 가중치

         ● b: 편향(Bias)

 

* 머신러닝/딥러닝 모델에서 오차 항은 명시적으로 다루지 않음

* 결국 전달하려고 하는 의미는, 회귀계수 혹은 가중치를 값을 알면

   x가 주어졌을 때 y를 알 수 있다는 것 

 

 

▶ 회귀분석 평가 지표 - MSE

      - Mean Squared Error(MSE) 평균제곱오차

         : 숫자 예측문제는 머신러닝이든 딥러닝이든 어떤 모델을 만들어도

           위 MSE 지표를 최소화하는 방향으로 진행하고 평가

 

▶ 선형회귀만의 평가 지표 - R Square

     - 전체 모형에서 회귀선으로 설명할 수 있는 정도

     - 모형이 설명을 얼마나 갖는가 : 결정계수(R Square)값

 

        

   * SSR : 제곱합 회귀

      SSE : 제곱합 잔차

      SST : 제곱합 총합 (SSR + SSE)

 

     ex) 만약 r2 가 약 94가 나왔다면

            이 모형은 전체 데이터의 94%의 설명력을 가지고 있다는 뜻.