데이터분석 study/SQL

TIL_24.07.30_데이터 모델링

justdata 2024. 7. 30. 20:57

▶데이터 모델링

     - 데이터의 구조와 관계를 정의하고 문서화하는 과정

     - 개체(Entity), 속성(Attribute), 관계(Relationship)로 구성

 

     1. 개념적 데이터 모델링:

         - 핵심 엔터티와 그들간의 관계를 발견하고 ER Diagram을 생성

 

     2. 논리적 데이터 모델링 : 비즈니스 정보의 구조와 규칙을 표현

 

     3. 물리적 데이터 모델링 : 

          - 실질적으로 컴퓨터에 어떻게 저장될 것인가에 대한 정의

             (저장구조, 저장 장치 등)

 

      ● 행/열 표현법

           - 분야에 따른 행/열에 대한 데이터를 부르는 명칭이 다르다.

       

방향 엑셀/사무 데이터베이스 통계
가로 행(row) 레코드(record) 관측치(observation)
세로 열(column) 속성(Attribute) 변수(variable)

 

      

      ● 데이터 모델링 용어 정리

용어 설명
엔터티(Entity) 데이터베이스에서 정보를 저장하는 기본 구별 가능한 실체, 관리하고자 하는 대상(사원)
속성(Attribute) 엔터티의 성질을 나타내는 것(사번, 성, 핸드폰번호)
관계(Relationship) 두개 이상의 엔터티의 연결이나 연관, 1:1, 1:N 등 다양한 관계가 있다(사번과 직원은 1:1, 직무와 직원은 1:N 관계)
식별자(identifier) 엔터티를 고유하게 식별하는 속성(사번, 주민등록번호)

 

 

데이터의 설명서 (ERD)

 

 

  ● 식별자부터 시작하는 데이터 확인

       - 식별자란 엔터티를 대표할 수 있는 유일성을 만족하는 속성

       - 대표적으로 사번, 주민등록번호, 계좌번호 등이 존재

       - 식별자(Identifier)의 특징

종류 설명
최소성 주 식별자는 속성을 최소한의 갯수로 조합한다.(컬럼 1개면 best)
대표성 엔터티를 대표해야 한다.
유일성 엔터티의 인스턴스(행)을 유일하게 식별해야 한다.
불변성 자주 변경되면 안된다.