1. Data Governance(데이터 거버넌스)
1) 데이터 거버넌스 란?
(1) 데이터의 수집, 사용, 폐기에 이르는 데이터 수명 주기 동안 데이터를 관리하는 방법론
(2) 데이터의 보안, 개인정보보호, 정확성, 가용성, 사용성을 보장하기 위한 방법론 및 기술을 말함
(3) 이점
I. 현명하고 빠른 의사결정 : 조직전체가 빠르게 데이터에 접근 가능
II. 비용 관리 개선 : 데이터에 사용되는 리소스를 최소화
III. 규정 준수 강화 : 데이터 도메인 정책 등의 규정 준수 강화
IV. 고객 및 공급 업체의 신뢰도 향상 : 보안, 개인정보보호에 따른 신뢰도 향상
2) 구축 요소
(1) Data Domain 정책
(2) Data Lineage 구성
(3) Data flow Chart 구성
(4) 보안 정책 구성
(5) 개인 정보 익명화 정책
2. Data Domain
1) 정의
(1) 일상에서 사용되는 단어 정의하여 관리하는 방법론
(2) 여러 데이터에서 혼재되어 있는 같은 의미의 단어를 하나의 명칭 및 형태를 통일하는 방법
2) 적용 방법
(1) 표준 단어 사전 생성 : 업무 상 편의나 관습에 따라 동일한 단어를 서로 다른 의미로 사용하는 경우, 혹은 하나의 단어에 다양한 의미를 부여하는 문제를 제거
I. 구성 요소
A. 표준성 : 일반적인 업무에서 사용하는 단어
B. 일반성 : 일상적으로 사용되는 단어
C. 대표성 : 비슷한 동의어를 대표할 수 있는 단어
II. 구성 방법
A. 현행 용어 수집
B. 현행 용어에서 사용하는 단어를 최소 단위로 분할
C. 최소 단위 단어 정렬
D. 표준 사전 단어 정리
(2) 표준 도메인 사전 정의
I. 관리 기준
A. 표준성 : 공통으로 사용되는 속성을 대상
B. 유일성 : 동일 내용이 중복 도메인이 서로 다른 이름을 가지면 안 된다.
C. 업무 지향성 : 지나치게 일반화 되어 업무용어와 동떨어지면 안 된다.
II. 구성 방법
A. 표준 사전을 기반으로 한다.
B. 표준 코드 사전을 정의한다.
C. 표준 코드 사전을 기반으로 도메인을 정의한다.
3. Data lineage(데이터 리니지)
1) 정의
(1) Data Flow에 따라 데이터가 Transform 될 떄 원천이 되는 Source 데이터가 어떤 것인지 알 수 있도록 하는 방법론
(2) 특징
I. 데이터의 생명 주기 파악 : 데이터의 생성, 변경, 이동 전체의 생명 주기를 관리할 수 있다.
II. 적시 확인 : 데이터의 최적화 형태를 적시 확인 가능하다.
III. 정확성 및 안정성 : 데이터의 계보를 통한 시스템의 안정성을 확보할 수 있다.
.
2) 구성 요소
(1) 데이터 맵 : 데이터가 어떻게 퍼져 있는지를 파악
(2) 데이터 흐름(Data Flow)
(3) 컬럼 맵핑 & 흐름 : Data Flow에 따라 컬럼명이 변경될 때의 흐름
4. 출처
1) https://www.imperva.com/learn/data-security/data-lineage/
2) https://cloud.google.com/learn/what-is-data-governance?hl=ko
3) https://dataonair.or.kr/db-tech-reference/d-guide/da-guide/?mod=document&uid=272
4) http://blog.skby.net/%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%A6%AC%EB%8B%88%EC%A7%80/
5) https://velog.io/@gillog/DBDomain-Data-Dictionary
'IT ETC' 카테고리의 다른 글
설치형 Git 인 Git Lab을 설치해보자 (0) | 2021.10.19 |
---|---|
Snapd - Linux 통합 패키지 관리 툴 (0) | 2021.07.30 |
Windows 패키지 관리 프로그램 Chocolatey (0) | 2021.07.29 |
Windows Terminal 소개 (0) | 2021.07.29 |
FQDN & ADN & PQDN (0) | 2021.07.05 |
최근댓글