일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 오피스텔투자
- 상업시설용지 분양
- 임대소득외 추가소득이 있을 경우
- 주택임대사업자
- 가장 많이 사용되는 파이썬 패키지
- 데이터 리터러시
- 소형주택 세액감면
- chatgpt vs bard
- 가장 인기있는 파이썬 라이브러리
- Google vs OpenAI
- 전세보증보험
- Python
- 다주택임대
- 갤럭시탭 with Pen
- 라이브러리 vs 패키지
- 파이썬 TypeError
- 종합과세
- 가장 많이 사용되는 파이썬 라이브러리
- PostgreSQL
- chatgpt 100% 신뢰금지
- Google vs MicorSoft
- 공개서적
- bard 100% 신뢰금지
- 나는 어디로?
- 2룸 오피스텔 투자
- 오라클 데이터베이스 내장함수
- 가장 인기있는 파이썬 패키지
- robux
- 주상복합용지 분양
- 종합소득세
All thing of the world!
Data-Driven Decision 업무 환경 조성을 위한 데이터관리체계(Data Governance) 도입 전략 본문
- 제목 : 데이터관리체계(Data Governance) 이해와 구축방안
- 저자 : Worldseeker
- 저작권 : 포스팅하단 저작권 표시 준수 바랍니다.
사내 데이터 활용을 위한 데이터 관리 기반(데이터 거버넌스, 데이터 관리체계, Data Governance) 구축을 준비하려는 기업이나 현재 운용하는 기업이 점점 늘어가고 있습니다.
또한 정부조차도 작년 12월에 데이터기반행정을 마련하고 본격적인 Data driven 행정을 준비하고 있습니다.
4차 산업혁명을 대비한 Data-Driven Decision 업무 환경 조성을 위한 데이터 관리체계 도입 전략은 어떻게 가져가야 하는지 데이터 관리체계란 무엇인지 설명하겠습니다.
* The adjective data-driven means that progress in an activity is compelled by data, rather than by intuition or by personal experience.
우리의 현실?
사내에 존재하는 데이터를 활용하여 데이터 분석을 해보고 싶나요?
다른 회사에서는 데이터 활용을 넘어 데이터 분석을 한다는데 우리도 빨리 해야 하는 것 아닌가라는 조바심이 들지 않나요?
우리는 4차 산업혁명에 참여할 기본적인 준비가 되어 있을까요? 우리의 현실을 잠시 돌아보고 본론에 들어갑니다..
Key Question
1. 찾고자(What) 하는 데이터가 어디(Where)에 있는지 스스로 찾아 활용 혹은 분석할 수 있습니까?
2. 찾은 데이터는 분석/활용 가치가 있을 만큼 정확하게 관리되고 있습니까?
한 가지라도 네! 라고 답했다면 사내에 존재하는 데이터를 활용하여 분석을 시도하는 것은 자원낭비로 끝날 가능성이 매우 큽니다.
다음장에 이어지는 설명은 위 두 가지 핵심 질문에 향후 Yes라고 답을 할 수 있도록 만들기 위해 당장 우리는 무엇을 시작해야 하는지에 설명입니다.
Chapter 1. 도대체 데이터 관리체계가 무엇일까?
지피지기 백전백승!
데이터 관리체계란 개념적인 단어를 눈에 보이는 형태로 보여드리며 설명하겠습니다.
도입사의 구성원도 데이터 관리체계의 실체를 정확히 알아야 성공 가능성이 커집니다.
• 데이터관리체계란 ?
전사에 존재하는 데이터를
고품질 데이터로 유지하여
자산화하기 위한
Framework(관리조직, 정책, 콘텐츠, 솔루션) 입니다.
조금 더 쉽게 말씀드리면,
데이터 활용이란 목적을 달성하기 위한 기반 마련 집합체라고 이해하시면 됩니다.
• 데이터 관리체계의 구성요소는?
첫번째, 관리조직입니다.
데이터 관리체계 자체를 강력하게 운영해나갈 조직이 필요합니다. 흔히 DA라고 합니다.
해당 조직의 책임자는 데이터 관리체계에 대한 깊은 이해와 경험이 필요합니다.
고품질 데이터의 확보와 유지에 가장 중요한 역할을 합니다.
두번째, 정책입니다
정책은 세부규정과 관리항목과 관리방법, 관리, 프로세스 등을 담고 있으며, 사내 데이터 규정의 지위를 갖습니다. 여기서 규정이라 함은 반드시 지켜야 하는 사내규정으로서의 의미를 담고 있습니다.
전략, 정책, 지침, 가이드 등으로 구성됩니다.
세번째, 콘텐츠입니다.
데이터표준(표준사전), 데이터모델, 그리고 표준과 모델에 관한 모든 메타정보를 의미합니다.
네번째, 솔루션입니다.
관리조직과 정책,콘텐츠를 유기적으로 묶어 support 하는 관리솔루션을 의미합니다.
프레임웍을 그림으로 표현하면 이렇습니다.
모든 요소가 처음부터 다 필요한 것은 아닙니다. 도입사의 목표에 따라 필수요소만 일부 도입하고 블록방식으로 향후에 끼워 넣을 수 있습니다.
관리조직은 이렇게 구성합니다.
생각해 볼 문제 : 협의의 관리 조직인“DA조직”은 업무 조직의 산하에 두는 것이 좋을까요? 아니면 IT조직의 산하에 두는 것이 좋을까요?
힌트) 데이터는 기업자산, 회사의 미래를 준비, 비즈니스를 담고 있는 데이터, 전사통제(Governing)
정책은 이렇게 구성됩니다.
콘텐츠(표준)는 이렇게 구성됩니다.
표준이란 구성원 간에 서로 다르게 쓰는 업무용어를 한 개의 언어로 소통하게 하기 위해 비즈니스 표준어 사전을 만드는 것입니다. (일반적인 수준의 비즈니스표준어사전을 만드는 것은 아닙니다)
표준의 하위 구성요소로 표준단어, 표준용어, 표준코드, 표준도메인 등으로 구성됩니다.
- 표준단어 : 용어를 구성하는 최하위 단위의 논리명과 물리명, 설명 등
Example) 제품ID -> 표준 단어는 ‘제품’과 ‘ID’
- 표준용어 : 표준 단어로 구성된 용어의 논리명과 물리명, 설명 등
Example) 제품ID -> ‘제품ID’ 자체가 표준용어
- 표준코드 : 사내 시스템에서 사용하는 코드(개별코드, 공통코드)의 논리명과 물리명, 설명 등
- 표준도메인 : 용어가 사용할 수 있는 접미어 체계의 논리명과 물리명, 설명 등
Example) 제품ID, 사원번호 -> ‘ID’, ‘번호’가 표준도메인
표준은 주제영역명(데이터모델분류체계), 엔터티명(테이블명), 속성명(컬럼명)에 기본적으로 사용되며, 사용처는 상황에 따라 확장 가능합니다. 또한 구축된 표준사전을 가지고 비즈니스 용어 Portal로 활용 가능합니다.
간략한 표준생성의 예
ASIS 용어인 “제품아이디”를 표준화한다면?
1)제품은 표준단어로 인정하고 논리명을 “제품“ , 물리명을 “PRD”로 표준사전에 설명과 함께 등록
2)아이디는 표준단어로 ID로 쓰기로 하고 논리명을 “ID”, 물리명 “ID”로 표준사전에 설명과 함께 등록
만들어진 표준단어 “제품"과“ID”를 조합하여 표준용어인 “제품ID”를 논리명 “제품ID”, 물리명 “PRD_ID”로 등록
콘텐츠(데이터 모델)는 이렇게 구성됩니다.
데이터 모델(데이터 모델링)이란 데이터를 담을 그릇을 메타정보와 함께 담아 설계도를 작성하여 형상화하는 것입니다.
데이터 모델은 하위에 개괄모델(선택), 개념모델(선택), 논리모델(필수), 물리모델(필수)등의 개념이 있습니다.
논리모델의 하위에 엔터티명(표준화된), 엔터티 정의, 속성명(표준화된), 속성 정의, 식별자 등의 관리항목이 있으며 필요에 따라 관리항목은 추가합니다.
물리모델의 하위에 테이블명(표준화된), 컬럼명(표준화된), Data Type 등의 관리항목이 있으며 필요에 따라 관리항목 추가합니다.
* 논리모델 – 한글로 되어 있고, 각 요소에 대한 설명 등의 메타정보가 들어 있어 업무 관계자들의 소통도구와 정보조회의 재료가 됩니다.
* 물리모델 – 논리모델을 데이터베이스에 구현한 형상을 표현한 형태로 SM/SI/DBA등이 주로 활용합니다.
데이터 활용(데이터 분석)에 있어 엔터티명(표준화된), 엔터티 정의, 속성명(표준화된), 속성 정의의 정성/정량적 품질은 매우 매우 중요합니다.
ASIS 모델을 관리하지 않았을 경우 데이터모델 생성과정(모델 현행화)
기존 시스템에서 데이터 모델을 관리하지 않아 데이터 모델을ASIS기반으로 생성해야 하는 경우,
데이터 관리체계에서 정의한 정책대로 현행화하는 과정을 거칩니다. 대략 다음의 절차대로 진행합니다.
1. 리버스 모델 생성
2. 표준화 및 메타정보항목(엔터티명, 엔터티 정의, 속성명, 속성 정의 등등)을 입혀 논리 모델을 생성하고 모델 저장소로 업로드하고 승인을 받습니다.
기반시스템(솔루션)은 이렇게 구성됩니다.
전사데이터체계를 Support 하는 솔루션에 대한 간략한 설명입니다.
전사데이터체계를 운영하는데 있어 필수 솔루션은 아래와 같습니다.
1. Meta : 전사의 데이터표준(표준사전) 및 데이터모델 중앙집합소 및 관리통제용 메타시스템 (Governing Tool)
2. Modeling Tool : Meta와 연동된 데이터 모델링 툴 (Data Model Quality)
3. DQ : 데이터 품질 향상 관리 툴 (Data Quality)
4. DP : 데이터 검색 및 활용 포탈 (Data Portal)
전사데이터체계를 운영하는데 있어 선택적 도입이 가능한 솔루션은 아래와 같습니다.
1. 데이터 구조와 애플리케이션의 상관관계, 모델 변경 app영향도 분석
2. 데이터 흐름 관리(인터페이스 Source/Target 등)
3. 데이터 이행(migration) 관리 툴
Chapter 2. 데이터관리체계 도입은 어떻게 해야 하는 걸까?
데이터관리체계의 필요성을 인식하고 도입하기로 결정하였다면,
과연 데이터관리체계를 어떤 방식으로 도입하는 것이 효과적일까 같이 고민해보겠습니다.
• 빅뱅 VS 점진적인 도입
빅뱅 방식으로 전사데이터관리체계의 모든 요소 도입, 모든 ASIS 시스템을 한 번에 모델 현행화하는 것이 좋을까요?
필수적으로 필요한 전사데이터관리체계 요소부터 선별적으로 도입하고, 필요한 시스템부터 순차적으로 데이터관리체계에 편입시키는 것이 좋을까요?
Answer : 정답은 없습니다. 도입하려는 조직의 상황에 맞추는 것이 답입니다.
다만, 경험에 의하면 데이터관리체계를 빅뱅 방식으로 도입하면
저품질의 데이터관리체계가 될 가능성이 커집니다.
점진적인 도입방안
빅뱅 방식은 모든 데이터관리체계 요소들을 만들고 한방에 오픈하는 것이니 별도로 설명드리지 않겠습니다.
최적의 점진적인 도입방안을 설명드립니다.
- 1단계 : 전사데이터관리체계 중 전사DA(조직) 구성
(정식 담당자 혹은 담당팀이 구성될 때까지 다른 팀이 대행가능)
- 2단계 : 전사데이터관리체계 중 정책 제정
필수적으로 데이터관리체계정책정의서, 데이터표준관리지침, 데이터모델관리지침 정의하고, 상황에 따라
기타 지침 및 가이드 제정
- 3단계 : 전사 표준사전 구축 및 Meta/Modeling Tool 도입
전사데이터관리체계 공표하고 신규 시스템부터 전사데이터관리체계 적용 및 편입
- 4단계 : 데이터 분석 과제에 필요한 혹은 당장 파악이 필요한 시스템부터 ASIS 모델 현행화
DQ도입 및 현행화 된 모델(시스템)부터 DQ관리 시작
- 5단계 : 전사의 미현행화 ASIS 모델현행화(확산, Plug & Play)
- 6단계 : 정책 고도화 및 필수솔루션(Meta/Modeling Tool/DQ) 이외 시스템 선택적 도입 (Plug & Play)
데이터분석이 필요한 영역에 당장 사용가능하도록 표준작업, 모델현행화, 솔루션, 부분적인 정책 제정을 동시에 진행할 수 있으나 향후 정식으로 만들어진 전사데이터관리체계에 따라 기존 작업분이 달라져야 할 필요가 있을 수 있으니,
뼈대(1단계, 2단계, 3단계)는 선진행할 것을 권장합니다.
Chapter 3. 데이터관리체계 비급(祕笈)
자 이제 제일 중요한 장입니다!!
데이터관리정책을 만들고, 솔루션을 구축하고, 담당팀을 배정한다는 자체로 데이터를 기업자산화할 수 있을까요?
타기업 실패사례를 겪지 않는 데이터관리체계 구축과 운영 비급을 보여드립니다.
1st 祕笈
전사데이터관리체계의 도입과 운영을 담당할 책임자는 반드시 전사데이터관리체계에 모든 요소(조직,정책,컨텐츠,솔루션)에 깊은 지식을 가진 가짜 전문가가 아닌 진짜 전문가이여야 합니다.
담당할 책임자라하면 도입사 소속의 데이터관리체계 담당자 혹은 외부에 도입을 맡긴다면 협력사의 PM입니다.
데이터관리체계의 모든 요소를 암기한 정도, 일부분을 경험해 본 정도로는 곤란합니다.
반드시 모든 요소에 대한 깊은 이해와 통찰이 필요합니다.
데이터관리체계는 매우 방대하고 넓은 주제이며, 요소간 매우 유기적으로 돌아가야 하는 체계입니다.
데이터관리정책, 데이터표준, 데이터모델링, 데이터품질(DQ) 등의 한 분야라도 깊은 통찰력을 가지지 못했다면,
수많은 사람과 비용을 투자한 데이터관리체계는 자칫 “빚좋은개살구”가 될 수 있습니다.
데이터관리체계는 미래를 준비할 주춧돌이며 뼈대입니다. 진짜 전문가를 임명하는 것이 가장 중요한 성공의 핵심요소입니다
2nd 祕笈
품질이 좋은 데이터관리체계를 구축/운영해야 품질이 좋은 데이터를 확보할 수 있습니다.
고품질의 데이터를 확보하기 위해 데이터관리체계 자체의 구축/운영품질도 매우 중요합니다.
컨텐츠(표준,모델등)을 만드는 툴이 사용하기 쉽지 않고,
게다가 컨텐츠는 어디에서 어떻게 만들어 승인받는지 체계적인 안내도 없고,
그리고 힘들게 만들어 놓은 컨텐츠를 조회활용하기 쉽지 않다면 성공할 수 있을까요?
데이터관리체계 도입해서 운영하고 있다는 것 만으로 품질을 확보할 수 없습니다.
흔히들 도입한 기업에서 착각하는 부분이 이 부분입니다.
데이터관리체계 자체의 품질이 받쳐주지 않으면 사상누각! 얼마 지나지 않아 무너져 내리게 됩니다.
메타정보의 정량적인 품질도 중요하지만, 정성적인 품질은 더욱 중요합니다.
한글로 정량적인 수준에 맞춰 작성하는 아닌, 사람이 읽고 이해할 수 있는 수준의 정보 획득에 더 치중을 두어야 한다는 의미입니다.
데이터관리체계가 도입된다는 것 자체로 품질을 확보해주지는 않습니다. 품질이 좋은 데이터관리체계가 도입되야 합니다.
3rd 祕笈
사후관리(Monitoring) 및 품질평가는 상시적으로 이뤄져야합니다.
컨텐츠(표준,데이터모델)에 대한 사후관리 모니터링 후 품질기준에 맞는지 상시적으로 모니터링하고 품질기준에 부합하지 못한 컨텐츠는 수정이 이뤄져야합니다.
사람이 채워넣는 부분이라, 적절한 사후관리가 없다면 컨텐츠 품질은 지속적으로 하락하게 됩니다.
한번 채워넣은 컨텐츠는 끝이라 생각하면 안됩니다.
정보시스템은 항상 변화되고 움직입니다.
데이터 활용수준에 대한 모니터링도 중요합니다.
제공자(생산자)관점의 품질모니터링은 필수, 활용자(소비자) 관점의 활용모니터링은 선택사항입니다.
4th 祕笈
데이터관리체계는 예외허용 없는 강력한 통제절차가 필요합니다.
지켜도 그만, 안 지켜도 그만인 권고형태로는 데이터관리체계의 목표인 고품질데이터를 얻을 수 없습니다.
필수 의무사항인 정책은 반드시 지켜져야 하며, 가능한 솔루션을 통해 의무사항을 지키도록 프로세스를 만들어야 합니다.
빠져나갈 구멍이 존재하고, 예외를 허용한 권고수준의 느슨한 통제는 데이터관리체계에 치명적입니다.
해당 기업의 문화에 맞게 적절한 수준과 통제단계를 만들어 나가는 것도 중요합니다.
통제의 강도는 데이터품질을 저해하지 않는 수준에서 조직의 상황에 맞게 타협 가능합니다.
당근(성과평가 등)과 채찍(제제 등)의 절묘한 조화도 필요합니다.
우리 회사 모든 구성원의 미래성장과 생존이 달린 문제라면 양보할 수 없습니다.
변화의 저항이 거세다면, 최고경영층의 지원을 받아 혁명적이고 강력한 통제를 실행해야 할 수 있습니다.
잔다르크가 필요할 수도 있습니다.
5th 祕笈
처음부터 모든 것을 완벽하게 도입사에 최적화된 데이터관리체계를 만들려고 하기 보다는,
뼈대는 완벽하게 살은 일반적인 수준으로 도입하고 지속적인 관심과 변화로 최적에 맞게 조정해 나가야합니다.
물론, 최선은 모든 것이 처음부터 변경이 별로 없을 만큼의 수준이 베스트입니다.
그러나, 처음부터 완벽하게 우리 조직에 맞는 데이터관리체계를 만든다고 생각하면 매우 큰 스트레스입니다.
그렇게 하려면 도입과정의 시간과 비용도 만만치 않게 들어갑니다.
뼈대는 완벽하게 세우고, 나중에 변경되어도 문제가 없는 것은 일반적인 수준의 데이터관리체계로 시작하십시요.
점차적으로 우리 조직에 맞는 데이터관리체계로 끊임없이 살을 붙이고 덜어내는 변화 전략을 구사하십시요.
'IT' 카테고리의 다른 글
파워포인트(MS Office, PPT) 디자인 아이디어 : 살짝 인공지능 (0) | 2021.05.13 |
---|---|
데이터 표준화! 그렇게 중요한가요? (feat.맹목적인 데이터 표준화) (0) | 2021.05.08 |
Data driven 행정 (데이터기반행정법) (0) | 2021.05.04 |
ODS(Operation Data Store)가 필요한 4가지 이유 (0) | 2021.05.03 |
[DBeaver] Sql 조회 결과 부울리언(boolean) 표시 형식 변경 - 디비버 21 버전 (0) | 2021.04.30 |