일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
- 가장 인기있는 파이썬 패키지
- 가장 많이 사용되는 파이썬 패키지
- Python
- 2룸 오피스텔 투자
- 소형주택 세액감면
- 라이브러리 vs 패키지
- bard 100% 신뢰금지
- 가장 많이 사용되는 파이썬 라이브러리
- PostgreSQL
- 전세보증보험
- 오라클 데이터베이스 내장함수
- 종합소득세
- 나는 어디로?
- 종합과세
- 임대소득외 추가소득이 있을 경우
- chatgpt vs bard
- 오피스텔투자
- Google vs MicorSoft
- 상업시설용지 분양
- 가장 인기있는 파이썬 라이브러리
- 파이썬 TypeError
- 데이터 리터러시
- 다주택임대
- 주택임대사업자
- Google vs OpenAI
- robux
- 갤럭시탭 with Pen
- 주상복합용지 분양
- chatgpt 100% 신뢰금지
- 공개서적
All thing of the world!
데이터 표준화! 그렇게 중요한가요? (feat.맹목적인 데이터 표준화) 본문
데이터 표준화가 그렇게 중요한가요?
데이터 표준화 중요합니다. 하면 좋습니다. 잇점이 분명 존재합니다.
* 데이터 표준화란 엔터티명/속성명을 논리 표준에 맞게, 테이블명/컬럼명을 물리 표준에 맞게 설정하는 것을 뜻합니다. 데이터 값값 자체를 표준하는게 아닙니다. 메타 정보를 표준화하여 관리하는 것이죠.
그러나 이젠 데이터관리체계에서의 데이터 표준화의 필요성과 어느 정도의 중요도를 주고 관리할 것인가에 대해 다시 한번 돌아봐야 할 때입니다.
맹목적으로 구축하는 데이터 표준화
전사 데이터관리체계안에서 콘텐츠를 이루는 부분 중에 하나라서,
(전사)데이터관리체계를 도입하는 기업은 100% 데이터 표준을 관리하고 있습니다.
현재 (전사)데이터관리체계를 도입해서 데이터 표준화를 적용하고 있는 조직에 묻겠습니다.
데이터 표준화를 관리해서 얻는 잇점이 무엇인가요?
얻는 잇점이 들어가는 비용을 상쇄할 만큼의 효율을 거두셨습니까?
표준관리시스템이 기능이 받쳐주질 못하거나, 조직의 문화상 받쳐주질 못하고 있는 것을 다 포함해서요.
표준화에 대한 투자 대비 어느 정도의 효과를 보고 계신지요?
데이터관리체계의 한 부분에 표준화 관리가 포함되어 있다고 무조건 적용해서 관리하고 있지는 않은지요?
컨설팅사 혹은 솔루션사에서 표준화 관리가 필요하다니까 혹시 아무생각 없이 받아들이신 건 아닌가요?
우리 조직에 필요한 데이터 표준을 관리하고 계신지요?
네 관리하면 좋습니다. 관리하면 좋은 점이 많이 있습니다.
그러나 투자대비 효율을 따져보지 않을 수 없습니다.
더군다나 개발 라이프사이클은 점점 더 빠른 사이클로 바뀌어 가고 있습니다.
개발 입장에서는 표준화 관리는 그저 불편한 존재일 뿐입니다.
개발에 불편하더라도 표준을 관리해야 하는 목적이 명확하고 효과가 있어야 개발조직의 협조를 이끌어 낼 수 있겠죠.
데이터 표준화에 투여되는 비용
데이터 표준화에 투여되는 비용을 한번 따져보겠습니다.
1. 데이터관리체계 도입시 표준사전, 표준도메인 조사 및 생성비용
기업내에 존재하는 문서, 데이터베이스 등에 존재하는 단어를 모두 취합하고 중복, 유사단어 등을 정리하여 표준사전을 만들고 표준도메인을 생성하는 비용이 발생합니다. 일회성으로 발생하는 비용이니 그럭저럭 투자할 만 합니다.
2. 데이터모델 현행화시 엔터티명/속성명 표준화
엔터티/속성명을 표준단어와 표준용어로 입히는 데 발생하는 비용 (데이터 파악, 표준검색, 표준신청, 표준승인대기, 모델에 표준 입히는 작업)
3. 데이터관리체계 운영단계에서의 신규 엔터티명/속성명 표준화
모델러가 신규 테이블을 설계하기 위해 표준화하는 비용 (표준검색, 표준신청, 표준승인대기, 모델에 표준 입히는 작업)
4. 그외 정량적으로 따지 힘든 투자 비용
데이터표준 때문에 발생하는 비용은 이 이외에도 적기 힘든 부분도 많습니다.
가령 예를 들어, 표준승인자가 신청한 건을 승인할 지 여부를 고민하는 시간, 표준신청한 내용에 대한 협의시간 등등 측정하기 어려우나 시간이 많이 들어가는 부분도 많습니다.
정량화하기 쉬운 부분에 대한 집착
데이터관리체계는 주관적인 면이 상당히 강합니다.
정량화하여 성과를 측정하기가 참 어려운 부분이 많이 존재하는 분야죠.
하지만 데이터모델 표준화율은 측정하기 참 좋습니다.
얼마나 표준화를 했느냐 안했느냐는 지표로 삼기 딱 좋지요.
그래서 표준화율을 품질 지표로 삼는 곳이 많습니다.
솔루션 제작사나 컨설팅사 입장에서도 측정하기 좋으니까 기본 측정항목으로 삼습니다.
그러나 과연 데이터 모델의 표준화 적용율이 그렇게 중요한 지표인가요?
그냥 평범한 한가지의 정량적인 지표일 뿐입니다.
그나마 그렇게 많은 투자비용을 들여 관리하는 표준사전의 품질과 표준화 적용 품질은 좋다고 자신 할 수 있나요?
단지 표준화를 했냐 안했냐는 중요하지 않습니다.
측정하기 쉬우니까 표준화율과 표준화 관리에 집착하는 건 아닌지 한번 돌아볼 필요가 있습니다.
이런 방향으로 나아가야 합니다.
결론입니다.
제가 이 글을 통해 지적하는 싶은 문제점은 이겁니다.
정작 데이터관리체계의 왜 도입했는지, 왜 운영하고 있는지 당초 목적은 제쳐두고,
혹시 기계적으로 표준화 여부만 관리하고 계시지는 않으신지요?
표준화 여부만 관리하고, 정작 중요한 엔터티 정의나 속성 정의에 어떤 데이터가 들어 있는지 잘 설명하고 있는지 "정의 품질"은 잘 관리하고 있는지요?
또한 표준단어, 표준용어, 표준도메인의 표준설명 품질은 잘 관리하고 있는지요?
표준코드의 코드 인스턴스는 잘 관리되고 있는지요?
표준용어한 사용한 그 곳의 데이터 집합을 잘 대변하고 있는지요?
데이터 관리체계 도입 목적인 전 직원의 데이터 활용 및 분석이라는 최종 목표에 부합할 수 있도록 겉으로 보이는 면보다는 측정하기 어렵고 잘 드러나지 않는 정성적인 품질에 더 많은 신경을 써야 할 것입니다.
당장 눈에 보이는 실적에만 연연해하지 말고 내실(잘 보이지 않는 정성적인 품질)을 들여다보는 지혜를 갖추어야 겠습니다.
표준화 관리 비용이 지나치게 높고, 효과도 미비하고, 아직 조직의 기술수준이 표준을 잘 관리할 환경이 되지 않는다면,
차라리 과감히 표준화 관리 비중을 과감히 낮추고 데이터관리체계의 진정한 목표에 더 집중할 필요가 있습니다.
눈에 보이는 실적이 낮아 데이터관리체계를 이끌어가는 여러분이나 소속팀에 당장의 성과로 돌아가지 않더라도 실망하지 마십시요. 데이터 리터러시(data literacy)가 점점 더 화두가 되고, 주목 받고 있습니다.
정성적인 품질에 그 동안 더 많은 정성을 들여온 여러분에게 그 공이 돌아가게 될 날이 멀지 않았습니다.
'IT' 카테고리의 다른 글
2030~2050년 IT/로봇분야 미래 유망 직업 8가지 (0) | 2021.06.10 |
---|---|
파워포인트(MS Office, PPT) 디자인 아이디어 : 살짝 인공지능 (0) | 2021.05.13 |
Data-Driven Decision 업무 환경 조성을 위한 데이터관리체계(Data Governance) 도입 전략 (1) | 2021.05.06 |
Data driven 행정 (데이터기반행정법) (0) | 2021.05.04 |
ODS(Operation Data Store)가 필요한 4가지 이유 (0) | 2021.05.03 |