All thing of the world!

ODS(Operation Data Store)가 필요한 4가지 이유 본문

IT

ODS(Operation Data Store)가 필요한 4가지 이유

WorldSeeker 2021. 5. 3. 18:00

데이터웨어하우스(이하, DW)를 공부하거나 실무를 하다 보면 꼭 알아야 하는 ODS란 단어를 만나게 됩니다.

이게 무엇이고 필요한 이유는 무엇인지 간단하고 쉽게 알려드립니다.

 

ODS란 무엇인가요?

 

ODS란 Operation Data Store의 약자로 운영 데이터를 저장하는 곳입니다. 

그럼 운영계를 이야기하는건가요? 아닙니다. 

운영계에 존재하는 데이터가 아니라 DW(Data Ware house)를 위해 운영 데이터를 시계열 데이터등으로 가공 변환하여 추출/적재해 놓은 별도로 저장한 공간을 말합니다. 

간단히 얘기하면 DW가 맘대로 활용할 수 있는 운영계 데이터 입니다.

 

 

DW에서 ODS가 필요한 이유는 무엇인가요? 

 

첫번째, DW를 위한 데이터를 만들기 위해 많은 가공이 필요합니다. 

이러한 가공을 운영이 되고 있는 시스템에서 바로 수행하면, 운영시스템에 과부하를 발생시켜 서비스를 제대로 할 수 없는 사태가 일어날 수 있습니다. 사고는 아니더라도 상당히 느려지는건 다반사이겠죠?

 

두번째, 운영계는 이력데이터보다는 최종 데이터 형상으로 데이터를 관리하는 경우가 많습니다. 

그러나 DW에서는 시계열데이터가 필요합니다. 

그래서 운영계에서 ODS로 적재할 때 시계열로 변환하여 적재합니다. 

 

세번째, 시간이 지남에 따라 새로운 분석이 필요합니다. 

그 때 마다 운영데이터에서 추출해 낼 수는 없습니다. 이 역시 운영계에 너무 많은 과부하를 유발합니다. 

 

네번째, 만약 Fact 테이블 등에 문제가 발생하여 복구를 해야할 경우가 있습니다. 

이 역시 운영계를 이용하여 복구한다면 대단히 큰 부하를 발생시킵니다. 

 

맺음말 

많은 분들이 DW에 존재하는 ODS가 운영계 데이터를 그냥 가져다 복사해 놓는 정도의 가벼운 개념으로만 알고 있습다만, DW에서는 매우 중요한 영역 입니다. 

 

또한, 차세대 등의 신규 프로젝트에서 AS-IS 데이터를 신규 시스템으로 이행(migration)시에도 사용합니다.

위와 비슷한 이유로요. 

 

이행시에는 한가지 더 중요한 이유가 추가됩니다. 

이행데이터의 검증에 필요한 source 데이터가 필요하기 때문이죠. 

운영계 데이터는 시시각각 변하기 때문에 TO-BE로 이행된 데이터의 검증용도로 사용할 수 없기 때문이죠. 

 

이상으로, ODS의 구체적인 존재 이유에 대해 알아보았습니다.

 

Comments