메뉴보기

[이재관의 데이터 품질 톺아보기] 데이터 품질 차원 정의하기

발행일자 | 2018.12.27 08:55
[이재관의 데이터 품질 톺아보기] 데이터 품질 차원 정의하기

품질 좋은 제품이나 서비스를 통해 고객 욕구를 만족시켜 대가를 지불 받아 지속적으로 발전하며 성장해 나가려는 노력은 모든 기업의 사명이며 임무이다. 고객이 만족할 수 있는 품질 높은 제품과 서비스는 고객의 기대치(expectation)에 부응하기 이전에 제품으로써 완전성을 보장해야 한다. 제품의 품질은 제품을 만드는데 소요되는 원료나 재료, 즉 인풋의 품질이 절대적으로 영향 요소이고 재공품을 만드는 설비나 장치, 제조과정에 의해 결정된다.

제품과 서비스를 제조하는 다양한 프로세스(시작과 끝이 있는 단위 활동)를 거치며 생산된 프로덕트 (제조공정 상의 재공품)에 대한 품질은 다양한 영향 요소에 의해 결정된다. 그래서 각 영향 요소를 관리해 품질 높은 제품과 서비스를 얻을 수 있다. 프로덕트 품질에 대한 영향 요소를 개념적으로 범주(Category)를 정의하고 품질에 대한 양상과 특징을 정리하여 기준으로 삼는다.

기업의 비즈니스 활동 결과인 데이터는 비즈니스 활동 결과에 대한 품질을 나타내고 데이터 자체로서 품질을 보증해야 한다. 데이터 품질에 대한 영향 요소를 범주로 정의하여 양상과 특징을 정리해 놓은 기준을 데이터 품질 차원(Data Quality Dimension)이라 한다. 데이터 품질 차원은 1990년대초 MIT에서 ‘전 데이터 품질 매니지먼트’ 프로그램을 이끈 Richard Wang 교수에 의해 구체적으로 정립하여 많은 데이터 & 정보 품질 컨설턴트들에 의해 널리 보급되었다.



데이터 품질 차원은 정확성(Accuracy), 완전성(Completeness), 적합성(Validity/Conformity), 일관성(Consistency), 적시성(Timeliness), 유일성(Uniqueness) 6개 차원으로 구성하여 기업 정보시스템 데이터베이스내의 데이터를 중심으로 측정하고 평가하였다. 많은 기업들이 지적 자산인 데이터 가치에 관심을 가지고 데이터 품질 프로젝트를 추진하며 데이터 품질 차원 또한 변화하였다. Danette McGilvray는 2008년에 출간한 데이터 품질 프로젝트 수행을 위한 지침서(Executing Data Quality Projects: TEN STEPS to Quality Data and Trusted Information)에서 12 개 차원으로 정의했다.

[이재관의 데이터 품질 톺아보기] 데이터 품질 차원 정의하기

데이터 품질 차원은 6개 차원을 기본으로 직관성, 관련성 및 신뢰성(Perception, Relevance and Trust)을 비롯하여 사용의 용이성 및 유지보수성(Ease of Use and Maintainability)과 같이 정보시스템 데이터베이스내의 데이터에 대한 결함을 제거하고 무결성을 높이는 품질에서 인간이 인식하고 이해하는 수준 정도를 평가하는 범주로 확장되고 있다. 기업의 제품과 서비스 품질에 결함이 없는 완전성과 안전성 측면을 넘어서 고객의 기대치에 초점이 맞추어지고 있는 맥락과 같다.

현재와 같이 데이터 형태가 다양해지는 빅 데이터 시대에는 데이터 품질 차원이 더 많이 확장될 가망성이 높다. 구조적(Structured) 데이터에 대한 품질 차원은 단순하여 지속적 관리가 용이하고 데이터 품질 결함에 대한 정화(Cleansing)하지만, 반구조적(Semi-structured) 데이터와 비구조적(Unstructured) 데이터 품질 차원은 의미적(Semantic)이고 본체인식적(Ontological) 범주로 확장될 것이다. 텍스트나 스트리밍 데이터와 같은 비구조적 데이터에 대한 품질 차원은 산업 도메인에 따라 의미적이고 본체인식적인 차원으로 세분화하여 확장될 것이다.

4차 산업혁명 시대의 도래는 기업이 고객 욕구에 대한 기대치가 더욱 세분화되어 고객 한 개인의 기대치를 만족시켜 나가야하는 임무를 가지게 된다. 기업은 한 개인을 위한 제품과 서비스를 생산하는 조합된 프로세스를 수행해야 하고 수행 결과인 프로덕트도 개인을 지향하는 만큼 품질 차원도 고객 기대치를 평가할 수 있는 범주가 형성되어야 한다. 빅 데이터 시대의 데이터 품질 차원은 4차 산업혁명 시대의 제품과 서비스 품질 차원과 일맥상통한다.

 4차 산업혁명 시대에 적응하는 기업은 이제 데이터 정확성과 무결성을 따지는 품질 차원을 넘어서 고객 욕구에 대한 기대치가 가지는 의미와 눈높이에 맞추는 품질 차원으로 확장하여 엔터프라이즈 지식으로 전이해야만 한다.   

이재관 objectjk@gmail.com 필자는 30년전, 중소기업 전산화를 위해 프로그래머로부터 출발하여 광양제철소 생산공정 진행을 위한 데이터베이스의 데이터 정합성을 관리하며 데이터 품질 분야에 첫 발을 내디뎠다. 제임스 마틴 박사의 정보공학방법론에 매료되어 기업과 정부기관의 정보전략기획 및 정보시스템 구축 프로젝트를 위한 컨설팅을 수행하였다. 최근 2년전에 DAMA International의 Korea Chapter를 설립하여 엔터프라이즈 데이터 매니지먼트(eDM) 프레임워크를 연구하며 세계의 데이터 매니지먼트 그룹들과의 연계와 지식을 보급하는 활동을 전개해 나가고 있다.

 

칼럼

주요뉴스

많이 본 기사

실시간 기사

맨위로