송상효 성균관대 소프트웨어대학 교수
송상효 성균관대 소프트웨어대학 교수

2020년 1월 9일에 국회가 본회의를 열고 데이터 3법(개인정보 보호법, 정보통신망법, 신용정보법 개정안)을 가결했다. 데이터 3법의 개인정보보호법 개정안은 가명정보데이터를 서비스 개발에 활용하는 내용과 개인정보 관리/감독을 개인정보 보호위로 일원화 하는 내용이다. 신용정보법 개정안은 가명정보 금융분야 빅데이터 분석에 이용할 수 있게 하고, 가명정보 주체의 동의 없이도 활용을 허용하는 내용이다. 마지막으로 정보통신망법 개정안은 온라인상 개인정보 감독기능을 개인정보보호위로 이관하는 내용이 포함되었다.

데이터 3법의 통과가 산업에 미치는 영향은 적지 않다. 개인정보가 포함된 다양한 데이터를 비식별화(개인을 알아볼 수 없게 하는 안전한 기술적 처리)를 통해서 활용할 수 있는 근거를 제공하며 이를 통해서 분석에 활용하지 못한 개인정보가 포함된 데이터의 분석을 통한 산업이 활성화 될 수 있도록 된 것이다.

데이터 3법이 통과되기 전에는 데이터 가공을 통한 거래가 힘들었으며, 신용평가의 활용이 어려웠고, 금융상품을 만들기 위해 다양한 데이터 활용이 제한적이였으며, 다양한 산업간의 데이터를 융합하기도 힘들었다. 그로 인해 글로벌로 데이터 분석을 통한 신산업의 출현이 되는 상황에서 한국에서 제한적인 데이터 이용으로 한계에 이르고 있었던 현실을 이제는 벗어 날 수 있게 된 것이다.

◇ 데이터의 오픈과 활용
데이터는 다양한 곳에서 만들어지고 저장되고 있다. 그러나 사용되지 않는 데이터는 저장 공간만 차지하고 한정적으로 사용 됨으로써 가치가 높지 않았다. 데이터는 원유와 같아서 정제하여 사용하지 않으면 그저 검은 물질과 같은 것처럼 잘 정제하여 보관하고 다양한 다른 데이터와 융합을 통해서 정보로 만들어 지고 활용되어야 한다. 그래서 4차 산업혁명에서 데이터는 원유와 같은 존재이고 기존 산업을 변화시키고 새로운 산업을 만드는 기반이 되고 있다.

데이터는 만들어 지지만 저장되어 활용되지 못하는 경우도 많았고, 일부는 문서로 만들어 저장되어 활용됐다. 컴퓨터가 만들어 지고 활용된 이후에 기업과 정부는 사람들이 하는 일을 통해 만들어지는 데이터들을 저장하고 활용하여 업무를 처리하였다. 그리고 저장된 데이터를 분석하여 의사결정에 활용하고 있다. 그러나 대부분의 정보는 사람이 입력하고 활용하는 것이어서 데이터 종류도 한정적이고 정형화된 것을 위주로 저장되고 분석되었다.

그 이후 구글과 네이버 등 인터넷을 통한 검색 서비스를 기반으로 많은 다양하고 비정형적인 데이터들이 만들어지고 분석되고 활용이 되기 시작하였으며, 인터넷 서비스 기업들은 이렇게 만들어지고 저장된 데이터를 분석하고 활용할 수 있는 기술들을 오픈하여 활용도를 높이는 방법을 제시 하였다. 데이터도 오픈 되었고 분석하는 소프트웨어와 방법도 오픈 되면서 기업과 정부에서 저장하고 분석된 한정적인 데이터의 저장과 분석의 한계를 벗어나 빅데이터를 분석하고 활용하게 되면서 세상의 많은 현상들을 분석하고 활용할 수 있는 세상이 열리게 된 것이다.

이제는 관심을 가지지 않았던 다양하고 많은 종류의 데이터들이 저장되고 분석되어 정보가 되어가고 있으며 이를 통해서 다양한 지식이 만들어 지고 있다. 인공지능 기술이 상상에서 현실이 되어 가고 있으며 이를 통해 새로운 세상이 만들어 지고 있는 것이다.

데이터는 오픈 되고 활용되어야 하며 그 정보는 사람을 위해 쓰여져야 하고, 이런 일들이 새로운 산업을 만들고 확대 될 것이다.

◇ 데이터(Data) → 정보(Information) → 지식(Knowledge) → 지혜(Wisdom)
현재의 데이터는 디지털화 된 것을 의미 하고, 사람뿐 아니라 기계도 읽고 활용할 수 있는 것 이여야 한다. 이전의 데이터들은 사람이 이해할 수 있도록 수치와 문자로 정리되었고 문서화 되어서 활용 되었다. 그러나 이렇게 정리된 데이터는 전문가들만이 활용하고 분석할 수 있었기 때문에 한정적이었고 큰 데이터들은 모으고 활용하는 것이 불가능 했다.

현재의 데이터들은 컴퓨터에 저장되고 분류되고 의미를 포함하는 데이터가 되었으며 이를 통해서 사람뿐 아니라 기계도 활용할 수 있도록 되어 인공지능을 만들고 훈련 시킬 수 있는 원료가 된 것이다. 데이터는 가공하기 전에 관찰하거나 측정을 통해서 수집된 재료들이다. 예를 들어 기상데이터는 “풍속 3m/s, 풍향은 동남쪽, 습도는 71%” 와 같은 것 들이다. 이런 데이터를 정제하고 가공하여 만들어 낸 결과물이 정보이다.

정보에 대한 예로는 기상데이터로 만들어지는 “비가 올 확률은 72%” 인 것이다. 그리고 정보를 이용한 경험(Knowhow)을 지식(Knowledge)이라고 하며 “비올 확률이 70% 이상이면 우산을 가지고 다니는 것이 좋음” 같은 것이다. 마지막으로 지혜는 지식들을 통해서 만들어진 예측이고, 이를 통해서 현상을 기반으로 미래를 준비하는 것이다.

최근 인공지능이 현실화 되고 미래를 변화 시키는 핵심이 되어가고 있다. 인공지능은 데이터를 기반으로 정보를 만들고 지식을 정리하여 지혜를 알려주는 단계를 사람이 아닌 컴퓨터(기계)가 대신 하도록 하는 기술이다.

인공지능은 한가지 일에는 인간보다 더 좋은 능력을 보일 수 있으나 인간처럼 다양한 상황에 데이터들을 익히고 정리하여 상황에 맞게 대응하는 정도로 발전 하려면 아직도 시간이 필요하다. 그리고 인공지능 기술이 발전하더라도 인간을 위한 곳에 사용될 것이다. 인공지능도 데이터를 모으고 정제하여 사용하는 것부터 시작된다. 데이터를 다루는 기술을 기반으로 데이터 처리와 인공지능 기술은 오픈 되고 점차 발전되어 갈 것이므로 이를 주도하는 일을 한국에서도 적극적으로 참여하고 주도해야 할 것이다.

◇ 데이터를 기반으로 한 미래의 준비
데이터는 이제 소프트웨어와 결합되어 다양하게 활용이 되고 있다. 예전에는 데이터 자체 만으로도 활용하는 것이 대부분이었으나 데이터를 분석하고 활용하여 정보로 만들고 지식으로 변환되는 과정을 소프트웨어와 융합이 되면서 인공지능이라는 기술로 현실화 되어 가고 있다.

데이터는 사람과 사물 그리고 자연이 움직이고 변화하는 모든 상황에서 만들어지고 있다. 특히, 기존의 자연에서 만들어지는 데이터도 많지만, 인간이 만들어내고 사용하고 있는 다양한 사물들이 인터넷과 결합되면서 폭발적으로 많은 데이터들을 만들어 내고 있으며, 이를 관찰하고 통제하고 운영하기 위해서 많은 데이터들을 모으고 분석해야 하는 시대에 와 있다.

미래는 데이터를 어떻게 활용할 것인가에 달려 있다고 해도 무리는 아니다. 미래를 위한 준비로 데이터와 소프트웨어를 오픈 하고 활용하는 국가, 정부, 기업 그리고 국민이 되어서 미래를 주도할 수 있도록 하는 다양한 일들이 진행되기를 바란다..

송상효 교수 shsong07@hanmail.net
성균관대학교 산학중점교수이자 전자정부표준프레임워크(e-GovFrame)와 클라우드플램폼서비스(PaaS-TA)커뮤니티를 운영하는 오픈플랫폼개발자커뮤니티(OPDC) 이사장이다. 오픈소스SW 전문가로 정부 및 기업의 자문 활동 중이다. 한국공개소프트웨어 협회 회장으로 4년 동안 재임하는 동안 국내의 오픈소스SW 활성화를 위해 노력하였고, 글로벌 오픈소스 커뮤니티(리눅스파운데이션, 오픈스텍파운데이션, 클라우드파운드리파운데이션 등)과도 지속적인 협력을 통해 국내 기업과 커뮤니티가 협력할 수 있는 기반을 만들고 있다. 또한 국내에서 오픈소스를 기반으로 하는 사업과 자문을 통해서 소프트웨어 산업의 변화와 혁신을 함께 하였으며, 이를 통해 정부와 기업 그리고 개발자들이 성장할 수 있도록 공유하는 기회가 많아지면 좋겠다.

저작권자 © 넥스트데일리 무단전재 및 재배포 금지