"데이터 강국 되려면 R&D부터 바꿔야"

[전문가 좌담회] "전문인력 가르칠 선생님 먼저 양성해야"

컴퓨팅입력 :2018/06/28 16:10    수정: 2018/07/01 20:13

"데이터는 소프트웨어(SW)와 다르다. 연구개발(R&D)부터 확 바꿔야 한다. 처음부터 연구개발과 비즈니스를 함께하는 R&DB가 필요하다"

"데이터 전문가를 가르칠 선생님이 태부족하다. 먼저 이들 선생님을 가르칠 '선생님의 선생님'을 양성해야 한다. 데이터 전문대학원도 신설해야 한다"

"'마이데이터'와 '데이터 안심존'제 시행에 큰 기대가 된다. '마이데이터'제는 가능하면 법제화까지 검토해줬으면 좋겠다"

"데이터를 안전하게 쓰는 것과 잘 쓰는 것, 소위 보안과 활용은 양립이 가능하다. 대체 성격이 아니다. 데이터 보안 관련 대폭의 규제 완화가 필요하다"

"우리나라는 데이터강국 코리아가 될 잠재력이 무궁하다. 정책을 정교하게 짜야하고, 민관이 협력해야 한다"

정부가 26일 데이터산업발전 전략을 발표한 것과 관련, 지디넷코리아가 27일 긴급 개최한 '데이터 강국 코리아' 달성을 위한 산학연관 전문가 좌담회에서 다양한 의견이 쏟아졌다. 참석자들은 우리나라가 데이터 강국 코리아가 될 잠재력이 높다면서 정보를 활용하는 것과 보호하는 것, 두 가지 모두 중요하다면서 앞으로 정책을 디테일하게 추진해야 한다고 주문했다. 좌담회는 한국데이터진흥원에서 열렸다.

◆참석자

-이재형 과학기술정보통신부 융합신산업과장

-이정현 한국데이터진흥원 기술품질 실장

-이원석 연세대학교 컴퓨터과학과 교수(한국빅데이터포럼 운영위원장, 전 공공데이터전략위원회 빅데이터전문위원장)

-김인현 한국공간정보통신(GIS SW기업) 대표

-이현종 빅스터(빅데이터 전문기업) 대표

-사회:방은주 지디넷코리아 솔루션팀장, 정리:황정빈 지디넷코리아 기자

=데이터가 모든 산업의 발전과 새로운 가치 창출의 촉매 역할을 하고 있다. 데이터 패권시대, 데이터기술(DT) 시대가 어색하지 않은 '데이터 경제(Data Economy)'로 경제 패러다임이 전환하고 있다. 새로운 물결로 떠오른 4차산업혁명시대 역시 데이터를 빼놓고 말할 수 없다. 정부가 데이터산업 활성화 전략을 발표한 이유 일 것이다. 먼저 이번 전략이 나오게 된 배경을 말해달라

▲이재형 과기정통부 과장=4차산업혁명은 초연결 지능화 시대다. 이를 구현하려면 인프라가 필요하고, 과기정통부는 이를 DNA(Data-Network-AI)라 명명했다. DNA중 작년 12월 N(Network)에 해당하는 초연결 지능형 네트워크 구축 방안을 발표했고,

지난 5월 인공지능(AI)전략을, 그리고 이번에 마지막으로 데이터 전략을 마련하면서 DNA 종합 대책이 완성됐다.

작년 하반기부터 여러 부처가 합동해 의견을 수렴했고, DNA 대책이 나오기까지 시간이 1년 정도 걸렸다.

4차산업혁명의 가장 큰 걸림돌 중 하나가 미흡한 법 제도와 양질의 데이터 부족이다. 이번 데이터 전략은 현재 데이터 산업의 국내 현주소를 살펴보고, 데이터를 산업쪽으로 어떻게 활용할 수 있을 지에 초점을 뒀다. 4차 산업혁명에 대응하는 대책을 마련했다는 점에서 의미가 있다. 추진 전략은 크게 3가지다. 개인정보 보호와 활용이 조화를 이루게 제도적 부분을 정비하는 것과 수집부터 분석, 활용에 이르는 데이터 전반의 가치사슬을 혁신하는 것, 그리고 데이터 산업 기반이 되는 기술과 인력, 기업을 발전시키는 것이다.

▲이정현 한국데이터진흥원 실장=많은 데이터가 기존에 있고, 데이터가 중요하다는 생각도 모두가 하고 있다. 앞서나가는 글로벌 기업, 선진국을 보면 모두 데이터를 잘 활용한다. 과거 정부에서 IT 혁신정책을 국가 성장 동력으로 삼았다면, 이제는 DNA(Data-Network-AI) 중에서도 데이터를 기반으로 하는 가치 창출을 통해 국가 경쟁력을 갖추자는게 이번 데이터산업 발전 전략의

의미다.

이재형 과학기술정보통신부 융합신산업과장.

=기업과 학교 입장에서 이번 정부 발표안 중 가장 인상적인 것은 무엇이였나. 또 많은 대책 중 이것 하나만은 꼭 실현 해줬으면 하는 것이 있다면 무엇인가.

▲이현종 빅스터 대표='마이데이터(MyData)'다. 다른 안들은 기존의 것들과 연관된 것이 많았다. 빅데이터는 결국 기업들이 돈을 벌기위해 이용하는 거다. 하지만 한국에서 빅데이터 이용 사업이 잘 되지 않은 이유는 개인 정보가 투명하게 유통되는 환경이 만들어지지 않았기 때문이다. 마이데이터를 통해 개인 정보가 투명하게 유통되고 활용되면, 정보주체는 그에 따른 보상 체계를 얻을 수 있다. 비즈니스 주체들이 다양한 보상체계를 제시하며 마케팅을 할 수 있는 것이다.

▲김인현 한국공간정보통신 대표=제일 좋게 본 건 '원시 데이터(raw data)'를 제공한다는 점이다. '원시 데이터'를 제공하면 날 것을 가지고 뭐든지 만들 수 있다. 지금은 공공데이터를 오픈 API(응용 프로그래밍 인터페이스)방식으로 제공한다. API 방식은 정부 시스템에 문제가 생기면 거기에 종속돼 시스템이 돌아가지 않는다.

또 API만 제공하면 더 앞선 기술을 갖고 있음에도 그 기술을 활용할 수 없다. API만 주면 데이터를 쓰라는 건지, 말라는 건지 모르겠다. 원시 데이터가 있어야 기술 가지고 있는 회사가 그 기술을 온전히 활용할 수 있다.

▲이원석 연세대 컴퓨터과학과 교수=개인정보의 안전한 활용 방법이 제일 중요한 것 같다. 개인정보 보호와 활용, 두가지 토끼를 어떻게 잡을 것인지가 중요하다. 개인정보 보호를 정면으로 돌파하지 않으면 빅데이터를 사용할 수 없다. 특히, 가명정보만 가지고 원본 그대로 살리겠다는 건 국민적 합의, 활용성 부분에서 막히게 된다.

익명정보, 익명결합과 같은 부분은 사실 우리 요구에 의해 기술로 가능하다. 정부에서 익명결합, 익명활용을 적극 추진하면 나머지 문제는 다 저절로 풀릴거라 생각한다.

=우리나라는 데이터 구축, 유통, 활용 등 가치사슬 전반에 걸쳐 고품질 데이터가 부족하다. 여기에 폐쇄적 유통구조와 산업 및 사회적 활용 저조 등의 한계도 있다. 기술 수준도 높지 않다. '데이터 한국'의 현실을 어떻게 보나.

▲이재형 과기정통부 과장=우리나라는 인터넷 ICT기술을 잘 활용해왔다. 다양한 데이터가 잘 쌓이고 있다. 하지만 그 데이터가 어디에 있는지 모르거나, 디지털 데이터를 나에게 필요한 형태로 가공하는데는 많은 시간과 돈이 들어간다.

가공 제한, 접근 제한과 같은 문제점을 해결하기 위해서는 내가 필요로 하는 데이터들이 어디에 있는지 편리하게 찾을 수 있도록 도와주는 게 필요하다. 또 용도에 맞게 데이터를 가공할 수 있는 산업을 육성하는 것도 중요하다. 개인정보 규제 개선에 집중해 데이터 육성 사업의 기틀을 마련해야 한다.

이정현 한국데이터진흥원 실장.

▲이정현 한국데이터진흥원 실장=우리나라 빅데이터 기술 수준은 미국의 76%밖에 안 된다. R&D 투자를 많이 하는 것에 비하면 저조처럼 보이지만, 반대로 인구와 시장 규모 등을 생각해보면 낮은 수준도 아니다. 기술로 발생하는게 데이터인데 그동안 이 데이터에 크게 신경을 안 쓴 것 같다.

또 데이터가 생산, 공급 부분 등 양적인 부분에만 너무 치우쳐있다. 데이터를 찾기도 어렵고 품질도 좋지 않아 사업자들이 사용하기에 비용이 너무 많이 들고, 경쟁력있는 재화가 되지 못한다. 빨리 정책적으로 개선이 돼야 한다. 특히 산업 육성 측면으로 가야한다. 정부에서 트리거(trigger)역할만 해도 한국이 세계 데이터 선도국가로 나갈 수 있지 않을까 생각한다.

▲이원석 연세대 교수=한국은 인적, 데이터 자체 잠재력은 1위라고 생각한다. 하지만 개인정보보호법 문제를 현명하게 풀지 못하고 있다. 우리도 아직 늦지 않았다. 충분히 기회가 있다.

빅데이터는 인터넷과 똑같다. 인터넷이 기술자만 쓰는게 아니듯, 기술만 발전한다고 해서 어느날 갑자기 인터넷 강국이 되는 건 아니다. 활용도 그만큼 잘해야 한다는 뜻이다. 기술로만 보지 말고 기술과 활용 두가지 측면으로 바라봤으면 좋겠다.

▲이현종 빅스터 대표=빅데이터 관련 산업은 크게 두 가지가 있다. 데이터를 보유하고 있는 산업과 보유하고 있지 않는 산업군이다.

보유하고 있는 산업군은 공공, 농업·유통·물류와 같은 기간산업, 통신·의류·포털과 같은 서비스 산업이다. 반면 데이터를 보유하고 있지 않는 산업군은 데이터 비즈니스만을 하려고 하는 스타트업과 일부 서비스 제공하는 빅데이터 전문 아웃소싱 기업이다.

이들 산업군에 따라 접근을 달리해야 한다. 데이터가 이미 있는 곳은 데이터 기술, 활용면에서 성숙해 있는 곳이다. 데이터가 없는 곳을 타겟팅해 개별적으로 접근해야 한다. 이번에 100대 강소기업을 키워내겠다는 정부 발표와 연결되는 부분이기도 하다.

▲김인현 한국공간정보통신 대표=대기업 중심으로 데이터를 제공하는 역차별 문제도 해소해야 한다. 지난 정부에서는 국토부에서 만든 데이터를 다음, 네이버와 같은 대기업에는 많이 주고 우리와 같은 전문 중소기업은 조금밖에 주지 않았다. 그리고는 대기업과 협력하라고 한다.

왜 전문 중소기업에 데이터를 안 주나. 결국, 데이터 전문 기업은 더 좋은 기술을 가지고 있음에도 더 좋은 서비스를 제공하지 못하게 된다. 이건 국민에 대한 역차별이다.

=이번 활성화 전략을 내놓으면서 정부가 내놓은 비전이 데이터를 가장 안전하게 잘 쓰는 나라다. 데이터 사용은 규제 및 정보보호와 맞물려 있다. 우리나라는 개인정보 규제(보호)가 세계적으로 가장 엄격하다. 이런 환경에서 데이터를 안전하게 가장 잘 쓴다는 것은 모순적인 것 같기도 하다. 어떻게 생각하나

이현종 빅스터 대표

▲김인현 한국공간정보통신 대표=중국 사업을 하면서 놀랐던 적이 있다. 중국 파트너에 개인정보 보호에 대해 물어본 적이 있는데 "

그건 국가가 책임지는 거"라고 하더라. 우리가 규제를 열심히 하고 있는 사이 중국의 IT, 소프트웨어 상상력을 못 따라가는거 아닌가 하는 생각이 들었다.

데이터를 나쁘게 쓰는 해커들과 실제로 데이터를 보호하는 부분은 조금 다른 문제인 것 같다. 우리는 데이터에 대해 '경찰' 역할까지 하려고 하는 것 같다. 우리는 개인정보 활용을 잘 할 수 있는 부분만 집중해 말하는 게 좋다고 본다. 이미 미국은 기업들끼리 데이터를 사고 팔면서 데이터 사업을 하고 있다. 리는 너무 규제와 보호를 의식하다 보니 여태 데이터를 제대로 활용하지 못한게 아닌가 한다.

▲이원석 연세대 교수=활용과 보호 둘 다 존중해야 한다. 안 그러면 계속 평행선을 달린다. 익명활용 절대로 안 된다 하는 분들 많다. 결합하면 다 나온다고. 너무나 많은 사람들이 기술 이해가 낮다. 결합하면 누군지 식별이 가능할 수 있다. 하지만 결합을 아무나 하지 못하게 하면 된다. 익명정보는 개인정보가 아니기 때문에 마음껏 사용해도 된다. 익명과 가명기술을 잘 활용하면 개인정보 보호와 활용이라는 두마리 토끼를 모두 잡을 수 있다.

▲이현종 빅스터 대표=전적으로 동의한다. 기술적 관점에서 데이터를 안전하게 분석해 활용하는 동형암호라는 기술도 나오고 있다. 이론상으로는 나쁘지 않지만 현실적으로는 10년, 20년 걸릴 것으로 보인다.

▲이재형 과기정통부 과장=동형암호 기술, 비식별 처리 기술, 새로운 결합 기술 등이 계속해 나올 수 있고 지금 당장 쓸 수 있느냐는 의견 차이가 있을 수 있다. 하지만 연구, 실증 노력은 꾸준히 해야 한다.

개인정보가 활용이 가능하려면 안전한 보호가 담보돼야 한다. '안전'과 '활용' 두마리 토끼를 잡아야 한다. 세계적 추세도 보호와 산업 발전은 같이 가고 있다. EU의 GDPR도 보호만 하는게 아니라 데이터의 자유로운 흐름을 촉진하는 내용도 같이 담겨있다.

개인정보 보호와 관련해 시민과 산업계가 그동안 따로 얘기하다 해커톤을 통해 어느 정도 합의된 결과물이 나왔다. 그 결과물대로 사회적 합의를 반영한 법제화가 빨리 진행됐으면 좋겠다.

▲이정현 한국데이터진흥원 실장=개인정보가 무엇이냐에 따라 보호가 중요하냐, 활용이 중요하냐가 다를 것 같다. 개인정보라고 하는 불가침의 개인정보가 있는 반면, 개인정보랑 관련만 있어도 개인정보라고 불리는 부분도 있다. 주민등록번호와 같은 불가침의 개인정보는 보호가 중요하고 일반 정보화된 개인정보는 활용이 중요하다.

또 합의가 굉장히 중요하다. 개인정보 주체도 만족하고, 개인정보를 활용하는 기업도 만족하는 모델이 나와야 한다. '마이데이터'처럼 본인이 동의해 일반 정보화된 데이터로 비즈니스를 할 수 있는 모델이 나와 데이터에 대한 사람들 인식이 개선돼야 한다.

김인현 한국공간정보통신 대표

=이번 발표안에는 데이터 관련 전문인력 5만명 확충과 전문기업 100곳 양성, 시장 규모 8조원으로 확대 같은 실천과제가 들어가 있다. 정량적 목표에만 치중하면 품질이 낮아질 수 있다. 어떻게 생각하나.

▲이재형 과기정통부 과장=데이터 인력을 양성하려면 고급인력도 필요하고 실무인력도 필요하다. 빅데이터를 분석할 수 있는 고급인력을 양성하고 데이터 연구센터도 양성해야 한다. 데이터 진흥원에서 하는 국가공인자격 프로그램도 같이 지원해 가야 한다. 대학원 연구센터도 늘리는 등 인력 지원을 확대할 계획이다.

▲이현종 빅스터 대표=선생님을 키워야 한다. 경험있는 선생님이 필요하다. 책을 통해 배운 사람이 가르치면 데이터 전문 인력을 절대 양성할 수 없다. 트러블 슈팅을 할 수 있는 학습이 돼야 한다. 즉, 필드에 경험있는 사람을 비싸게 데리고 와 강사로 키워야 한다. 그러지 않고는 교육쪽으로는 답이 없다.

▲이원석 연세대 교수=인력양성에서도 데이터가 중요하다. 익명활용을 열어야지만 교육이 가능하다. 제대로 이용할 수 있는 데이터가 있어야 그걸로 교육하지 않겠나. 데이터 전문 대학원은 필요하다. 다른 학과 랑 같이 살펴야겠지만 정부가 데이터 전문 대학원 설립을 추진했으면 좋겠다.

▲김인현 한국공간정보통신 대표='양병설'이 유행인 것 같다. 전문 기업을 100곳 양성한다고 하는데 스타트업보다 이미 있는, 오래된 기업을 양성해야 한다. 초보 기업도 중요하지만 데이터는 데이터를 다뤄 본 기업의 경험이 중요하다. 경험을 가진 기업 지원도 소홀히 하지 않았으면 한다.

=공공 데이터 개방은 그동안 민간이 계속 요구해오던 사항이였다. 정부의 이번 공공 데이터 개방을 어떻게 보나.

▲이원석 연세대 교수=공공데이터 전략위원회의 빅데이터 전문위원장을 맡은 적이 있다. 공공데이터를 얘기하면 개방만 먼저 얘기한다. 하지만 무조건 개방만 해봐야 쓰지 못한다. 품질이 어떤지 먼저 분석해 본 후, 좋은 품질의 데이터만 개방해야 한다.

개방하라고 무조건 모든 데이터를 넓게 개방하면 밑빠진 독에 물 붓기다. 정말로 내부적으로 활용할 수 있는 데이터를 작게나마 만들어 활용해보고 의미가 있으면 마크를 붙여 개방하는게 좋다. 데이터 품질을 분석하지 않고 개방만 하는 것은 하나마나다.

▲이현종 빅스터 대표=동의한다. 데이터의 질적 고도화가 중요하다.

이원석 연세대학교 컴퓨터과학과 교수

=내 데이터 권리를 찾는다는 '마이데이터'에 대해 관심이 많았다. 이를 좀 더 구체적으로 말해달라.

▲이재형 과기정통부 과장=’마이데이터’는 내 개인정보를 어떤 목적으로 활용하고 누구랑 공유할지 본인이 직접 결정하는 방식이다. 정보 주체인 개인의 권리를 강화하는 방안이다.

병원을 가든, 금융기관을 가든 거기서 내 정보를 내 휴대폰으로 내려받을 수 있다. 그 동안은 병원을 가면 진료받는 기록이나 내 정보를 프린트나 CD로 줘 2차 활용과 보관이 어려웠다. 이런 부분을 편리하게 해 내 개인정보를 보관하는 장치가 핸드폰이 될 수 있는 것이다.

또 내 정보를 가지고 핀테크 업체가 자산을 관리해준다던지, 운동관리업체가 건강을 관리해주는 등 서비스를 받을 수 있다는 게 장점이다. '마이데이터'는 시범사업을 통해 데이터에 대한 국민, 기업의 인식을 바꾸는게 목적이다. 나중에 법제화까지 가는 것도 염두에 두고 있다.

해외에는 이미 데이터 자기결정권을 인정하는 움직임이 있다. EU의 GDPR에도 데이터 자기결정권을 인정하자는 내용이 들어가 있다.

▲김인현 한국공간정보통신 교수=법제화해야 한다. 그러지 않으면 소용없다.

▲이정현 한국데이터진흥원 실장=마이데이터는 개인정보 활용을 보여주는 모범 사례다. 서비스 기업 입장에서는 새로운 부가 가치를 창출해 산업을 발전시킬 수 있는 좋은 기회가 될 것이다. 제도화도 필요한 부분이다.

▲이원석 연세대 교수=개인적으로도 좋은 방향이고, 국민이 가져야 하는 권리다. 하지만 우려되는 부분도 있다. 마이데이터는 무조건 동의를 기반으로 한다. 동의를 안 받으면 빅데이터 산업 측면에서 연속성과 완결성이 깨진다.

권리적으로는 맞고 존중해야 하는 부분인데, 빅데이터 산업에 얼마나 도움이 될지는 잘 모르겠다. 동의한 사람의 정보만 뽑아서 써야되는데 국가적 비용이 들 것이다. 그 부분이 우려스럽다. 따라서 '마이데이터' 법제화는 좋지만 모든 영역에 할 필요는 없다고 본다. 마이데이터 영역에 대한 정의를 잘 하지 않으면 추가적인 비용이 발생할 것이다.

=마지막으로 우리나라가 '데이터 강국'이 되려면 산학연관에서 어떤 노력이 필요한지 말해달라.

▲이현종 빅스터 대표=데이터를 유통하고 싶어하는 사람 중 하나다. 하지만 그동안 데이터 유통 비즈니스 분야는 계속 묶여 있어 커지지 않았다. '마이데이터'를 통해 데이터를 활용하고 유통하는 부분에서 인식 변화가 올 것이라 본다. 인식의 전환과 발전을 위해 지속적인 홍보 행사를 많이 했으면 좋겠다. 데이터 산업 인력은 현장을 경험해 본 선생님을 키워야 한다.

▲이원석 연세대 교수=데이터 산업을 키우려면 R&D하고 무조건 비즈니스에 적용해야한다. 그래야만 의미가 있다. 데이터 산업에서 중요한 것은 실증이다. 데이터가 분석한 것이 산업에 적용해 효과가 있느냐를 먼저 챙겨야 한다.

데이터 R&DB하는 영역 만들어야 한다. R&D는 과학기술정보통신부에서 지원해야 한다. 정보 소유권에 대한 국가적 합의도 필요하다. 국가적 합의를 통해 대규모 재원을 마련해야 한다. 우리나라가 정보화 강국이 됐던 이유도 정보화 촉진 기금 덕분이었다.

▲김인현 한국공간정보통신 대표=데이터 개방으로 생기는 두려움이 정부에 있는 것 같다. 하지만 오히려 개방이야말로 가장 산업이 발전하기 좋은 구조다. 문재인 정권이 들어오면서 처음으로 공공데이터 전수조사를 했는데 의지를 보인 것 같다. 마이데이터가 도입되고 정착되면 좋아질 거라 생각한다.

관련기사

▲이정현 한국데이터진흥원 실장=기업들과 스킨십이 많아져야 할 것 같다. 앞으로 한국데이터진흥원도 기업들과 자주 만나고 논의해 정책에 현장 목소리가 많이 반영될 수 있도록 노력하겠다.

▲이재형 과기정통부 과장=데이터 산업활성화 위해서 마중물 역할하는 재정 지원을 확대하고, 글로벌 수준에 부합하는 데이터 이용제도를 만들도록 노력하겠다. 또 방방곡곡에 양질 데이터가 넘쳐나고, 국민 모두가 데이터 힘을 누릴 수 있는 데이터 강국이 되도록 힘쓰겠다.