오류율 격차 10배.. 정부-IT업계 '공공데이터 품질' 공방 왜

임성엽 2017. 7. 2. 18:10
자동요약 기사 제목과 주요 문장을 기반으로 자동요약한 결과입니다.
전체 맥락을 이해하기 위해서는 본문 보기를 권장합니다.

지난 2013년부터 적극 개방을 추진한 공공데이터 '품질'을 두고 정부와 정보기술(IT) 업계가 공방을 펼치고 있다.

2일 행정자치부와 IT업계에 따르면 공공데이터의 오류율을 정부가 0.3~0.5%로 파악하는 반면 업계는 약 5%라고 지적해 10배 격차가 나는 것으로 나타났다.

업계 관계자는 "박근혜 정부가 공공데이터 개방을 확대했지만 오류율 개선은 취약해 하자 있는 데이터를 함께 개방한 것으로 볼 수 있다"고 주장했다.

번역beta Translated by kaka i
글자크기 설정 파란원을 좌우로 움직이시면 글자크기가 변경 됩니다.

이 글자크기로 변경됩니다.

(예시) 가장 빠른 뉴스가 있고 다양한 정보, 쌍방향 소통이 숨쉬는 다음뉴스를 만나보세요. 다음뉴스는 국내외 주요이슈와 실시간 속보, 문화생활 및 다양한 분야의 뉴스를 입체적으로 전달하고 있습니다.

정부 "0.3~0.5%".. 업계 "5%대"
"하자 있는 데이터 함께 개방
데이터 정합성 크게 떨어져"
지표별 평균 '10배 격차' 이견
행자부 "샘플링 전수조사" 반박

지난 2013년부터 적극 개방을 추진한 공공데이터 '품질'을 두고 정부와 정보기술(IT) 업계가 공방을 펼치고 있다.

2일 행정자치부와 IT업계에 따르면 공공데이터의 오류율을 정부가 0.3~0.5%로 파악하는 반면 업계는 약 5%라고 지적해 10배 격차가 나는 것으로 나타났다. 업계는 지난해 공공데이터 오류율이 5%대라는 주장을 펴고 있다. 지난 2011년 이상일 당시 의원 새누리당 의원이 공공기관 데이터베이스(DB) 오류율 수요를 조사한 결과다. 당시 16개 공공기관의 31개 공공DB 품질조사를 통해 지표별(완전성, 일관성, 정확성, 유효성) 평균 오류율은 5.19%로 집계됐다.

업계는 특히 공공데이터의 데이터 정합성이 맞지 않는다고 지적하고 있다. 일례로 올 6월 기준 지방행정데이터의 분식집 개방은 운영 3만8676개소, 폐업 11만8638개소로 총 15만7312건으로 집계된다. 그러나 실제 지도에 맵핑되는 분포 데이터에는 운영 4만3183개소, 폐업은 8만7500개소로 집계돼 13만683건으로 16.92%(2만6629건) 오류가 발생한다.

업계 관계자는 "공공데이터포털 DB를 활용해 성공한 사례를 찾기 쉽지 않다"면서 "버스 전용차로 시간 예측 서비스가 그 중 성공한 사업으로 꼽히지만, 이는 실시간 발생하는 정보로 기존 집적 데이터와는 구별된다"고 말했다. 업계 관계자는 "박근혜 정부가 공공데이터 개방을 확대했지만 오류율 개선은 취약해 하자 있는 데이터를 함께 개방한 것으로 볼 수 있다"고 주장했다.

행자부는 업계가 주장하는 오류율을 일축했다. 당시 정보통신부의 지식DB구축사업, 행정자치부의 행정DB사업부터 지금에 이르기까지 국가DB 구축사업의 모두 평가지표는 데이터 표본을 추출해 조사하는 작업을 거치기 때문에 오류율이 낮다는 것이다.

행자부 관계자는 "일반 DB구축사업 오류율은 0.3~0.5% 사이"라며 "국가DB사업에는 샘플링을 통해 종이에 쓰인 내용을 실물과 맞는지 여부를 검증하고 특히 국가기록물의 경우엔 샘플링 검증을 두 차례에 걸쳐 전수조사를 하고 있다"고 반박했다.

임성엽기자 starleaf@dt.co.kr

Copyright © 디지털타임스. 무단전재 및 재배포 금지.

이 기사에 대해 어떻게 생각하시나요?