Offcanvas
Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.
Offcanvas
1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

세상의 모든 IT 리서치 자료 - 넘버스 Numbers

오픈 데이터가 매년 세계 경제에 기여하는 가치
3조
달러
자료 제목 :
오픈 데이터의 경제적 효과와 정부의 역할
How Government can promote open data and help unleash over 3 trillion in economic value
자료 출처 :
McKinsey
원본자료 다운로드
발행 날짜 :
2014년 04월 15일
오픈소스

“누구나 자유롭게 맵핑 서비스 만든다” 더 많은 ‘오픈’ 지도 데이터가 필요한 이유

Marc Prioleau | InfoWorld 2024.03.27
오픈 데이터의 흐름이 전 세계적으로 확산하고 있다. 이는 엄청난 혁신을 불러일으킬 것으로 기대된다. 실제로 매켄지는 자유롭게 사용하고 재배포할 수 있는 데이터인 오픈 데이터가 세계 경제에 연간 3조 달러의 기여를 할 수 있으며, 혁신을 일으키고 경제의 모든 부문을 변화시킬 수 있는 잠재력을 가지고 있다고 평가한다. 세계은행도 오픈 데이터의 큰 잠재력을 인정하며, 민간 기업의 공공 데이터 사용이 "이제 막 활용되기 시작했다"고 분석했다.
 
ⓒ Getty Image Bank

새로운 디지털 정책을 앞장서 추진하고 있는 EU는 최근 공공 부문 기관이 무료로 사용할 수 있는 새로운 '고가치 데이터 세트'를 추가한 오픈 데이터 지침(Open Data Directive)을 시행했다. 이 데이터 세트에는 지리공간과 환경, 기상, 통계, 모빌리티, 기업 데이터가 포함되는데, 이를 통해 사회의 디지털 혁신을 장려하고 이동성과 의료, 에너지 절약, 지속 가능성을 개선하는 것을 목표로 한다. 티에리 브르통 EU 집행위원장은 "스타트업과 중소기업이 이 데이터를 활용해 EU와 전 세계 시민의 삶을 개선하는 신제품과 혁신적인 솔루션을 개발하기를 기대한다"라고 말했다.
 

오버추어 맵 파운데이션

오버추어 맵 재단(Overture Maps Foundation)에서는 누구나, 어디서나, 상호 운용 가능한 맵핑 서비스를 구축하는 데 사용할 수 있는 세계 최대 엔터프라이즈급 오픈 지도 데이터 컬렉션을 수집하고 있다. 이런 정확한 데이터가 있으면 내비게이션, 지역 검색, 물류 관리, 위치 기반 증강 현실 같은 서비스를 빠르게 실현할 수 있다.

그러나 정확성, 적시성, 고급 기능에 대한 요구사항이 계속 늘어나면서 개방형 데이터베이스 레이어의 필요성도 커지고 있다. 공통의 개방형 데이터 기반 레이어를 구축하면 부가가치 높은 데이터를 더 쉽게 결합하고 플랫폼 간 상호 운용성을 개선할 수 있다. 끊임없이 변화하는 세계를 맵핑하는 데 필요한 이런 데이터 고급 맵핑 기능을 구축하고 유지하는 작업은 너무 방대하고 복잡하며 비용이 많이 들기 때문에 한 기관이 처리하기에는 역부족이다.

기존까지 가장 정확한 지도 데이터는 특정 기업 혹은 조직이 소유한 유료 자산이었다. 그러나 이들 데이터 역시 구축하고 유지하는 데 드는 비용이 증가하고 있다. 데이터를 수집하고 제시하는 소스와 방법이 너무 다양하기 때문에 상호 운용성이 어렵고 느리며 제한적이었다. 이런 문제를 해결하는 방법이 바로, 지도 서비스를 활발하게 사용하면서 데이터의 정확성에 대한 피드백을 제공하는 광범위한 사용자 네트워크를 구축하는 것이다. 이를 통해 업계 전체가 최고의 지도 데이터를 구축할 수 있다.

이런 과정에서 오픈 라이선스를 통한 개방적 사용이 핵심적인 역할을 한다. 오픈 지도 데이터의 기본 개념은 오픈소스 소프트웨어와 마찬가지로 누구나 사용하고, 변경하고, 재배포할 수 있는 자산을 공동으로 구축하는 것이다. 최근 하버드 비즈니스 스쿨의 보고서에 따르면, 약 30년 전 리눅스 운영체제 개발을 위해 시작된 개방형 모델은 현재 수조 달러의 가치를 지닌 오픈소스 소프트웨어 산업으로 발전했다. 오픈소스 소프트웨어가 없었다면 기업은 소프트웨어에 지금보다 3.5배 더 많은 비용을 지출해야 했을 것이라고 보고서는 분석했다.

AWS, 메타, 톰톰(TomTom), 마이크로소프트와 같은 세계 최대 IT 및 위치 기반 기업도 오픈소스가 기업과 경제에 미치는 가치를 인정해 오픈소스를 적극 옹호하고 있다. 2022년 말 이런 기업이 모여 리눅스 재단 산하에 세계 최대 규모의 오픈 데이터 프로젝트인 오버추어를 출범시킨 것도 같은 맥락이다.

오버추어의 목표는 다양한 맵핑 애플리케이션과 지리공간 분석을 지원하는 오픈 지도 데이터를 구축하는 것이다. 지도 데이터는 물리적 세계를 디지털로 표현한 것으로, 방대하고 복잡하며 서로 연관된 데이터의 집합이다. 이를 구축하기 위해 오버추어는 다양한 신호에서 발생하는 데이터를 집계, 중복 제거, 개선, 표준화, 유지 관리해 지도 제작자에게 가치 있는 포괄적인 기초 데이터 세트를 제공한다.

예를 들어, 오버추어의 건물 데이터는 오픈스트리트맵의 크라우드소싱 데이터, 에스리의 커뮤니티 맵 프로그램의 정부 데이터, 마이크로소프트와 구글의 AI 생성형 건물 데이터 등을 종합한 것이다. 이 데이터 세트에는 23억 개의 건물이 등록돼 있으며, 이는 세계에서 가장 큰 규모의 오픈 빌딩 데이터 세트다. 주소, 도로망, 관심 장소도 오픈소스 데이터도 앞으로 다룰 주요 분야다.
 

오픈 데이터와 오픈소스의 차이

오픈 데이터 프로젝트와 오픈소스 프로젝트 사이에는 많은 유사점이 있지만 뚜렷한 차이도 있다. 이런 차이는 누구와 협업할 것인가를 결정할 때 중요한 영향을 줄 수 있다. 필자는 오버추어에서 9개월 동안 일하면서 오픈소스와 오픈 데이터가 어떻게, 왜 다른지 알게 됐다. 오픈 데이터 프로젝트에 중요한 영향을 미치는 오픈소스와의 차이점 6가지를 정리하면 다음과 같다.
 
  1. 데이터 생성. 소프트웨어 코드는 사람의 두뇌 또는 점점 AI 기반 코딩 어시스턴트를 통해 생성된다. 반면, 데이터는 측정이나 관찰을 통해 생성되므로 시스템이나 프로젝트가 이런 탐지를 직접 수행해야 한다. 지도 데이터의 경우, 새로운 도로의 건설, 기업의 변경, 기존 건물의 파괴 등을 직접 관찰, 확인해야 한다. 오픈 데이터 프로젝트의 커뮤니티는 이런 역할을 수행할 수 있는 시스템을 직접 개발해야 한다. 시간이 지남에 따라 변화하는 데이터를 측정해야 하므로 이는 점점 더 중요해지고 있다.
  2. 정확성. 오픈 데이터는 현실을 반영하므로, 가능한 한 정확해야 한다. 지도 데이터는 물리적 세계를 디지털로 표현한 것이고, 이 표현은 가능한 한 현실에 충실해야 한다. 오픈소스 소프트웨어 개발에서는 특정 사용 사례에 맞게 나중에 코드를 수정하는 것이 일반적이다. 이를 통해 코드를 더 빨리 공유하고 개선한다. 반면 오픈 데이터의 경우 처음부터 정확성에 대한 엄격성이 훨씬 더 높다.
  3. 적시성. 대기질, 도로 상황 또는 상점의 개폐업 등은 끊임없이 변화하는 데이터다. 매월, 매주, 심지어 매일 새로 고쳐야 하는 경우도 있다. 이 때문에 오픈 데이터 프로젝트는 생산 라인처럼 운영된다. 현재 매달 새로운 데이터 릴리즈를 발표하고 있으며, 발표 주기를 줄이기 위해 노력하고 있다. 오픈소스 소프트웨어에서는 누군가가 며칠, 몇 달, 심지어 몇 년 동안 사용되거나 검토되거나 수정되지 않은 코드를 공개할 수도 있다. 반면 오픈 데이터로 작업하는 개발자는 작업 방식과 관련해 다양한 시간 요구 사항과 기대치에 부응해야 한다.
  4. 비용과 규모. 오픈소스 코드는 일반적으로 관리 가능한 크기다. 가장 간단한 경우는 노트북에서 로컬로 코드를 실행할 수 있을 정도다. 코드를 저장하고 제공하는 데 드는 비용도 일반적으로 중요한 요소가 아니다. 반면 지도 데이터는 다르다. 전 세계 지도 데이터와 같은 빅 데이터는 테라바이트, 페타바이트 규모다. 가장 기본적인 형태로 사용하려고 해도 이런 데이터를 저장하고 사용자와 유지 관리자에게 제공해야 하므로 상당한 사전 투자가 필요할 수 있다.
  5. 라이선싱. 데이터는 어딘가 소스가 있기 마련이다. 민간 기업처럼 누군가가 '소유'하고 있을 수도 있고, 기존의 여러 오픈 데이터 리포지토리를 결합한 것일 수도 있다. 데이터가 다양한 소스에서 파생됐기 때문에 데이터 스키마를 하나의 일관된 시스템으로 병합해야 한다. 때로는 일부 데이터를 다른 데이터와 병합하기 위해 데이터 소유자의 명시적인 허가가 꼭 필요한 경우도 있다. 반면 오픈소스는 기존 코드 베이스의 라이선스가 명확하므로 그 권리 하에서 작성자가 자유롭게 코드를 작성할 수 있다.
  6. 개인정보 보호. 데이터에는 실제 사람의 주소나 전화번호와 같은 개인 정보가 포함될 수 있고, 개인을 식별할 수 있는 이미지도 있을 수 있다. 따라서 모든 개인 식별 정보가 제거되도록 주의를 기울여야 한다. 반면 오픈소스 코드를 작성하거나 재사용할 때는 일반적으로 이런 종류의 정리 작업이 필요 없다.
 

앞으로 나아갈 길

오픈소스 코드가 주류로 확산하기까지 수십 년이 걸렸다. 오픈 데이터 역시 오픈소스의 역사에서 얻은 교훈을 활용할 수 있지만, 앞으로 자체적인 모범 사례를 개발해야 한다. 그래야 산업, 정부, 경제 전체에 걸쳐 새로운 제품과 서비스가 등장할 수 있다. 오픈소스가 오픈소스를 사용하는 기업에 혜택을 준 것처럼, 오픈 데이터는 오픈 데이터를 기반으로 서비스를 제공하는 기업에 혜택을 줄 것이다. 소비자, 정부, 기업 모두 더 많은 더 좋은 상품과 서비스를 누릴 수 있게 될 것이다.

Marc Prioleau는 오버추어 맵 재단의 전무이사다.
editor@itworld.co.kr
 Tags 오픈 지도 데이터 오버추어 맵 파운데이션

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.