앨리드 마켓 리서치(Allied Market Research)의 최근 보고서에 따르면, NoSQL 데이터베이스에 대한 수요는 계속 증가하고 있다. 2022년 전 세계 NoSQL 시장은 73억 달러의 매출을 기록했으며, 연평균 28%의 성장률로 2032년에는 863억 달러의 매출을 기록할 것으로 예상된다. 보고서는 전 세계 NoSQL 시장 성장을 이끄는 주요 요인으로는 빅데이터 분석에 대한 폭발적인 수요, 확장 가능하고 유연한 엔터프라이즈 데이터베이스 솔루션에 대한 필요성, 클라우드 컴퓨팅 플랫폼 및 기술의 보편화 등을 들었다.
기업이 NoSQL로의 마이그레이션을 고려하고 있다면, 데이터 스토리지 요구사항에 가장 적합한 NoSQL 데이터베이스를 선택하는 것이 중요하다. 현재 시장에는 24개 이상의 오픈소스 및 상용 NoSQL 데이터베이스가 나와 있으므로, 선택의 폭이 너무나 넓기 때문이다.
여기서는 NoSQL 데이터베이스 구매 결정에 도움이 되는 5가지 질문을 제시한다. 또한 현재 시장에 나와 있는 주요 NoSQL 데이터베이스의 특징도 살펴본다. NoSQL 데이터베이스를 선택하기 전에 해야 할 5가지 질문은 다음과 같다.
- NoSQL이 올바른 선택인가?
- 어떤 NoSQL 데이터 모델이 필요한가?
- 지연시간 요건은 무엇인가?
- 확장성과 데이터 일관성이 얼마나 중요한가?
- 어떻게 배포할 것인가?
NoSQL 데이터베이스의 필요성
NoSQL 데이터베이스를 선택하기 전에 NoSQL이 가장 적합한 선택인지 확인하는 것이 중요하다. IDC의 리서치 담당 부사장 칼 올로프슨은 "백오피스 트랜잭션 처리, 인터랙티브 애플리케이션 데이터 관리, 스트리밍 데이터 캡처"가 모두 NoSQL을 선택해야 하는 좋은 이유라고 말한다.이런 요구 사항을 염두에 두더라도, 특히 기존 RDBMS 대신 NoSQL을 선택하는 데는 장단점이 있기 때문에 NoSQL이 기업에 적합하지 않을 가능성을 배제해야 한다. 멀린스 컨설팅(Mullins Consulting)의 대표 컨설턴트 크레이그 멀린스는 "가장 먼저 결정해야 할 것은 왜 NoSQL 데이터베이스 시스템이 필요한가 하는 점”이라고 말했다. 먼저 기존 RDBMS가 사용례를 충족할 수 없는 이유를 파악해야 한다. 관계형/SQL 데이터베이스 시스템은 널리 설치되어 있으며, 대부분 기업에서 기존 시스템과 애플리케이션에 배포되어 있고, 숙련된 전문가가 관리하고 있다.
멀린스는 RDBMS를 대체할 수 있는 대안으로 다양한 데이터 저장 요구사항을 충족하기 위해 단일 시스템 내에서 여러 데이터 저장 기술을 사용하는 다중 저장소 지속성(Polyglot Persistence)을 제시한다. "모든 것을 관계형 사고방식에 억지로 끼워 맞추는" 대신, 다중 저장소 지속성을 통해 개발자와 관리자는 "각 사용례에 적합한 데이터 기술을 선택할 수 있다"는 것이다.
NoSQL의 핵심 강점은 탈중앙화되고 확장성과 내결함성을 갖춘 설계이다. 멀린스는 "대부분 NoSQL 데이터베이스 기술은 확장성과 장애를 견딜 수 있도록 구현되어 있다. 또한, 가볍고 CPU와 지원 측면에서 RDBMS보다 오버헤드가 적다”고 설명했다.
NoSQL 데이터 모델
NoSQL 데이터 모델은 키-값, 문서, 칼럼 저장소, 그래프의 4가지 주요 유형으로 나뉘며, 각 유형은 각기 다른 사용례에 적합하다. 멀린스는 각 유형의 강점을 다음과 같이 요약했다.키-값 데이터베이스는 소매업 및 모바일과 같은 애플리케이션의 고가용성, 짧은 지연시간 요구 사항에 적합하다.
문서 데이터베이스는 이벤트 로깅, 온라인 쇼핑, 콘텐츠 관리 및 심층 분석 처리에 적합하다.
칼럼 저장소 데이터베이스는 이벤트 로깅, 콘텐츠 관리, 분석을 위한 카운팅 및 분류에 적합하다. 칼럼 저장소는 데이터를 자동으로 만료하도록 설정할 수도 있다.
그래프 데이터베이스는 데이터 요소가 서로 연결되어 있고 연결 관계의 수를 알 수 없는 애플리케이션에 적합하다. 대표적인 사용례는 소셜 미디어 네트워크, 추천 엔진, 물류 및 라우팅, 위치 인식 시스템, 대중교통 링크, 네트워크 토폴로지 등이다.
포레스터 리서치의 부사장 겸 대표 애널리스트 노엘 유한나는 "올바른 모델을 선택하는 것이 중요하다”라며, "문서 모델은 JSON 문서를 최적으로 저장하는 기능을 포함해 가장 많이 사용되는 모델이다. 그래프 모델은 상호 연결된 데이터에 중점을 두는 반면, 키-값 모델은 단순한 키-값 쌍 검색에 중점을 두기 때문에 널리 사용되지는 않는다”라고 설명했다.
어떤 데이터를 저장하고 어떻게 액세스할 것인지는 데이터 모델을 결정하는 데 필수적이다. 또한 일부 솔루션 업체의 제품은 다중 모델 데이터베이스로, 모든 모델을 지원해 여러 모델을 사용할 수 있는 유연성을 제공하기도 한다.
지연시간 요구사항
IDC의 올로프슨에 따르면, 스트리밍 데이터 캡처나 실시간 데이터 공유 애플리케이션처럼 지연시간이 매우 짧아야 하는 경우라면 키-값 저장소를 고려해야 한다. 데이터가 단순한 목록이나 매트릭스인 경우에도 마찬가지이다.데이터의 형태가 매우 가변적이고 정의된 필드가 포함된 경우에는 JSON 문서 데이터베이스가 더 적합하다. 이는 일반적으로 애플리케이션과 사용자의 변화하는 요구사항에 맞춰 자주 변경되는 인터랙티브 애플리케이션의 경우에도 마찬가지이다. 지연시간 요구사항이 그다지 크지 않고 자재명세서 구조나 상호 연관된 데이터의 복잡한 그룹 등 복잡한 조합을 지원해야 하는 경우에는 그래프 데이터베이스를 고려할 수 있다.
확장성과 데이터 일관성
NoSQL 데이터베이스는 데이터를 세그먼트 또는 샤드(Shard)로 나눌 수 있으므로 수백 테라바이트를 실행하는 대규모 배치 환경에 유용하다. 유한나는 "샤딩은 데이터베이스를 확장하는 데 있어 NoSQL의 필수적인 기능”이라며, "기업은 수평적으로 확장된 클러스터에서 노드를 자동으로 확장 및 축소해 애플리케이션을 동적으로 확장할 수 있는 NoSQL 솔루션을 많이 찾는다”고 말했다.ACID 준수를 통해 모든 트랜잭션의 데이터 일관성을 보장하는 데 중점을 두는 관계형 데이터베이스와 달리, NoSQL을 사용하면 데이터 일관성을 일관성 있게 또는 느슨하게 선택할 수 있다. 유한나는 "최종적인 일관성을 유지하면서 빠르게 확장하고 높은 성능을 제공할 수 있다"고 강조했다.
배포 방식
일부 NoSQL 데이터베이스는 온프레미스에서 실행할 수 있고, 일부는 클라우드에서만 실행할 수 있으며, 일부는 하이브리드 클라우드 환경에서 실행할 수 있다. 또한 서버리스 및 쿠버네티스 환경에서 실행되는 등 클라우드 아키텍처와 기본적으로 통합되는 NoSQL도 있다. 유한나는 "특히 애플리케이션에 우수한 성능과 확장성을 제공하면서 자동화를 통해 인프라 관리를 간소화하고자 하는 기업에는 서버리스가 필수적인 요소로 여겨진다”고 말했다.시장을 선도하는 NoSQL 데이터베이스
이상의 5가지 질문을 던져보면 기업의 필요에 맞는 NoSQL 데이터베이스를 선택하는 데 도움이 될 것이다. 이제 시장에 나와 있는 주요 NoSQL 데이터베이스 솔루션을 살펴보자.
에어로스파이크(Aerospike)
에어로스파이크는 높은 읽기 및 쓰기 처리량이 필요한 애플리케이션을 위해 설계된 오픈소스 분산형 실시간 고성능 NoSQL 데이터베이스이다. 다중 모델 NoSQL이자 그래프 데이터베이스로, 동시에 여러 데이터 모델을 지원하고 확장에 제한이 없어 수십억 건의 트랜잭션에 걸쳐 실시간 처리가 가능하다. 제품 설명서에 따르면, 에어로스파이크는 대규모 병렬 처리와 통합 스토리지 모델을 사용해 작은 서버 공간을 사용한다.
이 플랫폼은 엣지에서 스트리밍 데이터를 수집하고 처리하며, 운영, 트랜잭션 또는 분석 워크로드를 위해 엣지 데이터를 레코드 시스템, 서드파티 소스, 데이터 웨어하우스 또는 데이터 레이크의 데이터와 결합할 수 있다. 배포 방식도 온프레미스와 클라우드 매니지드 서비스 모두 지원한다.
함께 보면 좋은 콘텐츠
Sponsored
Surfshark
“유료 VPN, 분명한 가치 있다” VPN 선택 가이드
ⓒ Surfshark VPN(가상 사설 네트워크, Virtual Private Network)은 인터넷 사용자에게 개인 정보 보호와 보안을 제공하는 중요한 도구로 널리 인정받고 있다. VPN은 공공 와이파이 환경에서도 데이터를 안전하게 전송할 수 있고, 개인 정보를 보호하는 데 도움을 준다. VPN 서비스의 수요가 증가하는 것도 같은 이유에서다. 동시에 유료와 무료 중 어떤 VPN을 선택해야 할지 많은 관심을 가지고 살펴보는 사용자가 많다. 가장 먼저 사용자의 관심을 끄는 것은 별도의 예산 부담이 없는 무료 VPN이지만, 그만큼의 한계도 있다. 무료 VPN, 정말 괜찮을까? 무료 VPN 서비스는 편리하고 경제적 부담도 없지만 고려할 점이 아예 없는 것은 아니다. 보안 우려 대부분의 무료 VPN 서비스는 유료 서비스에 비해 보안 수준이 낮을 수 있다. 일부 무료 VPN은 사용자 데이터를 수집해 광고주나 서드파티 업체에 판매하는 경우도 있다. 이러한 상황에서 개인 정보가 유출될 우려가 있다. 속도와 대역폭 제한 무료 VPN 서비스는 종종 속도와 대역폭에 제한을 생긴다. 따라서 사용자는 느린 인터넷 속도를 경험할 수 있으며, 높은 대역폭이 필요한 작업을 수행하는 데 제약을 받을 수 있다. 서비스 제한 무료 VPN 서비스는 종종 서버 위치가 적거나 특정 서비스 또는 웹사이트에 액세스하지 못하는 경우가 생긴다. 또한 사용자 수가 늘어나 서버 부하가 증가하면 서비스의 안정성이 저하될 수 있다. 광고 및 추적 위험 일부 무료 VPN은 광고를 삽입하거나 사용자의 온라인 활동을 추적하여 광고주에게 판매할 수 있다. 이 경우 사용자가 광고를 보아야 하거나 개인 정보를 노출해야 할 수도 있다. 제한된 기능 무료 VPN은 유료 버전에 비해 기능이 제한될 수 있다. 예를 들어, 특정 프로토콜이나 고급 보안 기능을 지원하지 않는 경우가 그렇다. 유료 VPN의 필요성 최근 유행하는 로맨스 스캠은 인터넷 사기의 일종으로, 온라인 데이트나 소셜 미디어를 통해 가짜 프로필을 만들어 상대를 속이는 행위다. 이러한 상황에서 VPN은 사용자가 안전한 연결을 유지하고 사기 행위를 방지하는 데 도움이 된다. VPN을 통해 사용자는 상대방의 신원을 확인하고 의심스러운 활동을 감지할 수 있다. 서프샤크 VPN은 구독 요금제 가입 후 7일간의 무료 체험을 제공하고 있다. ⓒ Surfshark 그 외에도 유료 VPN만의 강점을 적극 이용해야 하는 이유는 다음 3가지로 요약할 수 있다. 보안 강화 해외 여행객이 증가함에 따라 공공 와이파이를 사용하는 경우가 늘어나고 있다. 그러나 공공 와이파이는 보안이 취약해 개인 정보를 노출할 위험이 있다. 따라서 VPN을 사용하여 데이터를 암호화하고 개인 정보를 보호하는 것이 중요하다. 서프샤크 VPN은 사용자의 개인 정보를 안전하게 유지하고 해킹을 방지하는 데 유용하다. 개인정보 보호 인터넷 사용자의 검색 기록과 콘텐츠 소비 패턴은 플랫폼에 의해 추적될 수 있다. VPN을 사용하면 사용자의 IP 주소와 로그를 숨길 수 있으며, 개인 정보를 보호할 수 있다. 또한 VPN은 사용자의 위치를 숨기고 인터넷 활동을 익명으로 유지하는 데 도움이 된다. 지역 제한 해제 해외 여행 중에도 한국에서 송금이 필요한 경우가 생길 수 있다. 그러나 IP가 해외 주소이므로 은행 앱에 접근하는 것이 제한될 수 있다. VPN을 사용하면 지역 제한을 해제해 해외에서도 한국 인터넷 서비스를 이용할 수 있다. 따라서 해외에서도 안전하고 편리하게 인터넷을 이용할 수 있다. 빠르고 안전한 유료 VPN, 서프샤크 VPN ⓒ Surfshark 뛰어난 보안 서프샤크 VPN은 강력한 암호화 기술을 사용하여 사용자의 인터넷 연결을 안전하게 보호한다. 이는 사용자의 개인 정보와 데이터를 보호하고 외부 공격으로부터 사용자를 보호하는 데 도움이 된다. 다양한 서버 위치 서프샤크 VPN은 전 세계 곳곳에 여러 서버가 위치하고 있어, 사용자가 지역 제한된 콘텐츠에 액세스할 수 있다. 해외에서도 로컬 콘텐츠에 손쉽게 접근할 수 있음은 물론이다. 속도와 대역폭 서프샤크 VPN은 빠른 속도와 무제한 대역폭을 제공하여 사용자가 원활한 인터넷 경험을 누릴 수 있도록 지원한다. 온라인 게임, 스트리밍, 다운로드 등 대역폭이 필요한 활동에 이상적이다. 다양한 플랫폼 지원 서프샤크 VPN은 다양한 플랫폼 및 디바이스에서 사용할 수 있다. 윈도우, 맥OS, iOS, 안드로이드 등 다양한 운영체제 및 디바이스에서 호환되어 사용자가 어디서나 안전한 인터넷을 즐길 수 있다. 디바이스 무제한 연결 서프샤크 VPN은 무제한 연결을 제공하여 사용자가 필요할 때 언제든지 디바이스의 갯수에 상관없이 VPN을 사용할 수 있다.