2014년 여름, 정식으로 공개된 아파치 스파크(Apache Spark)는 하둡 기반의 대용량 데이터를 고급 실시간 분석을 쉽게 할 수 있도록 도와준다. 인메모리 처리를 기본으로 하기 때문에 빠르고 지연 속도가 낮은 스파크는 상당히 많은 경쟁자들이 있음에도 불구하고 차세대 빅데이터 처리를 위한 프레임워크로 기대되고 있다. 전문가들은 스파크의 시대가 도래할 것이라고 예상하지만, 복병도 만만치 않다고 지적한다. 스파크의 개념과 장단점을 알아보고 리뷰를 통해 각 기능들을 분석해보자.
주요 내용
스파크의 개념과 구성
빅데이터 분석에 스파크를 이용해야 하는 5가지 이유
빅데이터에서 가장 빛나는 스파크, 성장이 필요하다
리뷰 | 스파크, 빅데이터 처리에 불을 지피다