미래기술

인텔, 세계 최대 뉴로모픽 시스템 '할라 포인트' 구축 "AI 추론 50배 더 빠르게"

Maria Korolov | InfoWorld 2024.04.23
양자 컴퓨팅은 어려운 최적화 문제를 해결하고 AI의 속도와 효율성을 높여줄 수 있는 혁신적인 컴퓨팅 아키텍처로 묘사된다. 그러나 양자 컴퓨터는 아직 전통적인 컴퓨터의 성능을 앞설 만큼도 확장할 수 없으며, 플랫폼과 프로그래밍 언어, 애플리케이션으로 구성된 완전한 생태계는 더욱 먼 미래의 이야기다.
 
그 사이 또 다른 신기술인 뉴로모픽 컴퓨팅이 훨씬 더 즉각적으로 변화를 일으킬 태세를 갖추고 있다.
 
인텔 할라 포인트 ⓒ Intel

뉴로모픽 컴퓨팅은 인간의 뇌가 작동하는 방식에 착안해 컴퓨터 칩을 만드는 방법을 재설계하고자 하는 기술이다. 예를 들어 인간의 뉴런은 처리와 메모리 저장을 모두 처리하지만 전통적인 컴퓨터에서는 이 둘이 분리되고, 데이터를 주고받는 데 시간과 에너지가 소비된다.
 
뉴런은 필요할 때만 움직이므로 에너지 소비가 한층 더 줄어든다는 것도 장점이다. 옴디아(Omdia) 애널리스트 리안 치예 수는 "결과적으로 뉴로모픽 컴퓨팅은 기존 GPU 아키텍처를 한참 뛰어넘는 막강한 병렬 컴퓨팅 역량을 제공한다. 또한 에너지 소비와 효율성 측면에서도 더 우수하다”라고 말했다.
 
가트너는 뉴로모픽 컴퓨팅이 "핵심적인 실현 기술"로, 광범위한 시장에 걸쳐 기존 질서를 무너뜨릴 잠재력이 가장 크지만 실제로 영향을 미치기까지는 아직 3~6년의 시간이 더 필요하다고 분석했다.
 
한편 인텔은 중요한 이정표를 달성했다. 오늘 인텔은 세계 최대의 뉴로모픽 컴퓨터를 미국 샌디아 국립연구소에 설치했다고 발표했다.
 
인텔 로이히(Loihi) 2 프로세서를 사용하며 할라 포인트(Hala Point)라는 코드명이 부여된 이 컴퓨터는 초당 최대 2경 번의 연산을 지원하며, 와트당 1초에 8비트 연산 15조 번 이상을 처리하는 효율성을 갖췄다. 이 모든 것이 대략 전자레인지 하나 크기의 패키지 안에 들어간다. 최대 11억 5,000만 개의 뉴런과 1,280억 개의 시냅스를 지원하는데, 이는 올빼미의 뇌 수준이다.
 
인텔에 따르면 할라 포인트는 실시간 AI 워크로드에서 CPU 및 GPU 기반 아키텍처의 효율성과 성능을 넘어서는 최초의 대규모 뉴로모픽 시스템이다. 인텔은 로이히 기반 시스템이 CPU 및 GPU 아키텍처보다 100배 더 적은 에너지를 사용해서 50배 더 빠르게 AI 추론을 수행하고 최적화 문제를 해결할 수 있다고 설명했다.
 
또한 인텔 뉴로모픽 컴퓨팅 연구소 디렉터인 마이크 데이비스는 이 시스템의 가능성을 연구하는 데 관심이 있는 기업이 현재 무료로 사용할 수 있다고 말했다.
 
시작하려면 기업은 먼저 인텔 뉴로모픽 리서치 커뮤니티(Intel Neuromorphic Research Community)에 가입해야 한다. 기사 작성 시점 현재 GE, 히타치, 에어버스, 액센추어, 로지텍, 여러 연구 기관 및 대학 등 200 곳 이상의 기업과 조직이 회원사로 참가하고 있다. 데이비스는 지금은 대기 명단에 등록해야 하지만 참가 비용은 전혀 없다고 덧붙였다.
 
데이비스는 "유일한 요구사항은 하드웨어를 계속 개선할 수 있도록 시스템 사용 결과와 발견 사항을 공유하는 것"이라고 말했다. 회원이 되면 클라우드 기반 뉴로모픽 컴퓨팅 리소스에 무료로 액세스할 수 있으며 프로젝트에 대한 관심이 크다면 온사이트 하드웨어도 무료로 제공된다.
 
데이비스는 "현재 할라 포인트는 샌디아에 위치한 하나뿐이지만 더 만드는 중이고, 할라 포인트보다 작은 규모의 다른 시스템도 있다. 인텔 가상 클라우드 계정이 제공되므로 회원사는 로그인해서 원격으로 시스템에 액세스할 수 있다”라고 말했다. 
 
ⓒ Intel Corporation

데이비스에 따르면 인텔은 전통적인 제조 기술과 디지털 회로 방식을 고수해서 실용적인, 사용 가능한 뉴로모픽 컴퓨터를 만들 수 있었다. 아날로그 회로 같은 다른 방식도 있지만 제조하기가 더 어렵다.
 
로이히 2 프로세서는 메모리와 처리를 결합하는 등 다수의 뉴로모픽 컴퓨팅 원리를 사용한다. 데이비스는 "인간의 뇌에서 발견되는 아키텍처 측면의 모든 특징을 실제로 적용하고 있다”라고 말했다.
 
데이비스는 이 시스템이 실시간으로 계속 학습할 수도 있다면서 "뇌가 항상 하는 일과 마찬가지"라고 말했다.
 
기존 AI 시스템은 특정 데이터 집합을 사용해 학습하고 일단 학습이 된 다음에는 변경되지 않는다. 로이히 2에서는 뉴런 간의 통신을 구성할 수 있고, 이는 시간 경과에 따라 변화될 수 있음을 의미한다.
 
작동 방식은 우선 기존대로 AI 모델이 학습된 다음 뉴로모픽 컴퓨터에 로드된다. 각 칩에는 전체 모델의 일부만 포함된다. 예를 들어 모델로 스트리밍 영상을 분석할 때 칩은 메모리에 이미 모델 가중치를 갖고 있으므로 빠르게, 필요할 때만 처리 작업을 수행한다. 데이비스는 "프레임과 다음 프레임 사이에서 픽셀 하나가 변경되거나 이미지의 한 부분이 변경된다면 전체 이미지를 다시 계산하지 않는다”라고 말했다.
 
데이비스는 최초 학습이 다른 곳에서 이뤄진다는 점은 인정했다. 또한 뉴로모픽 컴퓨터는 시간 경과에 따라 특정 가중치를 업데이트할 수 있지만 전체 네트워크를 처음부터 다시 학습시키는 것은 아니다.
 
데이비스는 이 방식이 특히 엣지 컴퓨팅에 유용하며 스트리밍 영상, 소리, 무선 신호를 처리하는 용도로 적합하지만 데이터센터와 고성능 컴퓨팅 애플리케이션에도 사용할 수 있다고 설명했다.
 
데이비스는 "우리가 발견한 가장 효과적인 워크로드는 최적화 문제 해결"이라며 "지도 또는 그래프를 통해 최단 경로를 찾는 등의 작업이다. 스케줄링, 물류 등이 이 아키텍처에서 대체로 매우 잘 작동한다”라고 말했다.
 
데이비스는 사용 사례가 양자 컴퓨팅의 사용 사례와 겹친다는 점은 놀라웠다면서 "그러나 인텔은 지금까지 10억 개의 뉴런 시스템을 출하해서 실행 중이다. 큐비트 몇 개와는 상황이 다르다”라고 말했다.
 
이 기술을 인텔만 추진하는 것은 아니다. 옴디아의 수에 따르면 IBM을 비롯한 여러 업체가 클라우드 AI 컴퓨팅을 위한 뉴로모픽 칩을 개발했으며, 브레인칩(BrainChip), 프로페시(Prophesee) 같은 기업은 디바이스와 엣지 애플리케이션을 위한 뉴로모픽 칩을 판매하기 시작했다.
 
그러나 수는 뉴로모픽 도입에는 여러 가지 큰 장애물이 있다고 말했다. 무엇보다 뉴로모픽 컴퓨팅은 이벤트 기반 스파이크를 기반으로 하는데, 이를 위해서는 프로그래밍 언어가 완전히 바뀌어야 한다.
 
수는 이벤트 주도 AI 모델도 극소수라며 "현재로서는 대부분의 AI 모델이 기존 컴퓨팅 아키텍처에 맞춰 설계되는 전통적인 신경망을 기반으로 한다”라고 말했다.
 
마지막으로 수는 이러한 새로운 프로그래밍 언어와 컴퓨팅 아키텍처는 기존 기술과 호환되지 않는다면서 "지금은 너무 미성숙한 상태다. 레거시 아키텍처와 역호환되지 않는다. 또한 개발자와 소프트웨어 생태계 규모도 여전히 매우 작고, 툴과 모델에서 선택의 여지도 별로 없다”라고 지적했다.
editor@itworld.co.kr 
Sponsored

회사명 : 한국IDG | 제호: ITWorld | 주소 : 서울시 중구 세종대로 23, 4층 우)04512
| 등록번호 : 서울 아00743 등록발행일자 : 2009년 01월 19일

발행인 : 박형미 | 편집인 : 박재곤 | 청소년보호책임자 : 한정규
| 사업자 등록번호 : 214-87-22467 Tel : 02-558-6950

Copyright © 2024 International Data Group. All rights reserved.