Arm이 기존 코어텍스(Cortex) 로드맵에 없는 중앙처리장치(CPU) 코어 라이선스를 맞춤형으로 만들어 제공하는 '코어텍스X 커스텀' 프로그램을 시작했다. 첫 제품은 코어텍스-X1로, 최신 코어텍스-A78보다 성능이 뛰어나다. 고객사로 이름을 올린 건 삼성전자다.

 

코어텍스X 커스텀 프로그램, 기존 ISA 라이선스와는 어떻게 다른가

Arm은 26일(현지 시각) 코어텍스-A78 CPU 설계자산(IP), 그래픽처리장치(GPU) IP '말리(Mali)-G78', 신경망처리장치(NPU) IP '에토스(Ethos)-N78' 등 최신 모바일 IP를 발표했다. 

 

코어텍스-X 커스텀 프로그램의 첫 번째 제품 '코어텍스-X1'은 기존 코어텍스A 시리즈보다 뛰어난 성능을 자랑한다./Arm

이번 발표에서 가장 눈에 띄었던 건 '코어텍스-X 커스텀(Cortex-X Custom, 이하 CXC)' 프로그램이다. 이 프로그램은 일반적인 코어텍스-A의 성능과 전력, 면적(PPA) 설계 범위 이상을 요구하는 고객들을 위해 특정 시장 요구를 충족하는 CPU IP를 맞춤형으로 구성해 제공한다. 이를 통해 개발된 제품은 '코어텍스-X'라는 제품군으로 명명된다.

CXC 프로그램을 활용하면 직접 고객사가 개발을 하지 않아도 원하는 성능의 CPU 코어를 Arm에서 만들어주기 때문에 개발 기간과 비용을 줄일 수 있다. 비록 Arm이 해당 코어를 자체 브랜드로 낸다는 한계가 있지만, 개발 여력이 떨어지는 업체들에게는 좋은 선택지가 될 수 있다.

Arm 측은 "Cortex-X Custom 프로그램의 커스터마이징은 주요 성능 옵션과 관련이 있지만 1MB L2 및 8MB L3 캐시와 같은 더 큰 캐시 옵션을 포함할 수도 있다"며 "이 프로그램은 파트너(고객사)들이 성능 우선 설계를 할 수 있도록 지원하기 위해 마련됐다"고 설명했다.

기존에는 맞춤형 코어를 만들기 위해 Arm의 하드웨어 명령어집합구조(ISA) 자체를 라이선스해 CPU 코어를 자체 개발해야했다. 이를 통해 자체 코어를 개발했던 업체가 퀄컴과 애플, 삼성전자였다.

삼성전자는 일명 '몽구스' 프로젝트로 이를 추진해왔지만, 지난해 하반기 프로젝트를 중단하면서 미국 오스틴에 있던 개발팀을 해체했다. 당시 업계에서는 퀄컴 또한 앞으로 Arm이 제공하는 코어 IP 레퍼런스(Reference)로만 코어 설계를 할 것이란 얘기가 돌았었는데, 삼성전자의 CPU 개발팀 해체도 이 때문이라는 관측이 있었다.

 

Arm CXC 프로그램 공식 홈페이지에는 김준석 삼성전자 상무의 멘트가 담겼다./Arm
Arm CXC 프로그램 공식 홈페이지에는 김준석 삼성전자 상무의 멘트가 담겼다./Arm

실제 CXC 프로그램의 고객사는 삼성전자다. Arm CXC 프로그램 공식 홈페이지에는 김준석 삼성전자 시스템LSI사업부 SoC개발실 상무의 멘트가 인용돼 실렸다.

다만 CXC 프로그램을 활용, CPU 성능을 기존 코어텍스 시리즈보다 높여도 실제 스마트폰의 성능 자체를 그만큼 높일 수 있는 건 아니다. 대면적 디스플레이와 고사양 게임 등으로 인해 그래픽처리장치(GPU)의 중요성은 이미 CPU만큼이나 커졌고 NPU 역시 핵심 부품으로 자리잡고 있다.

업계 관계자는 "CXC 프로그램은 ISA로 직접 코어를 설계할 때보다 개발 공수를 줄일 수 있다는 장점이 있다"며 "CPU IP는 이 프로그램을 활용하고 GPU, NPU, 소프트웨어 개발에 집중하는 게 상황에 따라 더 나을 수 있다"고 말했다.

CXC 프로그램을 통해 처음 나온 CPU 코어 IP는 '코어텍스-X1(Cortex-X1)'이다. Arm은 코어텍스-X 제품군의 차별화를 위해 마이크로 아키텍처를 업그레이드했다.

이 제품은 코어텍스-A77 대비 성능이 30% 뛰어나고, 신제품인 코어텍스-A78과 비교했을 때도 단일 스레드(정수) 성능이 22% 좋다. 머신러닝(ML) 성능은 코어텍스-A77 대비 2배다. 

 

CPU·GPU·NPU 신규 IP도 내놔

사진 제공=Arm. 

Arm은 이와 함께 신규 CPU IP '코어텍스-A78'와 GPU IP '말리-G78' 및 'G68', NPU IP '에토스-N78'을 출시했다.

코어텍스-A78은 전력 및 면적의 효율성을 더 높이는 동시에 성능 향상에 대한 요구를 충족시킨다. Cortex-A77 기반의 기기보다 1W 당 20% 향상된 유지 성능(sustained performance)을 제공하며 온디바이스 ML 성능도 뒤어나 수일동안 활용 가능하다.

다중 화면 및 대형 화면을 갖춘 폴더블 디바이스의 성능 요구 사항도 만족한다고 Arm은 설명했다.

말리-G78은 발할(Valhall) 아키텍처 기반으로, 전작(G77)보다 25% 이상 그래픽 성능을 높였다. 비동기적 최상위 등급(asynchronous top level), 틸러(tiler) 향상, 조각화 의존 추적(fragment dependency tracking)을 통해 최대 24개의 코어를 지원한다.

말리-G68은 준 프리미엄급 GPU IP다. Arm이 준 프리미엄급 GPU IP를 내놓은 건 이번이 처음이다. 이 제품은 최대 6개의 코어를 지원하면서 G78의 기능들을 모두 갖추고 있다.

에토스-N78은 이전 세대 NPU(N77) 대비 성능이 25% 향상됐다.

폴 윌리엄슨(Paul Williamson) Arm의 클라이언트 사업부 부사장 겸 총괄은 “자동화, AI, XR, 그리고 스마트폰 등 에는 보다 높은 성능 및 보안을 제공하는 기술과 더욱 확장되고 간소화된 개발자 액세스가 필요하다"며 "이러한 요구사항을 충족시키기 위해 Arm은 고유한 방식인 토탈 컴퓨팅 접근방식을 통해, 미래 혁신에 필요한 모든 구성요소가 함께 작동되도록 최적화한다”고 말했다.

저작권자 © 파이브에코(FIVE ECOs) 무단전재 및 재배포 금지