메뉴 건너뛰기

聚仙閣

I T소식

뉴스 32코어에서 64코어로 두 배 증가

세걸 2018.11.07 19:27 조회 수 : 840

사실상 4코어에 머물던 메인스트림 CPU 시장. 라이젠으로 단숨에 그 두 배인 8코어 시대를 연 AMD가, 최대 64코어를 구성의 2세대 젠 아키텍처(Zen2) 기반 2세대 에픽(EPYC) 프로세서를 공개했다.

 

64코어와 8+1 모듈 디자인의 7nm Zen2 서버용 CPU, AMD 2세대 에픽

AMD는 라이젠 이후 16코어 '라이젠 스레드리퍼'로 하이엔드 데스크탑 프로세서 시장에 진입하며, 경쟁사인 인텔이 10코어에 머물던 상황을 뒤흔들었으며, 이후 2세대 '라이젠 스레드리퍼'는 그 두 배인 최대 32코어로 확대했다.

이러한 코어 확대 움직임은 투자자들을 대상으로 예고했던 Next Horizon 이벤트서도 이뤄졌는데, 최대 32코어였던 AMD의 1세대 서버용 프로세서인 에픽의 코어가 단숨에 그 두 배인 64코어로 확대되었다.

 

현장에서 공개된 7nm 공정과 Zen2 아키텍처가 적용된 2세대 에픽(Rome) 프로세서는, 일부에서 예상되었던 것과 같이 8개의 CPU 모듈과 독립적인 I/O 모듈이 더해진 8+1코어 구성이 사실로 드러났다. CPU 코어의 경우 예고된 것처럼 TSMC 7nm 공정이 적용되며, 다이 중앙의 I/O 모듈은 14nm 공정이 적용된다.

 

I/O와 관련해서 구체적인 언급은 없었지만 PCIe 4.0 규격을 지원해 데이터센터에서 요구되는 고 대역폭 지원에 유리한 면모를 보이며, 성능과 관련해서는 1세대 에픽과 비교해 소켓당 컴퓨트 성능은 두 배, 부동 소수점 연산 성능은 네 배까지 향상되었다.

이렇게 개선된 AMD의 2세대 에픽 프로세서 싱글 소켓 서버는 C-Ray 벤치마크에서 인텔의 듀얼 프로세서 제온 서버를 뛰어넘는 성능을 발휘했음을 내세웠다.

 

AMD에 따르면, 7nm 공정 덕에 14nm 공정 대비 밀도는 2배, 동일 성능에 소비전력을 절반으로 줄었으며, 동일 전력일 때는 1.25배 이상의 성능을 기대할 수 있게 되었으며, 이는 경쟁사의 10nm 공정보다도 빨리, 고객사들에 더 나은 전성비를 제공할 수 있게 된 것이라는 점을 강조했다.

 

Zen2 아키텍처에 대해서는 실행 파이프라인 개선, 분기 예측자 개선과 명령어 프리패칭 향상, 명령어 캐시 최적화, 더 커진 Op 캐시, 256bit로 두 배 확장된 부동 소수점 폭, 역시 두 배 확대된 로드 / 스토어(Load / Store) 대역폭, 여기에 두 배에 달하는 코어 밀도, 절반 수준으로 개선된 운영 전력 등을 통해 두 배의 스루풋을 구현했다.

또한, 올해 초 터진 초대형 보안 이슈인 스펙터 대응을 위해 하드웨어 기반의 스펙터 완화 조치 및 유연성을 높인 메모리 암호화 조치를 취했으며, 1세대 에픽 서버 플랫폼과 소켓 호환성을 유지하는 것은 물론, 차세대 에픽 프로세서인 밀란(Milan)과의 호환성도 제공한다.

 

현재 7nm 공정의 Zen2(에픽)는 샘플링 단계, 그 뒤를 이을 7nm+ 공정의 Zen3는 순조롭게 개발 중이며, Zen4는 디자인이 진행 중이다.

한편, 인텔은 AMD의 넥스트 호라이즌에 앞서 차세대 서버용 프로세서인 캐스캐이드 레이크 어드밴스드 퍼포먼스 프로세서(Cascade Lake advanced performance)를 발표하였다. 해당 프로세서는 여전히 14nm 기반이지만 MCP 방식을 도입해 최대 48코어를 구현하였으며, AMD 에픽과 같이 듀얼 소켓 서버를 타겟으로 한 제품이다.

인텔의 새로운 서버용 프로세서는 2019년 상반기 출시될 예정으로, 비슷한 시기에 출시될 것으로 예상되는 AMD의 2세대 에픽(코드네임 Rome)과 직접적인 대결을 피할 수 없는 형국인데, 시장에서는 어느쪽의 손을 들어줄지 귀추가 주목된다.

 

클라우드를 위해 디자인된 라데온 인스팅트 MI60, PCIe 4.0과 HW 가상화 지원

AMD는 2세대 에픽과 함께 7nm 기반의 라데온 인스팅트(Radeon Instinct) 시리즈에 대한 정보도 공개했다.

세계 첫 7nm 공정 GPU로 소개된 라데온 인스팅트 MI60은 업계 유링의 하드웨어 가상화 GPU인 점이 강조되었으며, 2세대 에픽과 같이 7nm 공정 도입에 따라 2배로 늘어난 밀도, 동일한 클럭서 절반으로 줄어든 전력, 동일 전력시 1.25배 이상 늘어난 성능이 특징이다.

 

머신 러닝을 위한 추론 및 훈련, 가상화 머신 서비스등을 위한 엔터프라이즈용 제품인 만큼 CPU와의 대량의 데이터 통신을 위해 2세대 에픽에 도입된 PCIe 4.0을 공식 지원하며, 이를 통해 CPU와 GPU간 양방향 64GB/s 대역폭, 인피니티 패브릭 기반의 GPU간 100GB/s 링크 대역폭을 구현한다.

라데온 인스팅트 MI60은 하드웨어 가상화를 통해 소프트웨어 오버헤드 감소와 데이터 고립을 통한 보안 강화, 단일 GPU로 최대 16 가상머신을 구현하거나, 한 대의 가상 머신 구현에 여덟대의 GPU를 지원하는 유동적 구성도 가능하며, 뛰어난 멀티 GPU 스케일링 성능을 제공한다.

 

앞서 컴퓨텍스서 공개한 것과 같이 최대 32GB의 2세대 HBM 메모리 바탕의 1TB/s에 달하는 대역폭, 에러 감지 및 수정 기능이 제공된다. 성능면에서는 HPC 작업을 위한 FP64 7.4TFLOPS,머신 러닝 훈련과 추론을 위한 FP32 성능 14.7TFLOPS 및 INT4 성능 118 TOPS를 제공한다.

라데온 인스팅트는 오는 2018년 4분기 출시 예정이며, 이 자리에서 7nm Vega 아키텍처 기반 제품의 게이밍 모델 출시 계획은 언급되지 않았지만, 기존 유출 정보들에 따르면 일반 게이머들 대상 제품 역시 출시될 것으로 알려졌다.

 

 


이상호 기자 / ghostlee@bodnara.co.kr


[관련기사]

더 빠른 메인스트림 8코어 CPU는?, 라이젠 7 2700X vs 코어 i9-9900K
실시간 레이트레이싱을 위한 VGA 마지노선?, 기가바이트 지포스 RTX 2070 게이밍 OC
메인스트림 8코어 CPU 성능의 대가는?, 인텔 코어 i9-9900K 알아보기
하반기 게이머들의 CPU 업그레이드 고민,연말 대작들의 멀티 코어 활용도는?
실시간 레이트레이싱 시대를 열다, 기가바이트 지포스 RTX 2080 게이밍 OC

 

 

 

 
Creative Commons License 보드나라의 기사는 저작자표시-비영리-변경금지 2.0 대한민국 라이선스에 따라 원본 배포처에서 이용할 수 있습니다. Copyright ⓒ 넥스젠리서치(주) 보드나라 원본 배포처 가기

 

번호 제목 글쓴이 날짜 조회 수
7 홈서버, 자작나스(운영체제) file 세걸 2022.11.23 816
6 홈서버, 자작나스(하드웨어) file 세걸 2022.11.12 728
5 VPU 세걸 2021.11.16 849
4 DPU file 세걸 2021.03.30 869
3 DPU 시장 세걸 2021.03.07 735
2 DPU file 세걸 2021.02.16 1158
» 32코어에서 64코어로 두 배 증가 세걸 2018.11.07 840
위로