01핵심 개요
| 항목 | 내용 |
|---|
| 인터뷰이 | 샤르 나라심한 — 엔비디아 AI·DC GPU 제품 마케팅 총괄 디렉터 |
| 장소·계기 | GTC 타이페이 키노트 직후, 루빈 GPU 출시 임박 시점 |
| 핵심 화두 | AI 팩토리 = 가치를 생산하는 인프라 |
| 평가 지표 변화 | 절대 성능 → 토큰당 비용·와트당 토큰·GPU 가동률 |
| 신규 칩 | 베라(Vera) CPU — 에이전틱 AI 전용 설계 |
| 차세대 플랫폼 | 베라루빈 — GPU·CPU·네트워크·SW 통합 설계 |
02핵심 내용 구조
- AI 팩토리 개념: 데이터를 스스로 처리해 토큰(=매출)을 찍어내는 공장으로 데이터센터를 재정의.
- 고객 1순위 지표: 토큰당 비용 최소화 → 이익 극대화. "토큰을 만들 수 있는 자는 즉시 팔 수 있다"는 초과 수요 상황.
- 2순위 지표: AI 팩토리 구축 속도(레퍼런스 디자인 채택)와 수명(SW 개선으로 가동기간 연장).
- 에이전틱 추론: 1회성 질의응답이 아닌, 계획·검색·도구사용·코드실행이 얽힌 긴 워크플로우로 진화.
03기술적 맥락
- NVFP4: 엔비디아가 선도한 4비트 부동소수점 포맷. 텐서·스케일링 팩터까지 포함해 FP8 파라미터를 FP4로 압축, 저장공간을 최소화.
- 병목 이동(holistic 설계): GPU 가속 → 스토리지 병목 → 네트워크(멜라녹스 인수) → CPU 병목 → 자체 CPU 개발. 한 곳을 빠르게 하면 다음 병목이 드러나는 연쇄.
- 에이전틱 루프는 한 요청이 160회 이상 반복 호출로 확장 → 초고속 GPU + 검증용 고속 CPU 동시 필요.
04전략적 의미
- 엔비디아는 칩 단품 경쟁이 아니라 "AI 팩토리 전체 워크플로우"를 파는 회사로 포지셔닝.
- 자체 연구팀(Nemotron 3 등 오픈소스 모델)을 통해 차세대 워크로드 수요를 선제 파악 → 하드웨어에 반영하는 수직 통합 전략.
- "우리는 더 큰 랙이 있다"는 경쟁사 주장에 대해, 단일 성능이 아닌 NVL72 시스템 통합 우위로 대응.
05핵심 — 베라 CPU와 익스트림 코디자인
- 베라 CPU = 에이전틱 시대를 위한 CPU. 바닥부터 재설계.
- 높은 단일 스레드/코어 성능 + 막대한 메모리 대역폭 + 다이 전체를 잇는 확장형 코히어런트 패브릭(칩렛 간 이동 시 'chiplet tax' 없음).
- 두 역할: ① GPU에 데이터를 빠르게 공급(연산 후 즉시 응답 회송) ② NVLink-C2C 기반 오케스트레이션 CPU.
- 익스트림 코디자인: GPU·CPU·인터커넥트·SW를 하나의 거대 컴퓨터처럼 동시 설계 → 베라루빈 성능 향상은 특정 한 요소가 아닌 "전부의 결합"에서 발생.
06활용 시나리오
- AI 팩토리 운영사: 토큰당 비용·구축속도·수명 3축으로 투자수익(ROI) 평가.
- 클라우드 사업자: 여전히 높은 수요의 호퍼 인스턴스처럼, 플랫폼 수명 연장으로 자본 회수 기간 확보.
- 에이전트 서비스 개발사: 160+ 턴 루프를 감당하는 GPU·CPU 균형 인프라 위에서 자율 워크플로우 구동.
07현황 및 전망
- 현재: 블랙웰이 역사상 가장 강력한 AI 칩으로 평가, 루빈 출시 임박.
- 방향: 평가 기준이 성능에서 경제성(토큰 경제)으로 완전 이동. CPU의 역할이 에이전틱 시대에 재부상.
- 관전 포인트: 베라루빈의 통합 설계가 경쟁사의 '랙 크기' 경쟁을 무력화할 수 있을지.
08용어 사전
| 용어 | 한줄 설명 | 비유/예시 |
|---|
| AI 팩토리 | 데이터를 넣으면 토큰(매출)을 찍어내는 데이터센터 | 원료를 넣으면 제품이 나오는 공장 |
| 토큰 | AI가 생성하는 텍스트의 최소 과금 단위 | 공장이 찍어내는 제품 한 개 |
| 에이전틱 AI | 스스로 계획·검색·코드실행까지 하는 자율 AI | 지시 하나로 알아서 일 처리하는 비서 |
| NVFP4 | 데이터를 4비트로 압축하는 엔비디아 포맷 | 고화질 사진을 용량만 줄여 저장 |
| 베라(Vera) CPU | 에이전틱 워크로드 전용 신형 CPU | GPU에게 재료를 빠르게 날라주는 셰프 보조 |
| NVLink-C2C | 칩 간 데이터를 초고속으로 잇는 연결 | 공장 라인 사이 컨베이어 벨트 |
| 익스트림 코디자인 | GPU·CPU·네트워크·SW를 동시 설계하는 방식 | 부품이 아니라 자동차 한 대를 통째로 설계 |