01핵심 개요
| 항목 | 내용 |
|---|
| 형식 | 안될공학 × 엔비디아 부사장 단독 인터뷰 (키노트 직후) |
| 핵심 주제 | 에이전틱 AI = 새로운 종류의 워크로드 |
| 키워드 | Unbounded Autonomy · 하네스 · Open Shell · Nemotron |
| 핵심 주장 | "유용한 AI가 도착했다 — 전부 에이전틱 AI 덕분" |
| 도입 조언 | 데모 말고 비즈니스 핵심 기능에 타이거 팀 투입 |
02챗봇 → 에이전틱 AI 전환
- 챗봇+RAG: 프롬프트 → 응답 반복, 환각 줄이고 도메인 질문 응답 수준
- 에이전틱 AI: 추론으로 계획 수립 → 맥락 이해 → 도구 활용(DB·코드 인터프리터) → 실행
- 목표만 주면 4~7시간 자율 작업으로 실제 결과물 달성 (2:18)
- 단일 프롬프트가 추론·검색·도구사용·응답생성의 긴 워크플로우로 확장 → "새로운 종류의 워크로드"
03PoC → 프로덕션의 벽
- Unbounded Autonomy 문제: 제한 없는 AI는 뭐든 할 수 있으나 기업에선 위험
- 신입사원 비유: 입사 첫날 모든 시스템 권한을 주지 않는 것과 동일 — 가드레일 필수
- 해법 = NVIDIA 에이전트 툴킷 3요소
- Nemotron: 오픈 모델 패밀리 - 하네스(Hermes): 도구·오케스트레이션 모음 - Open Shell: 보안 런타임 — 런타임에서 접근 가능 시스템·추론 위치를 강제
- 엔비디아 내부도 동일 스택 사용 (부사장 본인: Hermes 하네스 + Nemotron + Open Shell)
04비용 경제학 — 토큰이 아닌 "완수된 작업" 기준
- 토큰 단가는 하락 중이나 소비량은 폭증 — 제번스 역설(효율↑ → 사용량↑)
- 측정 지표 전환: 토큰당 비용 → 완수된 작업당 비용(cost per completed task)
- 컴퓨트의 탈중앙화: 데이터센터·클라우드 → DGX Spark, RTX 노트북 등 디바이스로 확산
- 최대 가치는 생산성이 아니라 "이전엔 불가능했던 신시장 개척"
05오픈 모델 전략 — 에이전트는 "모델들의 시스템"
- 이분법 거부: 클라우드 프런티어 API vs 오픈 모델이 아니라 둘의 조합
- 엔비디아 내부 에이전트도 Anthropic Opus·ChatGPT(오케스트레이션·플래너) + 특화 포스트트레이닝된 Nemotron(리서치·도메인 코딩) 혼용
- 엔비디아식 오픈소스 = 체크포인트 + 사전·사후학습 데이터셋 + RL 기법 + 논문 전부 공개
- 오픈의 가치: ① 도메인 특화 포스트트레이닝 가능 ② 내부 동작 투명성 → 신뢰
06칩 설계 검증 사례 — Cadence 협업
- CUDA-X 라이브러리를 에이전트 스킬로 변환해 활용
- 자율 엔지니어가 RTL 검증 워크플로우를 기존 대비 약 40배 가속
- 코파일럿(질문→응답)이 아니라 목표 달성까지 다회 반복하는 "대신 일하는 존재"
- 인간 개입 수준(human-in-the-loop)은 사용자가 선택
- 결과: 더 많은 칩 설계 가능 — 생산성 넘어 불가능했던 일의 실현
07도입 기업을 위한 현실적 출발점
- 소프트웨어 개발이 가장 명확한 첫 사례: Claude Code·Cursor·Codex 사용자 = 10~30배 속도
- 원칙: 너무 크게 시작하지 말되, "nice-to-have" 기능도 고르지 말 것
- 타이거 팀 구성 → 비즈니스 핵심 기능 1개 선택 → 관측가능성·정책(Open Shell)·트레이스 수집까지 끝까지 완주 → 그 후 타 부서 확장
- 배포 환경은 이미 멀티: 클라우드(오케스트레이터) + 온프레미스 AI 팩토리 + DGX Spark 같은 디바이스 혼합이 현실
08용어 사전
| 용어 | 한줄 설명 | 비유/예시 |
|---|
| 에이전틱 AI | 목표를 주면 계획·도구사용·실행까지 스스로 하는 AI | 지시만 받는 비서가 아니라 일을 끝내오는 직원 |
| RAG | 외부 문서를 검색해 답변에 근거로 붙이는 기술 | 오픈북 시험처럼 자료 보며 답하기 |
| 하네스(Harness) | 모델이 쓸 도구·오케스트레이션을 묶은 실행 틀 | 작업자에게 주는 공구벨트 |
| Open Shell | 에이전트의 시스템 접근을 런타임에 강제하는 보안 층 | 출입증 권한이 정해진 사원증 |
| Nemotron | 엔비디아의 오픈 모델 패밀리(nano/super/ultra) | 용도별 크기로 나온 공용 엔진 |
| PoC | 개념 검증용 시제품 단계 | 시식 코너 — 팔기 전 맛보기 |
| 제번스 역설 | 효율이 좋아질수록 총 사용량이 늘어나는 현상 | 연비 좋은 차가 나오자 더 많이 운전 |
| 타이거 팀 | 핵심 과제에 집중 투입되는 소수 정예 팀 | 특수임무 전담반 |
| RTL 검증 | 칩 설계 회로의 동작을 사양대로 검사하는 작업 | 건축 도면대로 지어졌는지 감리 |
| Human-in-the-loop | 자동화 과정에 인간 검토를 끼워 넣는 방식 | 자동 번역 후 사람이 최종 교정 |