조코딩 JoCoding | 2026-05-10
주간 AI/IT 뉴스 브리핑
GPT-Realtime-2 · 앤트로픽 SpaceX 계약 · SubQ · Gemma 4 MTP · ERNIE 5.1 외
14+주요 뉴스
3종GPT Realtime 신모델
2배Claude 사용한도 확대
1200만SubQ 토큰 컨텍스트
01
OpenAI — GPT Realtime 2 시리즈 3종 공개
음성 입력실시간 처리
GPT-5급 추론내장 통합
함수 호출MCP 연동
음성 출력초저지연
GPT Realtime 2
추론 내장 음성 모델
음성↔음성 실시간 대화 + GPT-5급 추론 + 함수 호출. 오디오 1M 토큰 $32(입력) / $64(출력)
GPT Realtime Translate
실시간 통번역 전용
70개 입력 언어 → 13개 출력 언어. 분당 $0.03 — 시급 환산 약 3,000원 수준. 통번역 직군 위협
GPT Realtime Whisper
실시간 전사 모델
음성 → 텍스트 실시간 변환 전용. auto-presto 오픈소스 활용 시 말하는 동안 Excalidraw 슬라이드 자동 생성
02
Anthropic — SpaceX 컴퓨트 계약 · Claude 한도 2배 확대 · Mithosis 16시간
SpaceX Colossus 데이터센터 전체 컴퓨팅 용량 계약
NVIDIA GPU 5만개+ 확보 → Claude Code·API 한도 2배, 피크 시간대 제한 제거
배경 추측내용
전략적 제공OpenAI 소송 중인 일론 머스크가 경쟁사 지원
여유 자원 판매Grok 대비 사용량 적은 컴퓨팅 자원 수익화
Google 투자구글로부터도 투자 유치 진행 중
Claude Mithosis (미소스)
LM Time Horizon 16시간 돌파
인간 전문가 16시간 분량 소프트웨어 작업 수행 가능. "16시간 이상은 측정 불가"라는 Meter 발표. Opus 4.6(12시간) 대비 대폭 향상.
Claude Code 업데이트
모바일 원격 제어 (Remote Control)
Claude 앱에서 데스크탑 Claude Code 원격 조작 가능. Codex CLI에도 동일 기능 추가 (Mac 우선).
03
Google — Gemma 4 MTP 3배 가속 · Gemini 3.1 Flash Lite · Chrome AI 논란
Gemma 4 MTP 작동 원리: 소형 드래프터가 먼저 여러 토큰 예측 → 메인 모델이 일괄 검증 → 토큰 재사용 → 최대 3배 속도, 품질 저하 없음
Gemma 4 MTP
오픈소스 3배 속도 향상
커뮤니티 리버스 엔지니어링으로 발견. 삭제된 122B 모델 존재 의혹 → Google I/O 공개 가능성
Gemini 3.1 Flash Lite
초저가 경량 모델 GA
100만 토큰 입력 $0.25, 출력 $1.5. 영상·오디오 처리 포함. Google AI Studio 무료 사용 가능
Chrome AI 논란
동의 없이 Gemini Nano 4GB 설치
Chrome 설치 시 자동으로 가중치 파일 배포. 개발자 입장: 온디바이스 AI 공짜 인프라. 투명성 문제 논란
Google 기타 소식내용
AlphaEvolve 확장유전체 분석 오류 30% 감소, 전력망 탐색 88% 향상, 양자 물리학 적용
Gemini API Webhook장시간 AI 작업 완료 시 콜백 알림 기능 출시 (에이전트 워크플로우 용이)
Formily 카탈로그제품 URL 입력 → 브랜드 맞춤 광고 이미지 자동 생성
Google HealthFitbit 인수 → Fit Air 웨어러블 + 헬스 코치 AI 앱 출시. AI Pro/Ultra 구독 포함
04
오픈소스 역전 — Kimi K2.6 · ERNIE 5.1 · DeepSeek V4 Flash 온디바이스
Claude Opus 4.6
프론티어
GPT-5.5
프론티어
Kimi K2.6 (오픈소스)
코딩 1위
ERNIE 5.1 (바이두)
프론티어 수준
Gemma 4 31B (오픈소스)
추론 우수
DeepSeek V4 Flash — 온디바이스
M5 MacBook Max(128GB)에서 로컬 실행
158B 파라미터를 2비트 양자화. DS4 오픈소스 공개 (Redis 창립자). M3 Max 기준 생성 속도 26.68 토큰/초. 조코딩이 M5 Max로 직접 테스트 예정.
HydeDream 이미지 모델
8B 오픈소스, Flux 2 초과 성능
텍스트 렌더링 우수, 글씨 깨짐 없음. 클로즈드 소스 프론티어 모델과 견주는 오픈 웨이트 이미지 모델 등장.
05
SubQ 1,200만 토큰 · Grok Computer · X Money · 미국 정부 UFO
SubQ (진위 논란)
1,200만 토큰 컨텍스트
책 120권 = 한 세션에 담기. Flash Attention 대비 52배 빠름. Opus 비용의 5% 미만 주장. 얼리 액세스만 제공, 사기 의혹도 존재.
Grok Computer
파일 시스템 + CLI 전체 접근
파일 읽기·명령어 실행·코드베이스 편집 가능. 5월 8일 공개. 현재 미국 우선 출시.
X Money
일론 머스크 디지털 은행 출시
금속 비자 카드·구매 3% 캐시백·연 6% 이자(은행의 15배)·무료 P2P 송금. 월 6억 명 X 사용자 대상.
Claude + Ollama
로컬 모델 데스크탑 앱 연동
Claude 데스크탑 앱에서 Ollama 연결 → Kimi K2.6 등 로컬 모델 무료 사용 가능. 토큰 소진 시 로컬 전환 활용.
GPT 5.5 Instant
빠른 기본 모델 채택
기본값으로 변경. 허위 주장 52.5% 감소, 부정확한 답변 37.3% 감소. 의학·법률·금융 분야 개선.
미국 정부 UFO
국방부 .gov 사이트 공식 공개
오피셜 정부 웹사이트에 미확인 비행물체 영상·사진 1차 공개. 달 촬영본 포함. 추가 공개 예정.
06
핵심 인사이트 — 이번 주 AI 트렌드
트렌드내용영향
음성 AI 실시간 통번역 비용 시급 3,000원 수준 통번역·동시통역 직군 위협 현실화
컴퓨팅 전쟁 Anthropic-SpaceX 계약, Claude 한도 2배 AI 회사 간 컴퓨팅 자원 확보 경쟁 심화
오픈소스 역전 Kimi K2.6이 코딩 벤치마크 1위 유료 프론티어 모델 우위 흔들림
온디바이스 AI Chrome에 Gemini Nano 자동 탑재, DeepSeek 로컬 실행 별도 API 없이 온디바이스 AI 서비스 구현 가능
에이전트 진화 Claude Mithosis 16시간, LM Time Horizon 급상승 인간 전문가 수일치 작업의 AI 대체 임박