01
Gemini 3.5 Flash — 성능 개요
00:41
Gemini 3.5 Flash는 "빠르고 저렴한 모델"로 알려진 Flash 시리즈인데, 성능이 Claude Opus 4.7과 GPT 5.5를 일부 벤치마크에서 능가하는 수준으로 크게 향상됐습니다.
- Terminal Bench 2.1, SWE-Bench Pro (소프트웨어 엔지니어링 벤치마크), MCP Atlas, Finance Agent 등 다수 1위
- 특히 AI 코딩·에이전트 실행·도구 사용 영역 강세
- Google I/O 2026에서 Antigravity(구 Firebase) 통합 발표
주의: Flash 시리즈는 원래 저렴한 모델이었으나 3.5 Flash에서 출력 비용이 대폭 인상됐습니다. 대량 사용 전 비용 계산 필수.
| 모델 | 입력 (백만 토큰당) | 출력 (백만 토큰당) |
| Gemini 2.5 Flash (이전) | $0.30 | $2.50 |
| Gemini 3.5 Flash (신규) | 미공개 | 약 $9 (추정) |
| Claude Opus 4.7 (참고) | 약 $15 | 약 $75 |
토큰(token): AI가 텍스트를 처리하는 기본 단위. 대략 한국어 단어 1~2개에 해당.
03
Antigravity 2.0 — 에이전트 퍼스트로 전환
05:57
| 항목 | 이전 버전 | Antigravity 2.0 |
| 메인 화면 | 코드 편집기 중심 | 에이전트 패널 중심 |
| AI 사용 방식 | 편집기 안에서 AI 보조 | 에이전트가 계획 수립 → 승인 → 실행 |
| 편집기 접근 | 기본 포함 | 별도 IDE 다운로드·설치 필요 |
| 핵심 철학 | AI가 도와주는 코딩 | 에이전트가 알아서 하는 개발 |
프롬프트 입력
→
구현 계획(Plan) 자동 생성
→
사용자 승인 (Proceed)
→
파일 수정 실행
→
Diff 모드에서 변경 확인
- 매 프롬프트마다 계획을 먼저 보여주고 사용자 확인 후 실행 (안전장치)
- 예약 실행(Scheduled Tasks): 이름·프로젝트·일정·프롬프트 설정 → 자동 반복
- CLI(명령줄 인터페이스): 터미널에서 claude 명령어로 바로 사용 가능
05
자율 테스트 에이전트 (QA 자동화)
13:43
QA(Quality Assurance, 품질 검사)를 사람 대신 AI 에이전트가 자동으로 수행합니다. 웹앱 전체를 직접 탐색하며 테스트 항목을 스스로 생성하고 실행합니다.
MCP 테스트
API(앱 간 통신 인터페이스) 연결 상태와 기능을 자동으로 테스트
웹 테스트
실제 배포된 웹사이트를 AI가 직접 클릭·탐색하며 오류 발견
리포트
19개 테스트 자동 생성 → 화면 녹화 + 합격/실패 분류 + 상세 리포트
긍정: 에이전트 설계
복잡한 개발 워크플로우를 계획→승인→실행으로 자동화. 전체 개발 프로세스 운영 가능
긍정: QA 자동화
테스트 항목 생성부터 실행·리포트까지 자동. 품질 검사 시간 대폭 단축
주의: 가격·UX
출력 비용 9배 인상, IDE 별도 설치 필요, 신규 출시로 실전 검증 필요