Antigravity 2.0 + Gemini 3.5 Flash 완전 분석

2026-05-23 | Astro K Joseph | 약 19분 (영어)

1위

벤치마크 다수 (Gemini 3.5 Flash)

에이전트 퍼스트

Antigravity 2.0 핵심 변화

19개

자율 테스트 자동 생성

가격 인상

Flash 이전 대비 9배 출력 비용

Gemini 3.5 Flash — 성능 개요

00:41

Gemini 3.5 Flash는 "빠르고 저렴한 모델"로 알려진 Flash 시리즈인데, 성능이 Claude Opus 4.7과 GPT 5.5를 일부 벤치마크에서 능가하는 수준으로 크게 향상됐습니다.

Terminal Bench 2.1, SWE-Bench Pro (소프트웨어 엔지니어링 벤치마크), MCP Atlas, Finance Agent 등 다수 1위
특히 AI 코딩·에이전트 실행·도구 사용 영역 강세
Google I/O 2026에서 Antigravity(구 Firebase) 통합 발표

가격 분석 — 주의 필요

04:08

주의: Flash 시리즈는 원래 저렴한 모델이었으나 3.5 Flash에서 출력 비용이 대폭 인상됐습니다. 대량 사용 전 비용 계산 필수.

토큰(token): AI가 텍스트를 처리하는 기본 단위. 대략 한국어 단어 1~2개에 해당.

Antigravity 2.0 — 에이전트 퍼스트로 전환

05:57

에이전트 퍼스트 워크플로우

07:43

프롬프트 입력

→

구현 계획(Plan) 자동 생성

→

사용자 승인 (Proceed)

→

파일 수정 실행

→

Diff 모드에서 변경 확인

자율 테스트 에이전트 (QA 자동화)

13:43

QA(Quality Assurance, 품질 검사)를 사람 대신 AI 에이전트가 자동으로 수행합니다. 웹앱 전체를 직접 탐색하며 테스트 항목을 스스로 생성하고 실행합니다.

API(앱 간 통신 인터페이스) 연결 상태와 기능을 자동으로 테스트

실제 배포된 웹사이트를 AI가 직접 클릭·탐색하며 오류 발견

19개 테스트 자동 생성 → 화면 녹화 + 합격/실패 분류 + 상세 리포트

결론 — 장점과 주의사항

19:15

복잡한 개발 워크플로우를 계획→승인→실행으로 자동화. 전체 개발 프로세스 운영 가능

테스트 항목 생성부터 실행·리포트까지 자동. 품질 검사 시간 대폭 단축

출력 비용 9배 인상, IDE 별도 설치 필요, 신규 출시로 실전 검증 필요