업계 최초 시간 기반 메타데이터 추출(TBM) 방식으로, 자연어 명령 하나로 영상의 구간·시간 코드·맥락을 자동으로 JSON 구조화한다. 단순 질의응답을 넘어 영상 콘텐츠를 데이터베이스화하는 새로운 패러다임.
| 구분 | 페가수스 1.2 | 페가수스 1.5 |
|---|---|---|
| 작동 패러다임 | 검색(Search) | 구조화(Structure) |
| 출력 형태 | 텍스트 답변 | 구조화 JSON (시간 코드) |
| 사용자 인터페이스 | 질의응답형 | 자연어 명령형 |
| 다운스트림 통합 | 수동 후처리 필요 | API 파이프라인 직결 |
"뉴스 앵커가 바뀔 때마다 구간을 나눠줘" — 별도 설정 없이 지시문 하나로 시작
저수준 시각(편집·앵글) + 고수준 맥락(대화 주제) + 오디오(발화자 교체)를 동시 처리
~350ms 오차 이내 경계 검출, 시작·종료 타임스탬프 자동 태깅
각 구간의 시간 코드 + 의미 설명을 JSON으로 반환 → 엔터프라이즈 파이프라인 직접 연결
| 포지셔닝 | 영상 특화 버티컬 AI로 OpenAI·Google 범용 모델과 차별화. "영상 구조화"라는 틈새를 선점. |
| 시장 트렌드 | 영상 AI 경쟁이 "이해(comprehension)"에서 "구조화(structuring)"로 이동하는 신호탄. |
| 엔터프라이즈 전략 | JSON 출력 + API 설계로 기업 파이프라인 통합 용이 → 채택 장벽 낮춤. |
| 향후 과제 | 일반 API 공개 시기 미확인. 다국어·비구어 콘텐츠(음악 영상 등) 대응 범위 불명확. |