구글 주장: 12B는 코딩·에이전트 툴 호출·추론 벤치마크에서 26B 대비 대부분 10% 이내 격차 — 크기는 절반 이하. 영상 1:04
OS가 2~3GB를 상시 점유. 실측: 모델 로드만으로 메모리 6GB → 14.9GB. Claude Code 등 에이전트 도구는 기본 프롬프트만 약 3만 토큰이라 31K 설정으로는 연결 즉시 에러. 영상 4:49
| 테스트 | 방법 | 결과 |
|---|---|---|
| 대화 응답 | LM Studio 채팅 | 약 11.7 토큰/초 — 무난 |
| 인보이스 OCR | 이미지 드롭 후 금액 추출 (7:01) | 잔액 1298을 1296으로 오독 — 숫자 정확도 미흡 |
| 코딩 + 로컬 API | 인보이스 파서 웹앱 생성 → LM Studio 서버 연결 (13:41) | 앱 동작 성공, 단 OCR 오류는 동일 |
범용 모델 하나에 의존하지 말고 여러 경로의 추출 결과를 비교 — 사람 개입 없이 정확도 확보. 영상 9:44
스팸 필터링과 중요 메일 표시를 데이터 유출 없는 무료 로컬 AI로 처리. 제작자의 목표: 주당 1시간 절약.
수신 인보이스에서 금액·항목 추출 후 DB 기록. 단 전용 OCR 모델과 교차 검증 필수.
LM Studio 서버 URL 하나로 자작 앱에 AI 연결. 구독료 0원, 프라이버시 보장.