| 모델명 | MiniCPM-V 4.6 오픈소스 |
| 지원 입력 | 이미지 · 텍스트 · 영상 (멀티모달) |
| 특기 능력 | OCR, 수기 인식, 이미지 설명, 영상 분석, 시각 Q&A |
| 실채용 기업 | BMW, Volkswagen, Samsung, Lenovo, Horner |
| 실행 환경 | PC·Mac·스마트폰·엣지 디바이스 (GPU 불필요) |
| 인터넷 필요 | ❌ 완전 오프라인 로컬 실행 가능 |
| 환경 | 방법 | 특징 |
|---|---|---|
| Mac / Linux | Ollama 설치 후 명령어 실행 | 가장 간단, 터미널 기반 |
| Windows | Ollama 또는 HF Spaces | 설치형 또는 브라우저 체험 |
| iPhone (iOS) | TestFlight → MiniCPM V 앱 | 오프라인 완전 실행 |
| Android | HuggingFace 링크 통해 설치 | 오프라인 완전 실행 |
| 브라우저 | HuggingFace Spaces 데모 | 설치 없이 즉시 체험 |
| 용어 | 한줄 설명 | 비유 |
|---|---|---|
| MiniCPM-V | 모바일·엣지용으로 설계된 초소형 멀티모달 AI 모델 시리즈 | 소형 주머니 칼처럼 작지만 다양한 기능 |
| 파라미터 | AI 모델이 학습한 지식의 양을 나타내는 수치 | 뇌 속 신경망 연결 개수와 유사 |
| TTFT | 첫 번째 결과 글자가 나오기까지 걸리는 시간 | 질문 후 답변이 시작되는 반응 속도 |
| 온디바이스 | 클라우드 없이 기기 자체에서 AI를 실행하는 방식 | 인터넷 없이 내 폰에서 직접 계산 |
| 멀티모달 | 텍스트·이미지·영상 등 여러 형태의 입력을 처리하는 AI | 눈·귀·손을 모두 쓰는 사람처럼 |
| Ollama | 로컬 PC에서 AI 모델을 쉽게 실행하는 오픈소스 도구 | AI 모델 전용 앱스토어 |
| OCR | 이미지 속 텍스트를 인식해 디지털 텍스트로 변환하는 기술 | 사진 속 글씨를 타이핑 없이 복사 |
| 엣지 디바이스 | 클라우드 서버가 아닌 말단 현장 기기 (폰·IoT 등) | 회사 서버 대신 현장 직원 노트북 |