AI가 글을 써주는 것만으로도 놀라운 시대지만, 이제는 그림, 사진, 도표, 손글씨까지 이해하는 AI가 일상에 들어왔습니다.
이번 글에서는 Gemini Pro의 ‘멀티모달 기능’을 중심으로,
텍스트가 아닌 다양한 자료(이미지, 표, 스캔 등)로도 질문할 수 있는 방법을 실습과 함께 안내드립니다.
1. 멀티모달 AI란 무엇인가요?
멀티모달(Multimodal)이란,
AI가 텍스트뿐 아니라 이미지, 소리, 비디오 등 다양한 형식의 정보를 동시에 이해하고 처리할 수 있다는 뜻입니다.
Gemini Pro는 이러한 멀티모달 기능이 기본 탑재되어 있어,
텍스트뿐 아니라 이미지를 함께 입력하거나 복합적인 요청도 처리할 수 있습니다.
2. 이미지 입력 가능한 환경
사용 환경 이미지 입력 여부
| gemini.google.com (웹사이트) | ✅ 가능 (드래그/클릭 업로드) |
| Android Gemini 앱 | ✅ 가능 (카메라 or 갤러리 업로드) |
| Google Docs, Gmail 등 Google Workspace 도구 | ❌ 이미지 분석은 별도 진행 필요 (직접 업로드 불가) |
※ 현재는 모바일 앱 또는 웹 버전을 통해 이미지 입력이 가능합니다.
3. 대표 활용 예시
예시 1: 음식 사진 → 요리명 분석
“이 음식 사진은 어떤 요리인가요?”
→ 음식 이름, 재료 추정, 유사 레시피 추천
예시 2: 차트 이미지 → 요점 요약
“이 막대그래프의 핵심 내용을 알려주세요.”
→ 수치 분석, 변화 포인트 요약
예시 3: 손글씨 사진 → 글자 인식
“이 손글씨 내용을 텍스트로 바꿔주세요.”
→ OCR(광학 문자 인식) 기능 + 문맥 해석
예시 4: 수학문제 사진 → 풀이 요청
“이 수학 문제를 단계별로 풀어주세요.”
→ 문제 이해, 풀이 과정 설명
4. 실제 실습: 이미지 올리고 질문하기
실습 준비
- Chrome 브라우저 또는 Android 스마트폰
- https://gemini.google.com 접속
- 샘플 이미지 (사진, 그래프, 손글씨 등) 준비
실습 과정
- Gemini 대화창 하단의 📎 아이콘 또는 ‘이미지 업로드’ 버튼 클릭
- 사진 파일을 선택하여 업로드
- 질문 입력
- 예: “이 사진이 무엇인지 알려주세요.”
- 예: “이 도표의 핵심 정보를 요약해 주세요.”
- Gemini의 응답 확인 → 내용 복사 또는 편집
5. 이미지 입력 시 유용한 프롬프트 예시
목적 프롬프트 예시
| 설명 요청 | “이 이미지의 내용을 설명해 주세요.” |
| 분류 요청 | “이 사진 속 사물을 카테고리별로 분류해 주세요.” |
| 오류 지적 | “이 그래프에서 잘못된 부분이 있다면 지적해 주세요.” |
| 개선 제안 | “이 디자인을 더 보기 좋게 개선하려면 어떻게 해야 하나요?” |
| 번역 요청 | “이 사진 속 영어 텍스트를 한국어로 번역해 주세요.” |
6. 활용 팁
- 화질이 선명할수록 분석 정확도가 높아집니다. 흐릿한 이미지나 필기체는 인식률이 낮아질 수 있습니다.
- 질문은 명확하고 구체적으로 작성해 주세요.
예: “이게 뭐예요?”보다는 “이 사진은 어떤 종류의 전자기기인가요?”가 더 정확한 답변을 얻을 수 있습니다.
마무리 요약
- Gemini는 이미지, 차트, 손글씨 등 다양한 자료를 함께 분석할 수 있는 멀티모달 AI입니다.
- Gemini 웹사이트나 Android 앱을 통해 이미지를 업로드하고 질문할 수 있습니다.
- 실생활에서 다양한 형태의 문서를 다룰 때 매우 유용하게 활용할 수 있습니다.
'AI 툴 리뷰 & 사용법 > Gemini Pro' 카테고리의 다른 글
| Gemini Pro 고급 활용법 | Google Sheets, AppSheet, API 연동으로 자동화하는 방법 (4) | 2025.08.13 |
|---|---|
| Gemini에게 원하는 답을 끌어내는 프롬프트 작성 전략 (9) | 2025.08.11 |
| Gemini Pro 실제 사용법 | Gmail, Docs, Sheets에서 AI 비서처럼 활용하기 (2) | 2025.08.10 |
| Gemini Pro란 무엇인가? | ChatGPT와 다른 점까지 쉽게 이해하기 (5) | 2025.08.09 |