Voice
Script
아이디
비밀번호
로그인
Voice
Script
로그아웃
🎙
STT 음성변환
🔍
OCR 이미지인식
파일 업로드
🎵
드래그하거나 클릭하여 선택
음성 또는 영상 파일
mp3 · wav · m4a · ogg · flac · aac · mp4 · webm · mkv
언어
한국어
English
日本語
中文
자동 감지
출력
전체 텍스트
타임스탬프
변환 시작
처리 중...
0%
변환 결과
언어
—
길이
—
세그먼트
—
전체 텍스트
타임스탬프
📝
파일 업로드 후
변환을 시작하면
결과가 표시됩니다
복사
TXT 다운로드
새 파일
이미지 업로드
🖼
드래그하거나 클릭하여 선택
이미지 파일
jpg · png · bmp · tiff · webp · gif
OCR 엔진
🐾
PaddleOCR
로컬 실행 · 표 구조 분석
PP-Structure 지원
🦙
Ollama Vision
기존 Ollama 서버 사용
자연어 지시 가능
모델 선택
granite3.2-vision
IBM · ~2GB
문서/표 특화
deepseek-ocr:3b
DeepSeek · ~2GB
OCR 전용
llama3.2-vision:11b
Meta · ~8GB
범용 고정확도
olmocr2:7b-q8
AllenAI · ~9GB
최고 정확도
▶
커스텀 프롬프트 직접 입력
비워두면 인식 모드에 맞는 기본 프롬프트가 사용됩니다
인식 모드
📄 텍스트 추출
📊 표 구조 분석
일반 텍스트와 글자를 인식합니다
OCR 언어
한국어
English
日本語
中文 (繁)
中文 (簡)
인식 시작
처리 중...
0%
인식 결과
줄 수
—
모드
—
엔진
—
표
—
전체 텍스트
줄별 신뢰도
표 뷰어
🔍
이미지 업로드 후
인식을 시작하면
결과가 표시됩니다
📊
표 구조 분석 모드를
선택하면 표를
추출할 수 있습니다
복사
TXT 저장
Excel 저장
새 파일