VoiceScript

파일 업로드
🎵
드래그하거나 클릭하여 선택
음성 또는 영상 파일
mp3 · wav · m4a · ogg · flac · aac · mp4 · webm · mkv
처리 중...0%
변환 결과
언어
길이
세그먼트
📝
파일 업로드 후
변환을 시작하면
결과가 표시됩니다
이미지 업로드
🖼
드래그하거나 클릭하여 선택
이미지 파일
jpg · png · bmp · tiff · webp · gif
OCR 엔진
모델 선택
granite3.2-vision
IBM · ~2GB
문서/표 특화
deepseek-ocr:3b
DeepSeek · ~2GB
OCR 전용
llama3.2-vision:11b
Meta · ~8GB
범용 고정확도
olmocr2:7b-q8
AllenAI · ~9GB
최고 정확도
커스텀 프롬프트 직접 입력
비워두면 인식 모드에 맞는 기본 프롬프트가 사용됩니다
인식 모드
일반 텍스트와 글자를 인식합니다
처리 중...0%
인식 결과
줄 수
모드
엔진
🔍
이미지 업로드 후
인식을 시작하면
결과가 표시됩니다
📊
표 구조 분석 모드를
선택하면 표를
추출할 수 있습니다