Blog

무료 OCR 프로그램 8가지: 한국어 문서 인식 비교 (2026년)

May 21, 2026

2026년 현재 무료로 사용할 수 있는 한국어 OCR 프로그램으로는 Naver Clova OCR, Google Drive OCR, Microsoft OneNote, NewOCR.com, OnlineOCR.net, Adobe Scan, Tesseract, Lido 총 8가지가 있습니다. 각 도구마다 한국어 인식 정확도와 무료 한도, 처리 가능한 파일 형식이 다르므로 업무 목적에 맞게 선택하는 것이 중요합니다.

한국어 OCR을 선택할 때 반드시 확인해야 할 기준

OCR(Optical Character Recognition, 광학 문자 인식)은 이미지나 스캔 PDF 형식의 문서에서 텍스트를 추출하는 기술입니다. 영문 OCR은 비교적 오래전부터 높은 정확도를 달성했지만, 한국어 OCR은 구조적 특성 때문에 난이도가 상당히 높습니다. 한글은 초성, 중성, 종성의 조합으로 이루어진 음절 단위 문자 체계로, 완성형 기준 11,172자를 인식해야 합니다. 영어 알파벳 26자와 비교하면 학습해야 할 패턴의 수가 압도적으로 많습니다. 이 때문에 동일한 OCR 엔진을 사용하더라도 영문 문서 대비 한국어 문서의 인식 정확도가 10~20%포인트 낮게 나오는 경우가 흔합니다.

무료 OCR 프로그램을 고를 때는 세 가지 기준을 우선적으로 확인해야 합니다. 첫 번째는 한국어 인식 정확도입니다. 도구에 따라 70%에서 97% 이상까지 차이가 크며, 사업자등록번호 10자리나 부가가치세 금액처럼 숫자 한 자리 오류가 데이터 처리 오류로 이어지는 업무라면 정확도가 95% 미만인 도구는 사용하기 어렵습니다. 두 번째는 실질적인 무료 한도입니다. '무료'라는 표현이 붙어 있어도 시간당 15페이지 제한인 도구가 있는가 하면, 사실상 무제한으로 사용할 수 있는 도구도 있습니다. 월 처리량을 미리 계산한 후 비교해야 합니다. 세 번째는 출력 결과의 형태입니다. 단순히 텍스트 덩어리를 반환하는 도구인지, 항목별로 구조화된 데이터를 추출해주는 도구인지에 따라 후처리 작업량이 크게 달라집니다.

Naver Clova OCR은 네이버가 수억 건의 한국어 문서 데이터로 학습시킨 OCR 서비스로, 인쇄체 한국어 문서에 대해 97% 이상의 인식 정확도를 기록합니다. 8가지 도구 중 한국어 순수 인식률만 놓고 보면 가장 높은 수준입니다. 특히 사업자등록증, 주민등록증, 명함 등 정형화된 서식 문서를 처리하는 전용 템플릿 기능인 Document OCR이 있어, 각 항목을 자동으로 분리하여 추출할 수 있습니다. 전자세금계산서 이미지나 부가가치세 신고 관련 서류를 반복적으로 처리하는 팀이라면 이 기능이 실무에서 큰 차이를 만들어냅니다.

무료 한도는 네이버 클라우드 플랫폼 기준으로 General OCR API 월 1,000건까지 무료입니다. 단, 이 서비스를 사용하려면 API 키 발급과 HTTP 요청 코드 작성이 필요합니다. 네이버 클라우드 콘솔에서 계정을 만들고 API 키를 발급받은 후, 이미지를 Base64로 인코딩하여 JSON 형태로 전송하는 방식입니다. 결과값도 JSON 구조로 반환되므로 이를 파싱하여 활용하는 코드가 추가로 필요합니다. 개발 인력이 없는 팀에는 진입 장벽이 있지만, 개발팀을 보유한 중견 기업이나 스타트업이 자체 문서 처리 파이프라인을 구축할 때 가장 정확도가 높은 선택지입니다. 지원 파일 형식은 JPG, PNG, PDF, TIFF입니다.

Google Drive OCR: 가입 없이 즉시 사용하는 무료 OCR

Google Drive OCR은 별도 프로그램 설치나 API 설정 없이 구글 계정 하나로 바로 사용할 수 있는 가장 간편한 무료 OCR 방법입니다. PDF나 이미지 파일을 Google Drive에 업로드한 후 파일을 우클릭하여 'Google Docs로 열기'를 선택하면 OCR이 자동으로 실행됩니다. 무료 한도는 사실상 없습니다. 구글 계정 기본 저장 공간인 15GB 이내에서 파일을 업로드할 수 있는 한 횟수 제한 없이 사용 가능합니다. 지원 파일 형식은 JPG, PNG, GIF, PDF이며, 추출 결과는 Google Docs 문서로 바로 생성됩니다.

한국어 인식 정확도는 인쇄 상태가 양호한 문서 기준으로 약 85~90% 수준입니다. 글씨가 깔끔한 인쇄 문서에서는 실용적인 결과를 얻을 수 있지만, 손글씨나 표 구조가 포함된 문서, 여러 글자 크기가 혼재하는 복잡한 레이아웃에서는 정확도가 크게 낮아집니다. 또한 원본 문서의 표 구조나 열 구분이 그대로 보존되지 않는 경우가 많아, 추출된 텍스트를 경리나라나 이카운트 같은 회계 시스템에 바로 입력하기 어렵습니다. 월 수십 페이지 이내의 단순 텍스트 추출을 가끔 해야 하는 개인 사용자나 소규모 사업자에게 적합합니다.

Microsoft OneNote OCR: 오피스 환경에서 사용하는 무료 선택지

Microsoft OneNote는 마이크로소프트 오피스 생태계에 포함된 노트 앱으로, 이미지 내 텍스트를 추출하는 OCR 기능을 기본으로 제공합니다. 사용 방법은 단순합니다. OneNote에 이미지를 붙여넣기 한 후 이미지를 우클릭하여 '이미지에서 텍스트 복사'를 선택하면 됩니다. Microsoft 365 구독이 없어도 무료 Microsoft 계정만 있으면 웹 버전(OneNote for the web)으로 같은 기능을 사용할 수 있으며, 사용 횟수 제한도 없습니다. 지원 파일 형식은 JPG, PNG, BMP, TIFF 등 주요 이미지 포맷이며, PDF는 이미지로 변환하여 삽입해야 인식이 됩니다.

한국어 인식 정확도는 80~85% 수준으로 평가되며, Naver Clova OCR이나 Google Drive OCR보다 다소 낮습니다. 인쇄 품질이 낮거나 해상도가 낮은 이미지에서 정확도가 크게 떨어지는 경향이 있으며, 표 내부의 텍스트나 작은 크기의 글씨 처리에도 취약합니다. 또한 한 번에 여러 장의 문서를 일괄 처리하는 배치 기능이 없어, 건별로 수동 작업을 반복해야 합니다. 이미 Microsoft 365를 업무 환경으로 사용 중인 기업에서 별도 도구 도입 없이 간헐적으로 이미지 내 텍스트를 추출해야 할 때 활용하기 적합합니다. SAP Korea나 더존비즈온 등 ERP와 연동하는 정기적인 데이터 처리 업무에는 적합하지 않습니다.

NewOCR.com과 OnlineOCR.net: 설치 없이 쓰는 웹 기반 무료 OCR

NewOCR.com과 OnlineOCR.net은 회원 가입 없이도 즉시 사용할 수 있는 웹 기반 무료 OCR 서비스입니다. NewOCR.com은 한국어를 포함한 100개 이상의 언어를 지원하며, 파일을 업로드하면 수 초 내에 텍스트를 추출합니다. 파일당 5MB까지 업로드 가능하고, 사용 횟수 제한이 없습니다. 지원 파일 형식은 JPG, PNG, BMP, GIF, TIFF, PDF이며, 결과물은 텍스트, Word 문서, PDF 중 원하는 형식으로 다운로드할 수 있습니다.

OnlineOCR.net은 회원 가입 없이 시간당 15페이지, 무료 회원 가입 후에는 월 50페이지까지 처리 가능합니다. JPG, BMP, GIF, TIFF, PDF를 지원하며 출력 형식은 Word, Excel, Text 중 선택할 수 있습니다. 두 서비스 모두 내부적으로 Tesseract 엔진 계열을 기반으로 동작하는 경우가 많아, 한국어 인식 정확도는 70~80% 수준에 그칩니다. 복잡한 레이아웃이나 저해상도 스캔 이미지에서는 오인식이 빈번하게 발생합니다. 급하게 간단한 텍스트를 추출해야 하는 상황이나 소프트웨어 설치가 제한된 환경에서 일시적으로 사용하기에는 적합하지만, 사업자등록번호나 금액 데이터 정확도가 중요한 업무 문서에는 활용하기 어렵습니다. 기업 내부 문서나 개인정보가 담긴 파일을 외부 서버에 업로드할 때는 보안 정책을 반드시 확인해야 합니다.

Adobe Scan: 스마트폰으로 종이 문서를 바로 디지털화

Adobe Scan은 스마트폰 카메라로 문서를 촬영하면 자동으로 OCR을 적용하여 검색 가능한 PDF로 저장하는 모바일 앱입니다. iOS와 Android 모두 지원하며, Adobe 계정으로 무료 가입 후 사용할 수 있습니다. 무료 플랜에서는 월 25페이지까지 PDF 내보내기가 가능합니다. 앱 특유의 기능으로 카메라 화면에서 문서 가장자리를 자동으로 감지하고, 촬영 각도와 조명에 따른 원근 왜곡 및 그림자를 보정하여 스캔 품질을 높입니다. 스캔 결과는 Adobe Document Cloud에 자동 저장되며, 무료 계정 기준 저장 공간은 2GB입니다.

한국어 인식 정확도는 조명이 고르고 흔들림이 없는 환경에서 선명하게 촬영한 인쇄 문서 기준으로 약 85~90% 수준입니다. 단, 촬영 조건에 따라 편차가 크며, 그림자가 생기거나 종이가 구겨진 경우 정확도가 급격히 낮아집니다. 외근 중 거래처에서 받은 종이 견적서, 사무실 외부에서 수령한 세금계산서 등을 현장에서 바로 디지털화하여 보관해야 하는 영업 담당자나 소규모 사업자에게 실용적인 선택입니다. 다만 월 25페이지 무료 한도를 초과하면 Adobe Acrobat Standard 유료 구독으로 전환해야 하며, 가격이 월 2만 원대 후반에서 시작합니다. 문서 처리량이 많은 경우 비용이 빠르게 늘어날 수 있습니다.

Tesseract: 자체 파이프라인을 구축하는 개발자를 위한 오픈소스 엔진

Tesseract는 Google이 관리하는 오픈소스 OCR 엔진으로, 전 세계에서 가장 널리 사용되는 OCR 라이브러리 중 하나입니다. 완전 무료이며 사용 횟수와 파일 수에 제한이 없습니다. Windows, macOS, Linux 모두에서 설치 가능하고, Python의 pytesseract 라이브러리나 Java, C++ 등 다양한 언어에서 몇 줄의 코드로 OCR 기능을 구현할 수 있습니다. 한국어를 포함한 100개 이상의 언어 팩을 제공하며, GitHub에서 훈련 데이터를 내려받아 언어 팩을 추가하면 됩니다. NHN Cloud OCR, 카카오엔터프라이즈, 삼성 SDS Brity 등 국내 상용 OCR 서비스들이 등장하기 전까지 오픈소스 한국어 OCR의 기본 선택지였습니다.

한국어 인식 정확도는 해상도 300 DPI 이상의 깔끔한 인쇄 문서에서 약 75~85% 수준을 기대할 수 있습니다. Naver Clova OCR보다 10~20%포인트 낮으며, 스캔 품질이 낮거나 레이아웃이 복잡한 문서에서는 70% 미만으로 떨어지기도 합니다. 한국어 LSTM 모델은 있지만 네이버처럼 대규모 한국어 문서 데이터로 세밀하게 학습한 모델에 비해 인식 성능이 뒤처집니다. PDF 파일은 기본적으로 지원하지 않아 pdf2image 등 별도 라이브러리를 추가해야 합니다. 지원 이미지 포맷은 JPG, PNG, TIFF, BMP, PNM, WebP입니다. 자체 서버에서 대량 문서를 자동화 처리하는 파이프라인을 구축하거나, 클라우드 API 비용 없이 OCR 기능을 내재화하려는 개발팀에 적합합니다.

Lido: 한국어 비즈니스 문서의 데이터 추출 자동화

Lido는 OCR로 텍스트를 추출하는 것에서 한 단계 더 나아가, PDF나 이미지 형식의 비즈니스 문서에서 필요한 항목을 구조화된 데이터로 바로 뽑아주는 AI 문서 처리 서비스입니다. 세금계산서, 견적서, 계약서, 구매발주서 등 정형화된 비즈니스 서식에서 항목별 데이터를 분리하여 스프레드시트나 JSON 형식으로 내보낼 수 있습니다. 한국어 문서를 공식 지원하며, 사업자등록번호 10자리 형식, 부가가치세 세율 구조, 전자세금계산서 서식 등 한국 비즈니스 문서의 특성을 반영한 처리가 가능합니다.

무료 플랜은 월 50페이지까지 제공하며, 유료 플랜은 월 $29(약 39,000원)부터 시작합니다. 지원 파일 형식은 PDF, JPG, PNG이며, 엑셀 파일도 처리할 수 있습니다. 추출 결과는 CSV, Excel, JSON 형식으로 내보내거나 웹훅을 통해 더존비즈온, 이카운트, 경리나라, 영림원소프트랩 등 ERP 및 회계 시스템과 연동할 수 있습니다. 일반 OCR과의 차이는 텍스트 추출 이후 데이터 정리 단계까지 자동화한다는 점입니다. 예를 들어 세금계산서 100장을 처리할 때, 일반 OCR은 텍스트 덩어리를 반환하지만 Lido는 공급자명, 공급받는자 사업자등록번호, 작성일자, 공급가액, 부가세액, 합계금액 등 항목별로 정리된 테이블을 바로 반환합니다. 월 50장 이상의 비즈니스 문서를 정기적으로 처리하는 경리 담당자, 세무사 사무소, 구매팀에 적합합니다.

8가지 무료 OCR 도구 한눈에 비교

아래 표는 8가지 무료 OCR 도구의 주요 항목을 정리한 것입니다. 한국어 인식 정확도는 300 DPI 이상의 인쇄 문서를 기준으로 한 일반적인 수치이며, 실제 문서 품질과 레이아웃 복잡도에 따라 달라질 수 있습니다.

도구명 한국어 정확도 무료 한도 OCR 유형 주요 지원 파일 적합 대상
Naver Clova OCR 97% 이상 월 1,000건 (API) 클라우드 API JPG, PNG, PDF, TIFF 개발팀, 대량 자동화 처리
Google Drive OCR 약 85~90% 사실상 무제한 클라우드 내장 JPG, PNG, GIF, PDF 개인 및 소량 사용자
Microsoft OneNote 약 80~85% 무제한 클라우드 내장 JPG, PNG, BMP, TIFF Microsoft 365 사용 기업
NewOCR.com 약 70~80% 무제한 (5MB/파일) 웹 서비스 JPG, PNG, PDF, TIFF, GIF 단순 텍스트 급할 때
OnlineOCR.net 약 70~80% 시간당 15페이지 웹 서비스 JPG, BMP, GIF, TIFF, PDF 단순 텍스트 급할 때
Adobe Scan 약 85~90% 월 25페이지 모바일 앱 카메라 촬영, JPG, PDF 현장 종이 문서 스캔
Tesseract 약 75~85% 무제한 (오픈소스) 로컬 설치형 JPG, PNG, TIFF, BMP, WebP 개발자, 자체 파이프라인
Lido 높음 (구조화 포함) 월 50페이지 AI 문서 데이터 추출 PDF, JPG, PNG, Excel 경리팀, 세무사무소, 구매팀

업무 유형별 무료 OCR 도구 선택 가이드

어떤 OCR 도구가 적합한지는 처리 문서의 종류와 월 처리량, 그리고 기술 역량에 따라 달라집니다. 월 수십 페이지 이내의 단순 텍스트 추출이 목적이라면 Google Drive OCR이 가장 실용적입니다. 이미 구글 계정이 있고, 별도 설치 없이 즉시 사용 가능하며, 횟수 제한이 없기 때문입니다. 스마트폰으로 종이 문서를 현장에서 즉시 스캔해야 하는 상황이라면 Adobe Scan이 적합합니다. 특히 영업 담당자처럼 거래처에서 받은 서류를 바로 디지털화해야 하는 경우에 유용합니다.

한국어 인식 정확도가 가장 중요하고 개발 인력이 있다면 Naver Clova OCR을 선택하는 것이 좋습니다. 월 1,000건 무료 한도 내에서 가장 높은 정확도를 제공합니다. 개발자가 자체 서버에서 비용 없이 대량 문서를 처리해야 한다면 Tesseract가 유일한 무제한 무료 선택지입니다. 반면 경리팀이나 세무사무소처럼 세금계산서, 견적서, 구매발주서 등 비즈니스 서식 문서를 반복적으로 처리하고 그 결과를 ERP나 회계 시스템에 입력해야 하는 경우라면, 단순 텍스트 추출 이상의 데이터 구조화가 필요합니다. 이 경우 월 50페이지 무료 한도를 제공하는 Lido가 후처리 작업 시간을 크게 줄여줍니다. OCR로 텍스트를 뽑은 후 엑셀에 수동으로 정리하는 시간까지 고려하면, 도구 선택이 월별 업무 시간에 미치는 영향이 적지 않습니다.

자주 묻는 질문

무료 OCR 프로그램 중 한국어 인식률이 가장 높은 것은 무엇인가요?

인쇄체 한국어 문서 기준으로는 Naver Clova OCR이 97% 이상의 정확도로 가장 높은 수준입니다. 다만 API 방식이므로 개발 지식이 필요하며, 코드 작성 없이 바로 사용하고 싶다면 Google Drive OCR이 약 85~90% 정확도로 실용적인 대안입니다. 사업자등록번호나 부가가치세 금액처럼 숫자 정확도가 중요한 업무 문서라면 Naver Clova OCR 또는 Lido를 사용하는 것이 안전합니다.

PDF 파일을 무료로 OCR 처리하려면 어떤 도구를 써야 하나요?

PDF 파일을 무료로 OCR 처리하는 가장 간단한 방법은 Google Drive에 PDF를 업로드한 후 'Google Docs로 열기'를 선택하는 것입니다. Naver Clova OCR API도 PDF 형식을 지원합니다. Tesseract는 기본적으로 이미지 포맷만 처리하므로 PDF를 처리하려면 pdf2image 같은 라이브러리로 먼저 이미지로 변환해야 합니다. Lido는 PDF를 직접 업로드하여 항목별 데이터 추출까지 처리하며, 월 50페이지를 무료로 제공합니다.

OCR 도구에 기업 내부 문서를 업로드해도 보안상 안전한가요?

NewOCR.com, OnlineOCR.net 같은 무료 웹 서비스는 파일을 외부 서버에 전송하므로, 계약서나 개인정보가 포함된 기업 내부 문서를 업로드하기 전에 해당 서비스의 개인정보 처리 방침과 데이터 보존 기간을 반드시 확인해야 합니다. Google Drive와 Microsoft OneNote는 자체 기업 데이터 보호 정책을 제공하며, Tesseract는 로컬에서 실행되므로 외부 서버에 데이터가 전송되지 않습니다. Naver Clova OCR과 Lido는 각각 네이버 클라우드와 Lido의 개인정보 처리 방침에 따라 데이터가 처리됩니다.

세금계산서나 견적서를 자동으로 처리하려면 어떤 OCR이 적합한가요?

세금계산서나 견적서처럼 항목별 데이터가 중요한 비즈니스 서식 문서를 처리할 때는 단순 OCR만으로는 부족합니다. 텍스트를 추출한 후 공급자명, 사업자등록번호, 공급가액, 세액 등 항목별로 다시 분리 정리하는 후처리 작업이 추가로 필요하기 때문입니다. Naver Clova OCR의 Document OCR 기능이나 Lido처럼 구조화된 데이터 추출을 제공하는 도구를 사용하면 이 후처리 단계를 자동화할 수 있습니다. 특히 더존비즈온이나 이카운트, 경리나라 같은 국내 회계 시스템과의 연동이 필요하다면 Lido의 웹훅 및 내보내기 기능이 실무에 도움이 됩니다.

Tesseract를 한국어 OCR에 사용할 때 정확도를 높이는 방법이 있나요?

Tesseract의 한국어 인식 정확도를 높이려면 몇 가지 전처리 작업이 중요합니다. 우선 입력 이미지를 300 DPI 이상으로 준비하고, OpenCV 등의 라이브러리로 이미지를 그레이스케일로 변환한 후 임계값 처리(thresholding)를 적용하면 인식률이 5~15%포인트 향상될 수 있습니다. 또한 Tesseract 실행 시 언어 옵션을 -l kor로 명시하고, OCR 엔진 모드(oem)를 LSTM 기반인 3으로 설정하는 것이 좋습니다. 그럼에도 한국어 인식 정확도가 업무 수준에 미치지 못한다면 Naver Clova OCR API로 전환하는 것을 검토해 볼 수 있습니다.

문서 자동화로 사업을 키울 준비가 되셨나요? 추가 인력 없이도 가능합니다

Lido와 함께 반복 업무를 자동화하며 더 빠르게 성장하는 수백 개 팀에 합류하세요.