Blog

사업자등록증 OCR 5가지: 거래처 등록 자동화 (2026)

May 21, 2026

사업자등록증 OCR은 상호·사업자번호(10자리)·대표자·주소 등 핵심 필드를 자동으로 추출하여 거래처 수기 입력 시간을 평균 3분에서 10초 이내로 단축합니다. 이 글에서는 2026년 기준 국내 실무에서 검증된 Naver Clova OCR, NHN Cloud OCR, Lido, 자비스, 더존비즈온 5가지 솔루션을 기능·비용·연동성 기준으로 비교합니다.

거래처 등록 수작업의 실제 비용: 3분에서 10초로

신규 거래처를 등록할 때 담당자가 사업자등록증 사본을 받아 상호, 사업자번호, 대표자명, 주소, 업태, 종목, 개업일을 ERP나 회계 시스템에 손으로 옮기는 데 평균 3분이 소요됩니다. 월 100건의 신규 거래처를 등록하는 중견 제조사라면 한 달에 약 300분, 연간 60시간이 단순 입력 작업에 쓰입니다. 이 시간 자체보다 더 큰 문제는 오입력입니다. 사업자번호 10자리 가운데 한 자리라도 잘못 입력되면 전자세금계산서 발행 오류가 발생하고, 오류 수정을 위해 거래처 담당자와 수차례 연락해야 합니다. 국세청 자료에 따르면 전자세금계산서 연간 발행 건수가 2024년 기준 약 67억 건에 달하므로, 사업자번호 오입력 한 건이 부가가치세 신고 오류로 이어질 위험은 결코 작지 않습니다.

사업자등록증 OCR(광학 문자 인식)은 이미지나 PDF에서 이 모든 필드를 자동으로 읽어 구조화된 데이터로 반환합니다. 처리 속도는 일반적으로 1건당 10초 이내입니다. 사람이 직접 읽고 입력하는 3분과 비교하면 18배 차이이며, 월 300건 기준으로는 연간 약 58시간을 절감할 수 있습니다. 속도 외에도 OCR은 입력 오류율을 크게 낮추고, 추출된 사업자번호를 국세청 사업자등록 진위확인 API와 즉시 연결하여 폐업·휴업 사업자를 거래처 등록 시점에 차단하는 자동화 흐름을 구성할 수 있습니다.

사업자등록번호 10자리 구조와 체크섬 검증

사업자등록번호는 123-45-67890 형식의 10자리 숫자입니다. 세 그룹으로 나뉘며 각각 고유한 의미를 가집니다. 첫 번째 그룹인 앞 3자리는 사업장 소재지를 관할하는 세무서 코드입니다. 서울 종로세무서는 101, 서울 중부세무서는 106 등으로 표시되며, 전국 133개 세무서가 각각 고유한 코드를 가집니다. 사업장 주소와 세무서 코드가 일치하지 않으면 주소지 정보 오류를 의심해볼 수 있습니다.

중간 2자리는 사업자 유형을 나타냅니다. 01부터 79 사이이면 개인사업자, 81부터 86이면 영리 법인사업자, 87부터 89이면 비영리법인, 90이면 국가·지방자치단체를 의미합니다. ERP 거래처 마스터에 법인/개인 구분을 자동으로 채울 때 이 자리를 참조합니다. 끝 5자리 가운데 앞 4자리는 일련번호이고, 마지막 1자리는 국세청 공식 체크섬 알고리즘으로 계산된 검증 번호입니다.

검증 방식은 다음과 같습니다. 앞 9자리에 가중치 배열 [1, 3, 7, 1, 3, 7, 1, 3, 5]를 각각 곱하고, 9번째 자리에는 가중치 5를 곱한 값의 십의 자리를 추가로 더한 뒤, 전체 합산 값을 10으로 나눈 나머지를 10에서 뺍니다. 이 결과가 마지막 자리(검증 번호)와 일치해야 유효한 사업자번호입니다. OCR 솔루션이 이 체크섬 검증을 내장하고 있으면, 이미지 품질이 낮거나 여러 번 복사된 문서에서 잘못 읽은 번호를 즉시 플래그 처리할 수 있습니다. 무작위 오입력의 약 90%를 1차 필터링하는 효과가 있습니다.

사업자등록증 OCR이 추출하는 6개 핵심 필드

첫 번째 필드는 상호(법인명)입니다. 국문 또는 영문 상호가 등록되어 있으며, '주식회사', '유한회사' 등 법인 형태를 포함한 전체 명칭이 추출됩니다. ERP 거래처 마스터의 거래처명 필드와 1:1로 매핑됩니다. 두 번째 필드는 대표자명입니다. 공동 대표인 경우 두 명 이상의 이름이 표기되며, OCR 정확도가 낮은 솔루션에서는 한국 인명의 외자(한 글자 이름) 처리에 오류가 발생하는 사례가 보고되고 있으므로 샘플 검증이 필요합니다.

세 번째 필드는 사업장 주소입니다. 2014년 이후 도로명주소 체계가 적용된 사업자등록증은 도로명 주소로 표기됩니다. 세금계산서 발행 시 공급받는 자 주소 필드와 일치시켜야 하므로 정확한 추출이 중요합니다. 네 번째 필드는 업태입니다. 제조업, 도소매업, 서비스업 등 업종 대분류로, 부가가치세 신고 시 업종 코드 구분에 사용됩니다. 다섯 번째 필드는 종목입니다. 업태 아래 구체적인 품목이나 서비스 내용을 표시하며, 예를 들어 업태가 '제조업'이면 종목은 '전자부품, 컴퓨터' 등으로 세분화됩니다. 여섯 번째 필드는 개업연월일입니다. 신생 사업자 여부를 판별하거나 거래 신용 평가 시 사업 연수를 계산하는 데 참조됩니다.

법인사업자는 이 6개 필드 외에 법인등록번호(13자리)와 과세 유형(일반/간이/면세) 정보도 함께 추출됩니다. 과세 유형은 부가가치세 적용 여부를 결정하기 때문에, 거래처 마스터에 이 값이 올바르게 저장되어야 전자세금계산서 발행 시 세율이 자동으로 적용됩니다.

5가지 솔루션 기능·비용 비교

아래 표는 2026년 5월 기준으로 각 솔루션의 주요 특성을 정리한 것입니다. 요금은 공개된 기본 플랜을 기준으로 하며, 실제 계약 조건에 따라 달라질 수 있습니다. 월 처리 건수, 개발 팀 보유 여부, 기존 ERP 환경을 종합하여 선택하는 것이 좋습니다.

솔루션 사업자등록증 전용 모델 월 기본 요금 연동 방식 국내 ERP 연동 국세청 API 지원 적합 대상
Naver Clova OCR 있음 (도메인 모델) 건당 약 20~50원 REST API 직접 개발 필요 직접 연동 필요 월 1,000건 이상, 개발 팀 보유
NHN Cloud OCR 있음 건당 과금 + 기본료 REST API 직접 개발 필요 직접 연동 필요 NHN Cloud 기존 사용 기업
Lido 필드 지정형 $29/월 (약 39,000원) UI + API CSV/API 내보내기 별도 연동 구성 월 50~500건, 비개발 팀 포함
자비스 있음 (서비스 내장) 회계 SaaS 패키지 포함 UI (자비스 내부) 자비스 회계와 통합 자동 연동 자비스 회계 사용 중소기업
더존비즈온 있음 (ERP 내장) ERP 라이선스 포함 UI (WEHAGO/iCUBE) 더존비즈온 ERP 직결 자동 연동 더존비즈온 ERP 사용 기업

Naver Clova OCR은 네이버 클라우드 플랫폼에서 제공하는 OCR 서비스로, 사업자등록증 전용 도메인 모델을 별도로 제공합니다. 일반 범용 OCR과 달리 사업자등록증의 레이아웃과 필드 위치를 사전 학습한 모델이기 때문에, 상호·사업자번호·대표자·주소 등 주요 필드를 키-값(key-value) 쌍 형태로 바로 반환합니다. 범용 OCR에서 흔히 필요한 텍스트 위치 파싱 추가 작업이 없습니다. API 요청은 REST 방식으로, 이미지(JPG, PNG) 또는 PDF를 Base64 인코딩하여 전송하면 JSON 응답을 받습니다. 호출당 요금은 건당 약 20~50원 수준으로, 월 1,000건을 처리하면 약 20,000~50,000원이 됩니다. 대량 처리가 필요한 기업이나 자체 서버에서 API를 직접 호출해야 하는 개발 팀에 적합합니다.

NHN Cloud OCR Document는 NHN Cloud에서 제공하는 문서 OCR 서비스입니다. 사업자등록증을 포함한 다양한 국내 문서 형식을 지원하며, 구조화된 JSON 응답을 반환합니다. NHN Cloud를 이미 클라우드 인프라로 사용하는 기업에서는 기존 계정에서 바로 활성화하여 추가 벤더 관리 없이 도입할 수 있습니다. 카카오엔터프라이즈와 삼성SDS Brity도 유사한 문서 OCR 기능을 제공하지만, 사업자등록증 전용 모델 여부와 구조화 응답 수준에서 차이가 있으므로 PoC(개념 검증) 단계에서 실제 사업자등록증 샘플로 정확도를 직접 비교 검증하는 것이 좋습니다.

두 솔루션 모두 API 개발 역량이 내부에 있는 경우에 적합합니다. 반면 개발 리소스가 부족하거나 비개발 팀이 직접 사용해야 하는 환경에서는 노코드·로우코드 기반 솔루션이 더 현실적인 선택입니다.

Lido: 코드 없이 사업자등록증 데이터 추출하기

Lido는 AI 기반 문서 데이터 추출 SaaS로, 월 $29(한화 약 39,000원)에 사업자등록증을 포함한 각종 문서에서 구조화된 데이터를 추출합니다. 한국어 문서를 공식 지원하며, 사업자등록증의 상호, 사업자번호, 대표자, 주소, 업태, 종목, 개업연월일을 지정된 컬럼 형태로 바로 추출합니다. Naver Clova OCR이나 NHN Cloud OCR과의 가장 큰 차이점은 API 코드를 직접 작성하지 않아도 된다는 점입니다. Lido의 웹 인터페이스에서 추출할 필드를 지정하면, 이후 사업자등록증 이미지나 PDF를 업로드할 때마다 지정된 컬럼 구조로 데이터가 채워집니다.

실무에서의 거래처 등록 흐름은 다음과 같습니다. 영업팀이 신규 거래처로부터 사업자등록증 사본을 이메일이나 카카오톡으로 수령하면 해당 파일을 Lido에 업로드합니다. Lido는 10초 이내에 6개 핵심 필드를 추출하고, 담당자는 결과를 확인한 뒤 ERP 거래처 마스터에 복사하거나 API를 통해 직접 전송합니다. 대량 문서는 폴더 업로드나 이메일 수신 연동으로 자동화할 수 있으며, 결과는 CSV, JSON, 스프레드시트 형식으로 내보낼 수 있습니다. 월 고정 요금 구조이기 때문에 처리 건수가 늘어도 추가 비용이 발생하지 않으며, 거래처 등록이 집중되는 분기 말이나 신규 사업 개시 시기에도 예산을 예측하기 쉽습니다.

사업자등록증 외에도 세금계산서, 견적서, 발주서, 인보이스 등 회계·구매 부서에서 다루는 다양한 문서를 동일한 플랫폼에서 처리할 수 있어, 문서 자동화 비용을 하나의 구독으로 통합할 수 있습니다.

자비스·더존비즈온: ERP 연동 거래처 자동 등록

자비스(Jarvis)는 중소기업 대상 경리·회계 SaaS로, 거래처 등록 자동화 기능이 핵심 서비스 가운데 하나입니다. 사업자등록증 사본을 업로드하면 OCR로 거래처 정보를 자동 입력하고, 입력된 사업자번호를 국세청 진위확인 API와 실시간으로 대조하여 유효성을 검증합니다. 자비스를 회계 플랫폼으로 사용하는 기업은 별도 OCR 솔루션을 추가하지 않고도 거래처 등록 자동화를 구현할 수 있습니다. 다만 자비스 서비스 내부에서만 동작하므로 외부 ERP인 더존비즈온, SAP Korea 등과 양방향 데이터 연동이 필요한 경우에는 별도 검토가 필요합니다. 경리나라와 이카운트 같은 중소기업 특화 회계 솔루션도 거래처 OCR 입력 기능을 순차적으로 도입하고 있어 선택지가 넓어지고 있습니다.

더존비즈온은 국내 ERP 시장 점유율 1위 솔루션으로, iCUBE 및 WEHAGO 플랫폼에서 사업자등록증 자동 입력 기능을 제공합니다. 담당자가 ERP 거래처 등록 화면에서 사업자등록증을 스캔하거나 이미지를 첨부하면 OCR이 동작하여 상호, 사업자번호, 주소 등을 자동으로 채웁니다. 전자세금계산서 발행 모듈과 거래처 마스터가 단일 데이터베이스를 공유하기 때문에 데이터 정합성 유지가 쉽고, 추가 API 개발 없이 기존 워크플로우에 바로 통합됩니다. 영림원소프트랩이나 SAP Korea 기반 ERP 환경에서는 Naver Clova OCR이나 Lido API를 별도로 연동하는 방식이 일반적이며, 세무사랑Pro나 위셈을 사용하는 세무법인·회계사무소에서도 동일한 방식으로 구성합니다.

국세청 사업자등록 진위확인 API 연동 방법

국세청은 사업자등록 상태를 실시간으로 확인할 수 있는 오픈 API를 제공합니다. 공식 명칭은 '사업자등록 상태조회 API'이며, 국세청 홈택스 OpenAPI 포털(hometax.go.kr)에서 API 키를 발급받아 사용합니다. 요청 시 사업자번호 10자리를 파라미터로 전송하면, 응답 JSON에 사업자 상태 코드(계속사업자: 01, 휴업: 02, 폐업: 03)와 폐업일(폐업인 경우), 국세청 등록 여부 등이 반환됩니다. API의 일일 호출 한도는 기본 등급 기준 1,000건이며, 월 수백 건 이상의 신규 거래처를 등록하는 기업은 대량 조회 등급 신청을 통해 한도를 높일 수 있습니다.

OCR 추출 후 자동 검증 파이프라인은 세 단계로 구성됩니다. 첫째, OCR로 사업자번호 10자리를 추출합니다. 둘째, 체크섬 알고리즘으로 번호 자체의 수학적 유효성을 검증합니다. 셋째, 국세청 API를 호출하여 실제 등록 상태(계속/휴업/폐업)를 확인합니다. 이 세 단계를 파이프라인으로 연결하면, 폐업한 거래처나 존재하지 않는 사업자번호로 거래처를 등록하는 실수를 사전에 차단할 수 있습니다. 국세청 API 응답에는 과세 유형 변경 이력이 포함되지 않으므로, 간이과세자 여부의 최신 정보는 거래처에 직접 사업자등록증 원본을 요청하여 확인하는 것이 정확합니다.

실무에서는 신규 거래처 등록 시 1회 검증에서 그치지 않고, 기존 거래처 마스터 전체에 대해 분기 1회 국세청 API를 일괄 호출하여 폐업·휴업 여부를 점검하는 자동화 스크립트를 함께 운영하는 경우가 많습니다. 상태 변경이 감지된 거래처에 한해 담당자에게 이메일이나 메신저 알림을 발송하면, 문제 거래처에 대한 전자세금계산서 발행을 발 빠르게 중단할 수 있습니다.

거래처 등록 자동화 도입 실무 체크리스트

도입 첫 단계는 현행 프로세스 진단입니다. 월 평균 신규 거래처 등록 건수, 입력 오류 발생 빈도, 현재 사용 중인 ERP 또는 회계 시스템(더존비즈온, 영림원소프트랩, SAP Korea, 이카운트, 경리나라 등)을 정확히 파악합니다. 처리 건수가 월 50건 미만이고 개발 리소스가 없다면 Lido처럼 월 고정 요금의 노코드 솔루션이 적합합니다. 월 1,000건 이상이며 API 개발 팀이 있다면 Naver Clova OCR이나 NHN Cloud OCR의 건당 과금 방식이 총비용(TCO) 면에서 유리할 수 있습니다. 더존비즈온이나 자비스를 이미 사용 중이라면 내장 OCR 기능을 먼저 검토하는 것이 추가 비용 없이 자동화를 시작하는 가장 빠른 방법입니다.

두 번째 단계는 데이터 흐름 설계입니다. OCR 추출 결과를 어느 시스템에 어떻게 입력할지 결정합니다. 외부 ERP와 API 연동이 필요하다면 OCR 추출 결과를 JSON으로 받아 ERP의 거래처 등록 API 엔드포인트로 전달하는 미들웨어를 구성합니다. 이 과정에서 사업자번호 중복 검증 로직을 반드시 포함시켜야 합니다. 같은 사업자번호의 거래처가 이미 등록되어 있다면 신규 등록 대신 기존 레코드 업데이트로 처리하는 분기 처리가 필요하며, 이 로직을 생략하면 거래처 마스터에 중복 레코드가 누적되어 부가가치세 신고 시 집계 오류가 발생할 수 있습니다.

세 번째 단계는 검증 파이프라인 완성입니다. 앞서 설명한 국세청 사업자등록 상태조회 API를 OCR 추출 직후 단계에 포함시킵니다. OCR 추출, 체크섬 검증, 국세청 API 상태 확인의 세 단계를 자동화하면 담당자 개입 없이 유효한 거래처만 ERP에 등록됩니다. 수정 세금계산서 발행 및 이에 따른 가산세 위험을 사전에 줄일 수 있으며, 세무사랑Pro나 위셈을 통한 부가가치세 신고 데이터의 기초 정확도도 함께 높아집니다.

자주 묻는 질문

사업자등록증 OCR 정확도는 어느 수준입니까?

Naver Clova OCR의 사업자등록증 전용 도메인 모델 기준으로 사업자번호 추출 정확도는 99% 수준으로 알려져 있습니다. 단, 팩스로 수신하거나 여러 번 복사된 저화질 이미지에서는 정확도가 85~90% 수준으로 낮아질 수 있습니다. 이 경우 체크섬 검증을 함께 적용하면 잘못 읽은 번호를 자동으로 탐지하고 담당자 재확인을 요청하는 워크플로우를 구성할 수 있습니다. Lido는 이미지 품질이 낮을 때 담당자에게 수동 확인 알림을 자동으로 발송하는 기능을 제공합니다.

스마트폰으로 촬영한 사업자등록증 사진도 OCR 처리가 됩니까?

가능합니다. 다만 조도가 부족하거나 원근 왜곡이 심한 사진은 정확도가 낮아집니다. 영업 현장에서 촬영한 사진을 처리하는 경우, 문서 경계를 자동으로 감지하고 원근을 보정하는 전처리(pre-processing) 단계를 추가하면 정확도를 유지할 수 있습니다. Naver Clova OCR과 Lido는 각각 이 전처리 기능을 지원합니다. 촬영 가이드(A4 용지가 화면의 80% 이상을 채우도록 촬영, 그림자 없는 자연광 환경)를 영업팀에 안내하는 것만으로도 정확도를 5~10%p 높일 수 있습니다.

폐업·휴업 거래처를 등록 시점에 자동으로 차단하려면 어떻게 합니까?

OCR로 사업자번호를 추출한 직후 국세청 사업자등록 상태조회 API를 호출합니다. 응답 코드가 계속사업자(01)인 경우에만 거래처 등록을 진행하고, 휴업(02)이나 폐업(03)이면 등록을 중단하고 담당자에게 알림을 발송하는 로직을 파이프라인에 추가합니다. API 키는 홈택스 OpenAPI 포털에서 무료로 발급받을 수 있으며, 기본 등급 한도는 일 1,000건입니다. 이 자동화 흐름은 폐업 거래처에 전자세금계산서를 발행하는 실수를 원천 차단하여 부가가치세 신고 오류 위험을 크게 줄입니다.

기존 거래처 마스터를 주기적으로 자동 갱신하려면 어떻게 합니까?

분기 1회 기존 거래처 전체의 사업자번호 목록을 대상으로 국세청 상태조회 API를 일괄 호출하는 배치 스크립트를 운영합니다. 상태 변경(계속→휴업, 계속→폐업)이 감지된 거래처에 한해 담당자에게 이메일 또는 메신저 알림을 발송하고, 해당 거래처에 대한 신규 전자세금계산서 발행을 보류하는 플래그를 ERP에 자동으로 설정합니다. 대표자명이나 주소 변경은 국세청 API에서 확인되지 않으므로, 이 정보의 최신 여부는 거래처로부터 갱신된 사업자등록증 사본을 직접 수령하여 OCR 재처리하는 프로세스를 내부 운영 규정에 명시하는 것이 좋습니다.

Lido는 사업자등록증 외에 어떤 문서를 처리할 수 있습니까?

Lido는 세금계산서, 견적서, 발주서, 인보이스, 납품확인서, 통관 서류 등 다양한 비정형 문서에서 데이터를 추출할 수 있습니다. 사용자가 추출할 필드를 직접 지정하는 방식이기 때문에 특정 문서 형식에 제한이 없으며, 한국어를 포함한 다국어 문서를 모두 처리합니다. 월 $29(약 39,000원)의 고정 요금으로 사업자등록증뿐 아니라 회계·구매 부서에서 다루는 다양한 문서 자동화를 하나의 플랫폼에서 구성할 수 있어, 여러 OCR 솔루션을 별도로 계약하는 것보다 운영 비용과 관리 부담을 줄일 수 있습니다.

문서 자동화로 사업을 키울 준비가 되셨나요? 추가 인력 없이도 가능합니다

Lido와 함께 반복 업무를 자동화하며 더 빠르게 성장하는 수백 개 팀에 합류하세요.