안녕하세요:)

지출관리플랫폼 No.1 세포아소프트 입니다!

“OCR(Optical Character Recognition)이 뭘까요?”

세포아소프트의 주요 컴포넌트 서비스 “Poa-DocsCV(문서변환솔루션)” 제품의 핵심요소 기술인

“OCR(Optical Character Recognition)”에 대해 알아보겠습니다.

 

 ” Poa-DocsCV “서비스란?

아래 링크를 통해 더욱 자세히!

https://blog.naver.com/sepoa0127/222315261228

 

OCR (Optical Character Recognition)의 역사

먼저, OCR의 역사에 대해 간략히 살펴보도록 하겠습니다.

 

서류 보관에 대한 중요성이 커짐에 따라 문서 전자화 시스템을 도입하고 있는 기업들이 증가하고 있습니다.

이러한 가운데 수작업 위주의 입력 저장 방식을 혁신하기 위한 기술로 광학문자인식이라고 하는 OCR이 부상하였습니다. 스캐너를 통해 입력된 문서 영상에서 문자에 해당하는 부분의 내용을 인식하는 기술을 말합니다.

OCR기술의 실용화 연구는 1920년대 후반부터 시작되었고, 1928년 오스트리아의 구스타프 타우셰크(Gustav Tauschek) 박사가 문자 인식 방법을 특허로 등록하면서 역사적인 진일보를 내디뎠습니다. 이후 많은 연구를 통해 다양한 OCR제품이 개발되었고 물류와 금융 산업을 필두로 여러 분야에서 상용화되었습니다.

그 결과 우편번호 추출을 통한 우편물관리, 자동차 번호판 인식, 모바일 기기를 사용한 명함 인식 등 다양한 산업분야에서 OCR적용법위가 확대되었습니다. 특히 금융분야에서 전표나 수표를 자동입력할때 실용화된 OCR기술이 적용되어 정확도가 높아졌습니다. 일반적인 OCR제품은 문서 전체를 읽어서 문자를 인식하는 방식으로 기술이 구현됩니다 이중 불필요한 부분까지 인식되는 경우가 있어 이럴땐 수작업으로 분류해야 하는 불편함이 여전히 존재합니다.

그러나 최근 IT기술이 발달하면서 OCR도 진화하고 있습니다. 특히 스마트폰 보급의 확산으로 카메라 촬영 기법이 고도화되면서 OCR의 정확성과 범용성이 더욱 확대되었습니다. 그결과, OCR의 산업적 효용가치는 가히 폭발적인 상황으로 손으로 쓴 문자, 마크 등에 빛을 비춰 그 반사 광선을 전기신호로 바꾸어 컴퓨터에 입력하는 장치로까지 활용되고 있습니다. 이것은 수많은 산업 분야에서 효율적인 데이터 관리를 하는데 일조하였습니다.

 

OCR의 방식과 진화과정

다음 OCR의 방식과 진화과정에 대해 알아보겠습니다.

 

OCR의 근간기술인 문자인식방법은 문자패턴의 표현방법과 분류방법에 의해 원형정합(template matching)방법, 통계적(statistical)방법, 구조 분석적(structural analysis)방법 등으로 나누어집니다.

 

원형정합(template matching)방법

문자의 패턴을 배열 형태로 분류해 원형 패턴과 비교, 가장 유사한 형태를 찾아내는 방법

통계적(statistical)방법

학습단계를 통해 특정 벡터의 통계적인 확률분포 특징을 구하고, 이를 이요해 특징 벡터 공간을 각 분류별로 분리하는 방법

구조 분석적(structural analysis)방법

문자의 구성 원리에 입각해 자획 등고 같은 문자를 구성하는 기본요소와 그들의 연관성을 추출해 문자를 인식하는 방법

인공신경망(neural network)방법

계산량이 많고 병렬성을 요구하는 문제에 적합한 방법

 

1. 원형정합(template matching)방법

원형정합 방법은 문자 패턴을 배열 형태로 분류해 원형 패턴과 비교해 가장 유사한 형태를 찾아내는 방법입니다. 이 방법은 초기에는 많이 사용됐지만 주로 하나의 고정된 형식의 문자에 대해서만 사용 가능하다는 문제점으로 인해 현재는 사용을 거의 하지 않습니다.

 

2. 통계적(statistical)방법

통계적 문자 인식 방법은 인식대상에서 특징벡터를 추출해 문자 인식을 하는 방법을 뜻합니다. 학습단계를 통해 특징벡터의 통계적인 확률분포 특징을 구하고 이를 활용해 특징벡터 공간을 각 분류별로 분리시킵니다.

 

3. 구조 분석적(structural analysis)방법

구조 분석적 문자 인식 방법은 문자의 구성 원리에 입각해 자획 등과 같은 문자를 구성하는 기본요소와 그들의 연관성을 추출, 문자를 인식하는 방법입니다.

이 방법은 이론적인 정립이 잘 되어 있고 방법이 단순한 장점을 가지고 있으나 특징 문자에 대한 규칙이 활자체에 따라 매우 다양해지므로 인식 시간이 오래 걸린다는 단점이 있습니다.최근에는 문자 패턴을 인식하기 위해 인공지능시스템 중 하나인 인공신경망 모델(Neural Networks Model)을 이용한 연구가 각광 받고 있습니다.

 

4. 인공신경망(neural network)방법

인공 신경망 모델은 인간의 뇌구조를 모형화해 뇌를 구성하는 기본 단위인 뉴런으로 단순한 계산소자의 연결을 통해 좋은 성능을 나타낸다는 것을 기본 가정으로 하고 있습니다. 따라서 인공 신경망 모델은 음성, 문자, 이미지 분석 등 계산량이 많고 병렬성을 요구하는 문제에 적합한 모델입니다. 최근 가장 많이 활용되는 OCR 기술이기도 합니다.

 

 

개인정보처리방침

시행일: 2025년 10월 14일

세포아소프트(이하 '회사')는 이용자의 개인정보를 소중히 여기며, 「개인정보 보호법」 등 관련 법령을 준수합니다.
회사는 이용자의 개인정보를 보호하고 관련 민원을 신속하고 원활하게 처리하기 위하여 다음과 같이 개인정보처리방침을
수립·공개합니다.

1. 개인정보의 처리 목적

회사는 다음의 목적을 위하여 최소한의 개인정보를 수집·이용합니다.

  • 고객 문의 접수 및 답변 제공
  • 서비스 관련 문의사항 응대 및 상담 이력 관리

2. 수집하는 개인정보 항목

회사는 문의하기(고객문의) 기능을 통해 다음과 같은 개인정보를 수집합니다.

  • 필수항목: 이름, 이메일, 소속(회사명)
  • 자동수집항목: IP 주소, 접속 일시, 방문 기록 등(트래픽 분석 도구를 통한 수집 시)

3. 개인정보의 처리 및 보유기간

회사는 개인정보 수집 및 이용 목적이 달성된 후에는 해당 정보를 지체 없이 파기합니다. 다만, 다음의 기간 동안 보관 후 파기합니다.

  • 보유기간: 문의 처리 완료 후 최대 1년 이내 보관
  • 이후 복구 불가능한 방법으로 안전하게 파기합니다.

4. 개인정보의 제3자 제공

회사는 이용자의 개인정보를 제3자에게 제공하지 않습니다. 다만, 법령에 의거하거나 수사기관의 적법한 절차에 의한 요청이 있을 경우 예외로 합니다.

5. 개인정보 처리의 위탁

회사는 안정적인 홈페이지 운영을 위하여 아래와 같이 개인정보 처리를 위탁하고 있습니다.

수탁업체 위탁업무 내용 보유 및 이용기간
Amazon Web Services, Inc. (AWS) 홈페이지 서버 운영 및 관리 위탁계약 종료 시 또는 개인정보 보유기간 만료 시까지

AWS는 세포아소프트의 개인정보를 안전하게 관리하기 위한 기술적·관리적 보호조치를 이행합니다.

6. 자동수집항목 및 쿠키의 사용

회사는 이용자 편의성 향상 및 서비스 품질 개선을 위하여 쿠키(Cookie) 및 트래픽 분석 도구(Google Analytics 등)를 사용할 수 있습니다. 이 과정에서 방문자의 IP 주소, 접속 일시, 이용한 서비스 기록 등의 정보가 자동으로 수집될 수 있으며, 수집된 정보는 통계 분석 및 서비스 개선 목적 외의 용도로 사용되지 않습니다.

이용자는 브라우저 설정을 통해 쿠키 저장을 거부하거나 삭제할 수 있습니다. (단, 쿠키 차단 시 일부 서비스 이용이 제한될 수 있습니다.)

7. 정보주체의 권리 및 행사방법

이용자는 언제든지 자신의 개인정보에 대한 열람, 정정, 삭제, 처리정지를 요청할 수 있습니다. 요청은 아래 개인정보 보호책임자에게 이메일 또는 전화로 접수할 수 있으며, 회사는 지체 없이 조치합니다.

8. 개인정보의 파기절차 및 방법

회사는 개인정보의 보유기간이 경과하거나 처리 목적이 달성된 경우, 다음과 같은 방법으로 안전하게 파기합니다.

  • 전자적 파일 형태: 복구 불가능한 기술적 방법으로 완전 삭제
  • 종이 문서: 분쇄 또는 소각 처리

9. 개인정보의 안전성 확보조치

회사는 개인정보보호법에 따라 다음과 같은 안전성 확보 조치를 시행하고 있습니다.

  • 개인정보 접근 권한 최소화 및 접근통제
  • 개인정보처리시스템 접근 로그 보관 및 모니터링
  • 암호화 및 보안프로그램 설치
  • 정기적인 개인정보보호 교육 실시

10. 개인정보 보호책임자 및 담당부서

이용자는 개인정보 관련 문의, 열람·정정·삭제 요청, 불만처리, 피해구제 등을 아래로 문의할 수 있습니다.

개인정보 보호책임자

성명: 전선경

직책: 전무

연락처: contact@sepoasoft.co.kr / 02-6242-3094

11. 개인정보처리방침의 변경

본 개인정보처리방침은 2025년 10월 14일부터 적용됩니다. 향후 내용이 변경될 경우, 세포아소프트 홈페이지 하단의
'개인정보처리방침' 링크를 통해 변경 내용을 확인할 수 있습니다.