미디어센터

세포아소프트는 지출 최적화의 시장 선도자로
기업의 현명하고 합리적이고 계획적인 지출 문화를 선도하는 혁신 역할을 하며,
올인원(All-In-One) 지출관리 플랫폼을 만들어갑니다.

OCR(광학문자인식)의 정의, 역사, 진화과정

 

안녕하세요:)

지출관리플랫폼 No.1 세포아소프트 입니다!

“OCR(Optical Character Recognition)이 뭘까요?”

세포아소프트의 주요 컴포넌트 서비스 “Poa-DocsCV(문서변환솔루션)” 제품의 핵심요소 기술인

“OCR(Optical Character Recognition)”에 대해 알아보겠습니다.

 

 ” Poa-DocsCV “서비스란?

아래 링크를 통해 더욱 자세히!

https://blog.naver.com/sepoa0127/222315261228

 

OCR (Optical Character Recognition)의 역사

먼저, OCR의 역사에 대해 간략히 살펴보도록 하겠습니다.

 

서류 보관에 대한 중요성이 커짐에 따라 문서 전자화 시스템을 도입하고 있는 기업들이 증가하고 있습니다.

이러한 가운데 수작업 위주의 입력 저장 방식을 혁신하기 위한 기술로 광학문자인식이라고 하는 OCR이 부상하였습니다. 스캐너를 통해 입력된 문서 영상에서 문자에 해당하는 부분의 내용을 인식하는 기술을 말합니다.

OCR기술의 실용화 연구는 1920년대 후반부터 시작되었고, 1928년 오스트리아의 구스타프 타우셰크(Gustav Tauschek) 박사가 문자 인식 방법을 특허로 등록하면서 역사적인 진일보를 내디뎠습니다. 이후 많은 연구를 통해 다양한 OCR제품이 개발되었고 물류와 금융 산업을 필두로 여러 분야에서 상용화되었습니다.

그 결과 우편번호 추출을 통한 우편물관리, 자동차 번호판 인식, 모바일 기기를 사용한 명함 인식 등 다양한 산업분야에서 OCR적용법위가 확대되었습니다. 특히 금융분야에서 전표나 수표를 자동입력할때 실용화된 OCR기술이 적용되어 정확도가 높아졌습니다. 일반적인 OCR제품은 문서 전체를 읽어서 문자를 인식하는 방식으로 기술이 구현됩니다 이중 불필요한 부분까지 인식되는 경우가 있어 이럴땐 수작업으로 분류해야 하는 불편함이 여전히 존재합니다.

그러나 최근 IT기술이 발달하면서 OCR도 진화하고 있습니다. 특히 스마트폰 보급의 확산으로 카메라 촬영 기법이 고도화되면서 OCR의 정확성과 범용성이 더욱 확대되었습니다. 그결과, OCR의 산업적 효용가치는 가히 폭발적인 상황으로 손으로 쓴 문자, 마크 등에 빛을 비춰 그 반사 광선을 전기신호로 바꾸어 컴퓨터에 입력하는 장치로까지 활용되고 있습니다. 이것은 수많은 산업 분야에서 효율적인 데이터 관리를 하는데 일조하였습니다.

 

OCR의 방식과 진화과정

다음 OCR의 방식과 진화과정에 대해 알아보겠습니다.

 

OCR의 근간기술인 문자인식방법은 문자패턴의 표현방법과 분류방법에 의해 원형정합(template matching)방법, 통계적(statistical)방법, 구조 분석적(structural analysis)방법 등으로 나누어집니다.

 

원형정합(template matching)방법

문자의 패턴을 배열 형태로 분류해 원형 패턴과 비교, 가장 유사한 형태를 찾아내는 방법

통계적(statistical)방법

학습단계를 통해 특정 벡터의 통계적인 확률분포 특징을 구하고, 이를 이요해 특징 벡터 공간을 각 분류별로 분리하는 방법

구조 분석적(structural analysis)방법

문자의 구성 원리에 입각해 자획 등고 같은 문자를 구성하는 기본요소와 그들의 연관성을 추출해 문자를 인식하는 방법

인공신경망(neural network)방법

계산량이 많고 병렬성을 요구하는 문제에 적합한 방법

 

1. 원형정합(template matching)방법

원형정합 방법은 문자 패턴을 배열 형태로 분류해 원형 패턴과 비교해 가장 유사한 형태를 찾아내는 방법입니다. 이 방법은 초기에는 많이 사용됐지만 주로 하나의 고정된 형식의 문자에 대해서만 사용 가능하다는 문제점으로 인해 현재는 사용을 거의 하지 않습니다.

 

2. 통계적(statistical)방법

통계적 문자 인식 방법은 인식대상에서 특징벡터를 추출해 문자 인식을 하는 방법을 뜻합니다. 학습단계를 통해 특징벡터의 통계적인 확률분포 특징을 구하고 이를 활용해 특징벡터 공간을 각 분류별로 분리시킵니다.

 

3. 구조 분석적(structural analysis)방법

구조 분석적 문자 인식 방법은 문자의 구성 원리에 입각해 자획 등과 같은 문자를 구성하는 기본요소와 그들의 연관성을 추출, 문자를 인식하는 방법입니다.

이 방법은 이론적인 정립이 잘 되어 있고 방법이 단순한 장점을 가지고 있으나 특징 문자에 대한 규칙이 활자체에 따라 매우 다양해지므로 인식 시간이 오래 걸린다는 단점이 있습니다.최근에는 문자 패턴을 인식하기 위해 인공지능시스템 중 하나인 인공신경망 모델(Neural Networks Model)을 이용한 연구가 각광 받고 있습니다.

 

4. 인공신경망(neural network)방법

인공 신경망 모델은 인간의 뇌구조를 모형화해 뇌를 구성하는 기본 단위인 뉴런으로 단순한 계산소자의 연결을 통해 좋은 성능을 나타낸다는 것을 기본 가정으로 하고 있습니다. 따라서 인공 신경망 모델은 음성, 문자, 이미지 분석 등 계산량이 많고 병렬성을 요구하는 문제에 적합한 모델입니다. 최근 가장 많이 활용되는 OCR 기술이기도 합니다.

 

 

관련 블로그 글