'MODI'에 해당되는 글 1건

  1. 2009/08/17 OCR(Optical Character Recognition) Using MODI (1)
C#2009/08/17 14:20

안녕하세요. 김대욱입니다. 이번시간에 소개해 드릴내용은 OCR(Optical Character Recognition), 흔이들 문자인식이라고 부르는 기능을 MODI(Microsoft Office Document Image) Libarry를 이용해서 구현하는 방법입니다. 이전에 Tablet SDK를 이용하여 필기인식 방법에대해 소개해 드린바 있었는데요, 이번 시간에는 필기가 아닌 이미지에 포함된 문자를 인식 하는 내용이 되겠습니다. 아래는 시연 동영상 되겠습니다~



먼저 MODI를 사용하기 위해서는 Office 2003 이상의 버전이 설치 되어있어야 하는데요, Office를 설치하실때 아래 그림과 같이 Microsoft Office Document Image를 함께 설치 해주셔야 합니다. (만약 설치 되지 않으셨다면 기능추가/제거 기능을 이용해서 설치 하실 수 있습니다.)


MODI를 사용하시기 위해서는 프로젝트 참조추가에서 아래 그림과 같이 COM 탭에서 Microsoft Office Document Imaging 를 선택하시면 되겠습니다. 저같은경우 Offfice 2007을 설치 했기 때문에 12.0으로 표시 되지만, 2003을 사용하시는 분들은 아마 11.0으로 표시될 것입니다.


실제 MODI를 사용하여 OCR을 구현하기 위해서는 아래와 같이 사용하시면 됩니다. 아래는 샘플 프로젝트에 사용된 인식 관련 함수입니다. 주석이 거의 대부분이고 실체코드는 10줄도 안되니 이해하시는데 무리는 없을것 같습니다 ^^


지금까지 몇몇 이미지로 테스트를 해보았지만, 인식결과는 이미지 상태에 따라 천차 만별인것 같습니다. 5~10도 각도로 회전된 문자에 대해서는 대부분 완벽하게 인식을 수행 하지만, 그이상 혹은 잡음이 많이 포함되어있는 이미지에서는 인식률이 다소 떨어지는것 같습니다.아래는 전체 소스코드입니다.







저작자 표시 비영리 변경 금지
크리에이티브 커먼즈 라이선스
Creative Commons License
Posted by 곡스
TAG , ,