유틸

Windows 환경에서 Capture2Text OCR 툴 설치 및 간단 사용기

__observer__ 2018. 10. 9. 21:36
반응형

아래 포스팅에서 윈도우에서 사용할 수 있는 OCR 툴로서 Tesseract-OCR 라는 툴에 대한 설치 및 간단한 사용 방법에 대해서 소개를 한 적이 있습니다. 오늘은 비슷하지만 조금 다른 특성을 가진 윈도우 OCR 툴인 Capture2Text 에 대해서 소개해 보려 합니다.

Capture2Text 의 홈페이지 주소는 아래와 같습니다. 아래 주소에서 Capture2Text 에 대한 소개를 확인해 보면 Capture2Text 는 설치가 필요 없는 portable 프로그램 이고, 구글 번역, TTS(Text to speech) 기능 등도 들어 있다고 합니다. 조그만 툴인것 같은데 굉장히 기능이 많은것 같습니다.

https://sourceforge.net/projects/capture2text/

설치가 필요 없기 때문에 위 주소에서 다운로드 버튼을 눌러서 다운로드 후에 압축을 해제하고 바로 사용하시면 됩니다. 제가 다운로드 해 보니 60메가 정도 되네요. 다운로드 버튼을 누르고 느긋하게 커피 한잔 하고 오시면 될 것 같습니다.

기본 언어로 한글도 포함되어 있기 때문에 특별히 추가적인 언어 설치를 할 필요는 없을 것 같지만 혹시나 추가적인 언어 설치가 필요하신 분들은 아래 주소에서 필요한 언어를 다운로드해서 Capture2Text 의 tessdata 폴더에 넣고 Capture2Text 를 재시작 하시면 됩니다.

https://sourceforge.net/projects/capture2text/files/Dictionaries/

저는 Chocolatey 를 통해 아래 명령어로 설치했고~

choco install capture2text

아래 폴더에 언어 파일이 설치된 것을 확인할 수 있었습니다.

C:\ProgramData\chocolatey\lib\capture2text\tools\Capture2Text_v4.5.1_64bit\tessdata

SourceForge.net 에서 다운로드 해서 설치 하신 분들은 아래 폴더에 언어 파일이 설치된 것을 확인할 수 있습니다.

Capture2Text_v4.6.0_64bit\Capture2Text\tessdata

설치 폴더를 확인해 보시면 아래와 같이 실행 파일이 두 개가 있는 것을 확인할 수가 있고~ 파일 이름을 보시면 아시겠지만 하나는 GUI 프로그램이고 하나는 CLI 프로그램 입니다.

Capture2Text.exe, Capture2Text_CLI.exe

Capture2Text.exe 를 실행하면 윈도우 작업표시줄에 프로그램이 실행 된 것을 확인할 수 있습니다.

해당 아이콘을 오른쪽 클릭해서 Settings 에 들어가보면 단축키를 확인할 수가 있는데 Win + Q 가 OCR 캡처를 시작하는 기본 단축키로 설정되어 있어서 Windows 10 의 Cortana 런치키와 충돌이 생기므로 저는 아래와 같이 Alt 를 같이 눌러주도록 설정을 했습니다.

기본 OCR 언어 설정은 영어로 되어 있고~ 캡처 하고 싶은 이미지 부분에 커서를 위치 시킨 후 위에서 설정한 Start OCR Capture 단축키를 누르면 캡처가 시작됩니다. 드래그 해서 범위를 설정해 주면 아래 화면에서 보시는 바와 같이 왼쪽 위편에 OCR 된 텍스트가 표시되고~ 드래그가 끝나면 캡쳐가 마무리 됩니다.

캡쳐가 마무리되면 인식된 텍스트가 클립보드에 들어가게 되고~ Ctrl + V 를 해서 붙여넣기를 하면 됩니다. 다른 언어를 인식하기 위해서는 아래와 같이 OCR 언어 설정을 변경해 준 후에 Start OCR Capture 과정을 진행하시면 됩니다.

테스트 해 본 결과 영어에 대한 인식은 대체적으로 잘 되는 것 같지만 한글에 대한 인식은 이전에 소개했던 Tesseract-OCR 에 비해 조금 떨어지는 것 같습니다. 

http://iamaman.tistory.com/2615


그래도 빠르게 캡처하면서 영어 이미지에 대해서 인식을 하는 경우에는 굉장히 좋은것 같고 캡처와 동시에 번역도 자동으로 되게 설정할 수 있기 때문에 OCR 후 바로 바로 번역하는 경우에는 정말 괜찮은 툴인것 같네요~



반응형