본문 바로가기
programming language/Autohotkey

Autohotkey OCR 프로그램 Vis2 (using tesseract)

by __observer__ 2018. 11. 28.
반응형

Autohotkey 잘~ 사용하고 계신가요? 저는 가끔씩 오토핫키 포럼에 들어가 보는데~ 오토핫키 포럼에 들어가면 정말 훌륭한 Autohotkey 코드들이 많이 있습니다. 최근에는 조금 뜸하게 들어가 보다가 이번에 Autohotkey 포럼에서 찾은 괜찮은 코드를 하나 소개해 드리려고 합니다.

오토핫키 포럼의 주소는 아래와 같습니다.

https://www.autohotkey.com/boards/

오토핫키 포럼에서 괜찮은 프로젝트들을 찾기 위해서는 아래 주소의 “Scripts and Functions” 페이지에 들어가 보면 됩니다.

https://www.autohotkey.com/boards/viewforum.php?f=6&sid=a590fb371498805bf28158722033ff21

그 중에 최근 발견한 괜찮은 Autohotkey 코드는 Vis2 라는 Image to Text OCR 라이브러리 입니다. 포럼에서 Vis2 에 대한 소개 페이지는 아래와 같은데 ~

https://www.autohotkey.com/boards/viewtopic.php?f=6&t=36047

위 주소에서 설명하듯이 단축키를 사용하여 화면의 이미지로부터 텍스트를 추출할수 있는 어플리케이션 입니다. 순수 Autohotkey 로 만들어진 것은 아니고 OCR(Optical Character Recognition) 을 하는데 아래 포스팅에서 소개해던 tesseract 를 사용하게 됩니다.

http://iamaman.tistory.com/2615

Vis2를 사용하기 위해서는 아래 github 페이지에서 코드를 클론 또는 다운로드 한 후에~ demo.ahk 파일을 실행시켜 보면~ 데모 프로그램이 실행되고~

https://github.com/iseahound/Vis2

git clone https://github.com/iseahound/Vis2.git

아래와 같이 샘플코드가 실행되는 것을 확인 할 수 있습니다.

메시지 박스로 나오는 부분은 같이 들어있는 test.jpg 이미지에 대한 OCR 결과가 나오는 것을 확인 할 수 있고 프로그램 실행시 소개되는 내용과 같이 Win + C 단축키를 통해 텍스트 인식을 실행 할 수 있습니다.

아래 주소에서 tesseract 언어 파일들을 다운로드 해서 영어 이외의 다른 언어들에 대해서도 인식이 가능하다고 합니다.

https://github.com/tesseract-ocr/tessdata_best

https://github.com/tesseract-ocr/tessdata_fast

코드에서 확인 할 수 있는 바와 같이 Win + C 를 누르면 OCR 이 실행되고 기본 언어는 영어 입니다. ① 에서와 같이 인식하고 싶은 부분을 Drag 해서 블록 설정하면 ② 부분과 같이 인식된 텍스트가 나오게 됩니다.

그리고 인식된 텍스트는 클립보드에 저장 됩니다. 따라서 Ctrl + V 를 통해 인식된 텍스트를 붙여넣기 할 수 있습니다.

아래 포스팅에서 소개했던 Capture2Text 와 유사한 툴이라 비교하면서 사용해 보시는 것도 좋을 것 같습니다.

http://iamaman.tistory.com/2616



반응형

댓글