본문 바로가기
Smart Office/Google

이미지에서 텍스트를 추출하는 빠르고 간단한 방법 Google Keep을 활용한 OCR

by 둠두미 2017. 11. 22.





메모 앱 어떤거 쓰세요?


저는 에버노트(Evernote)와 구글킵(Google Keep)을 같이 사용하고 있습니다.


특성에 따라 약간 다르게 사용하고, 일단 대략 정리한 다음 구글문서(Google Docs)로 최종 정리본을 만들어 보관하고 있는데요...


구글킵의 장점은 가볍고, 빠르고, 단순하고, 어느 OS에서나 사용 가능하고, 무료다. 라는 것입니다.


단점은... 안 예쁘다.   : (



지금은 메모 앱에 대한 소개가 아니기 때문에... 일단 OCR 기능에 집중해 보겠습니다.


일반적으로 OCR(optical character reader/recognition) 이라는 기능을 통해 이미지에서 텍스트를 추출할 수 있고, 다양한 툴들이 있는데요...


Google Keep은 별도 프로그램 설치 없이 간편한 방법으로 텍스트를 추출할 수 있습니다.


OCR은 10년도 더 된 역사를 가지고 있고, 이전에는 영문은 90% 이상의 인식률을 보여 줬으나 한글은 인식률이 많이 떨어져서 사용을 잘 하지 않았었습니다. 그거 수정하느니 새로 만드는게 낫다. 라는 것이었죠.


그러나 최근에는 한글의 인식률이 엄청 많이 개선이 되었습니다.


필요한 부분을 스캔을 했거나, 스크린 캡쳐를 했는데... 이를 다시 타이핑 하기 힘들거나 귀찮을 때 사용해 볼만 합니다. 악의적인 용도로는 사용하지 마시고요.


일단, 해보겠습니다.


되도록이면 선명한 이미지가 좋습니다.





샘플은 Google Play북에 등록된 무료도서를 바탕으로 진행해 보았습니다.




OCR 테스트용으로 이미지 하나를 캡쳐 해 보았습니다. 캡쳐한 이미지를 저장합니다.


Google Keep을 실행합니다.




메모 작성 영역의 하단 아이콘인 '이미지 추가'를 선택해서 저장해 놓은 이미지를 올립니다.



추가 메뉴를 선택하면 '이미지에서 텍스트 가져오기'가 나옵니다.


이를 선택해 보면 이미지에서 텍스트를 추출하는 과정이 progress bar로 노출됩니다.




텍스트 추출이 완료된 모습입니다.


긁어 보면 텍스트 인식이 잘 됩니다. '.' 같은 것들이 간혹 생략되어 노출되지 않기도 하는데... 인식률은 거의 완벽에 가깝습니다.


추출된 자료를 워드 등의 문서 프로그램으로 살짝 수정만 해 주면 됩니다.






[공감] 버튼을 클릭해 주시면 블로그 주인에게 큰 힘이 됩니다.

 

공감은 별도의 로그인이 필요 없습니다.




댓글