본문 바로가기
툴툴털자/유용TIP

이미지의 텍스트 추출하기_imagetotext (feat.chatGPT)

by 홍장 2023. 6. 22.

 

이번 포스팅에서는 "이미지의 텍스트를 추출" 하고 사용해본 과정입니다 

또는 "이미지 텍스트로 변환" 한다고 표현되고 있기도 합니다. 

먼저 무료로 사용할 수 있는 사이트입니다. 

 

https://www.imagetotext.info/ko/image-to-text

 

 

 

이미지를 텍스트로- 이미지 텍스트 추출

이미지, WhatsApp 상태, Instagram 스토리, Twitter 피드, Pinterest 또는 수업 노트의 스크린샷(PDF, Word 등)에서 텍스트를 가져옵니다. 친구의 손으로 쓴 텍스트를 인식할 수 없는 경우 이 도구가 해결해 드

www.imagetotext.info

 

 

 

방법은 아주 간단합니다. 로그인 없이 바로 사용이 가능합니다

일반적인 개인이 대량의 이미지를 텍스트로 추출하는 경우는 거의 없을것 같습니다.

유로 프리미엄 기능은 참고만 하고 여유롭게 기다리시면 변환이 완료됩니다

<2023년 하반기 역전세 위기 시군구 _ 출처.중앙>

위 이미지로 테스트를 진행 하였습니다. 

찾아보기로 PC에 저장된 이미지를 업로드 한후, 제출하기 버튼을 클릭해줍니다.

텍스트나 이미지 크기에 비해서 결과 속도가 빠른편은 아니였습니다

 

텍스트는 위 처럼 추출 됩니다. 활용하기에는 편집해야하는 번거로움이 있습니다. 

엑셀이나 웹에 바로 업로드 할수 있도록 챗GPT 를 활용해서 수정해보겠습니다

챗GPT는 가입하면 바로 사용해보실 수 있습니다. 

https://chat.openai.com/

 

 

 

"클립보드에 복사" 버튼으로 전체를 복사한 후, 

챗GPT의 프롬프트 입력란에 붙여넣기 하고,
"위 내용을 아래 양식에 맞춰서 표로 정리해줘
시군구 | 전체(건) | 역전세(건) | 역전세 비중(%) "

를 입력합니다. 

| 기호가 표의 열 구분을 의미합니다. 

 

챗GPT의 답변 결과는 검수가 필수입니다. 

먼저 마지막행의 결과값이 오류가 바로 보여서, 재수정을 한후 아래와 같은 답을 얻었습니다. 

위 요청에 보면 저는 '수정해서' 라고 오타를 냈지만,

챗GPT는 대화 흐름상 '수정해줘' 라고 이해하고 결과를 주었습니다. 

 

 

챗GPT 표를 드래그로 복사하여 엑셀이나, 웹에 붙여넣기 하여 활용 하실 수 있습니다. 

먼저 구글 시트에 복사 한 결과입니다 

붙여넣고 확인해보니, 오타가 추가로 발견되었습니다. 

7행의 '대구 아빠군' → '대구 달성군' 으로 수정했습니다. 

아래는 위 구글시트의 표 범위를 그대로 복사한 후 붙여넣기 하고,

제목행의 글자 색상만 흰색, 정렬을 가운데로 수정한 결과 입니다. 

시/군/구 전체(건) 역전세 과세(건) 역전세 과세기간(%)
대구 중구 120 116 96.7
대구 달서구 452 429 94.9
충청남도 당진시 327 306 93.6
전라남도 영암군 175 163 93.1
경기 과천시 464 431 92.9
대구 달성군 250 231 92.4
대구 동구 273 246 90.1
대구 수성구 572 505 88.3
인천 부평구 1050 910 86.7
인천 서구 1267 1097 86.6
대구 북구 354 305 86.2
경기 양주시 690 592 85.8
부산 남구 234 200 85.5
부산 기장군 258 217 84.1
인천 미추홀구 318 267 84

https://www.imagetotext.info/ko/image-to-text

에서는 이미지의 텍스트를 추출 외에도,  다양한 변환 기능들을 무료로 사용할 수 있습니다. 

 

텍스트 추출만 먼저 선행된다면, 챗GPT를 통해서 편집하고, 요약하는것이 수월해 집니다. 

이번 샘플은 한글이었지만, 다른 언어로 된 이미지였다면 이와 같은 방법은 시간은 낮추고 정확도는 높여줄 것입니다. 

다시한번 강조하지만, chatGPT를 활용한다면 검수는 필수입니다! 

 

다음에는 챗GPT로 PDF 파일을 요약하는 과정을 포스팅 해보겠습니다.