이번 포스팅에서는 "이미지의 텍스트를 추출" 하고 사용해본 과정입니다
또는 "이미지 텍스트로 변환" 한다고 표현되고 있기도 합니다.
먼저 무료로 사용할 수 있는 사이트입니다.
https://www.imagetotext.info/ko/image-to-text
방법은 아주 간단합니다. 로그인 없이 바로 사용이 가능합니다
일반적인 개인이 대량의 이미지를 텍스트로 추출하는 경우는 거의 없을것 같습니다.
유로 프리미엄 기능은 참고만 하고 여유롭게 기다리시면 변환이 완료됩니다
위 이미지로 테스트를 진행 하였습니다.
찾아보기로 PC에 저장된 이미지를 업로드 한후, 제출하기 버튼을 클릭해줍니다.
텍스트나 이미지 크기에 비해서 결과 속도가 빠른편은 아니였습니다
텍스트는 위 처럼 추출 됩니다. 활용하기에는 편집해야하는 번거로움이 있습니다.
엑셀이나 웹에 바로 업로드 할수 있도록 챗GPT 를 활용해서 수정해보겠습니다
챗GPT는 가입하면 바로 사용해보실 수 있습니다.
"클립보드에 복사" 버튼으로 전체를 복사한 후,
챗GPT의 프롬프트 입력란에 붙여넣기 하고,
"위 내용을 아래 양식에 맞춰서 표로 정리해줘
시군구 | 전체(건) | 역전세(건) | 역전세 비중(%) "
를 입력합니다.
| 기호가 표의 열 구분을 의미합니다.
챗GPT의 답변 결과는 검수가 필수입니다.
먼저 마지막행의 결과값이 오류가 바로 보여서, 재수정을 한후 아래와 같은 답을 얻었습니다.
위 요청에 보면 저는 '수정해서' 라고 오타를 냈지만,
챗GPT는 대화 흐름상 '수정해줘' 라고 이해하고 결과를 주었습니다.
챗GPT 표를 드래그로 복사하여 엑셀이나, 웹에 붙여넣기 하여 활용 하실 수 있습니다.
먼저 구글 시트에 복사 한 결과입니다
붙여넣고 확인해보니, 오타가 추가로 발견되었습니다.
7행의 '대구 아빠군' → '대구 달성군' 으로 수정했습니다.
아래는 위 구글시트의 표 범위를 그대로 복사한 후 붙여넣기 하고,
제목행의 글자 색상만 흰색, 정렬을 가운데로 수정한 결과 입니다.
시/군/구 | 전체(건) | 역전세 과세(건) | 역전세 과세기간(%) |
대구 중구 | 120 | 116 | 96.7 |
대구 달서구 | 452 | 429 | 94.9 |
충청남도 당진시 | 327 | 306 | 93.6 |
전라남도 영암군 | 175 | 163 | 93.1 |
경기 과천시 | 464 | 431 | 92.9 |
대구 달성군 | 250 | 231 | 92.4 |
대구 동구 | 273 | 246 | 90.1 |
대구 수성구 | 572 | 505 | 88.3 |
인천 부평구 | 1050 | 910 | 86.7 |
인천 서구 | 1267 | 1097 | 86.6 |
대구 북구 | 354 | 305 | 86.2 |
경기 양주시 | 690 | 592 | 85.8 |
부산 남구 | 234 | 200 | 85.5 |
부산 기장군 | 258 | 217 | 84.1 |
인천 미추홀구 | 318 | 267 | 84 |
https://www.imagetotext.info/ko/image-to-text
에서는 이미지의 텍스트를 추출 외에도, 다양한 변환 기능들을 무료로 사용할 수 있습니다.
텍스트 추출만 먼저 선행된다면, 챗GPT를 통해서 편집하고, 요약하는것이 수월해 집니다.
이번 샘플은 한글이었지만, 다른 언어로 된 이미지였다면 이와 같은 방법은 시간은 낮추고 정확도는 높여줄 것입니다.
다시한번 강조하지만, chatGPT를 활용한다면 검수는 필수입니다!
다음에는 챗GPT로 PDF 파일을 요약하는 과정을 포스팅 해보겠습니다.
'툴툴털자 > 유용TIP' 카테고리의 다른 글
pdf ppt 변환하기(모든문서 가능) (2) | 2016.05.29 |
---|---|
다음 사이트 리뷰관리 등록하기 (0) | 2016.05.09 |
px cm / px mm / px em 변환 방법 알아보기 (0) | 2016.04.17 |