본문 바로가기
프로그래밍 언어(Programming Languages)/파이썬(Python)

📸 Python으로 OCR 쉽게 따라하기! 🐍

by 데이터 벌집 2025. 1. 1.
반응형

안녕하세요! 🖐 오늘은 이미지 속 텍스트를 컴퓨터가 읽을 수 있도록 바꿔주는 OCR(Optical Character Recognition) 기술에 대해 알아볼게요! 🧐 특히 PyTesseractOpenCV를 사용해 Python으로 OCR을 구현하는 법을 간단히 설명드릴게요! ✨

 

📸 Python으로 OCR 쉽게 따라하기! 🐍

 

💡 OCR이 뭐길래 배워야 할까?

이미지에서 텍스트를 수작업으로 추출하는 건 정말 귀찮고 시간도 오래 걸리죠. 🕰️ OCR을 사용하면 이미지를 손쉽게 편집 가능한 텍스트로 바꿀 수 있어요! 활용 예시는 다음과 같아요:

  • 📄 문서 디지털화: 종이 문서나 PDF, 사진 속 텍스트를 검색 가능하고 편집할 수 있는 파일로 변환!
  • 🧾 데이터 자동 입력: 영수증이나 양식에서 정보를 추출해 데이터베이스로 자동 입력!
  • 🛑 자율주행 자동차: 교통 표지판이나 번호판을 인식!
  • 🧑‍🦯 접근성 개선: 시각장애인을 위한 텍스트 음성 변환!

🛠️ Python에서 OCR 구현하기

OCR을 구현하려면 PyTesseract(Tesseract의 Python API)와 OpenCV가 필요해요. 설치 방법부터 시작해볼게요! 📦

1️⃣ PyTesseract와 OpenCV 설치하기

pip install pytesseract opencv-python

 

2️⃣ 텍스트 추출하기

이미지를 로드한 뒤 PyTesseract의 image_to_string() 메서드를 사용하면 텍스트를 추출할 수 있어요!

import cv2
import pytesseract

# 이미지 불러오기
img = cv2.imread("example_image.png")

# 텍스트 추출
text = pytesseract.image_to_string(img)
print(text)
 

🎉 완료! 단 몇 줄의 코드로 이미지에서 텍스트를 뽑아낼 수 있어요!

 

📦 더 나아가기: PDF에서 텍스트 추출

스캔한 PDF에서 텍스트를 추출하려면 pdf2image 라이브러리도 필요해요. 먼저 PDF를 이미지로 변환한 다음 OCR을 적용하면 됩니다.

PDF 변환 및 OCR 코드:

from pdf2image import convert_from_path

# PDF를 이미지로 변환
pages = convert_from_path("example.pdf", fmt="png")

# 변환된 이미지에서 텍스트 추출
for page in pages:
    text = pytesseract.image_to_string(page)
    print(text)

🎨 OCR 정확도 높이는 이미지 전처리 꿀팁

이미지가 깨끗할수록 결과가 좋아요! OpenCV로 이미지 전처리를 추가해보세요:

  1. 흑백 변환: cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
  2. 노이즈 제거: cv2.medianBlur(image, 5)
  3. 경계선 강조: cv2.filter2D(image, -1, kernel)

🔍 결과 확인하기

이 방법으로 텍스트를 추출한 뒤, 검색 가능한 PDF로 저장하거나 텍스트를 데이터베이스에 넣어보세요. OCR을 활용하면 다양한 프로젝트를 효율적으로 처리할 수 있어요! 🏆


🖋️ 마무리하며...

오늘은 Python과 PyTesseract로 OCR을 다뤄봤어요. 이미지에서 텍스트를 추출하는 과정을 직접 해보며, 디지털 문서 작업의 자동화에 한 발 더 다가가보세요! 💻


🔗 추가로 배워볼 만한 것들:

  • OpenCV로 이미지 처리 배우기 📷
  • PyTesseract 고급 설정 다루기 🎛️

감사합니다! 💕 ✍️

반응형