본문 바로가기

OCR 스캔한 문서에서 텍스트 추출

by dig it 2023. 5. 31.

OCR 스캔한 문서에서 텍스트 혹은 이미지 추출 

 

https://blog.naver.com/cheesekim1208/221981591964

 

pdf 파일을 ocr로 변환해주는 사이트&프로그램 추천

아이패드를 사용하다 보면 OCR 인식이 되는 PDF파일이 필요합니다. 이럴 경우 매우 유용한 사이트 및...

blog.naver.com

 

 

https://helpx.adobe.com/kr/acrobat/using/edit-scanned-pdfs.html

 

스캔한 PDF 편집

설정을 사용하여 OCR 언어를 변경하고, 시스템 글꼴 사용 여부를 선택하고, 모든 페이지를 한 번에 편집할 수 있습니다. 오른쪽 창에서 [스캔한 문서] 아래의 설정을 클릭합니다. 이 대화 상자에

helpx.adobe.com

 

 

 

OCR

光學文字認識 / 광학 문자 인식 / Optical Character Recognition (OCR)

보통 컴퓨터가 2진법(0/1) 데이터를 폰트를 통해 인간이 인식할 수 있는 형태로 글자를 보여 준다면,
OCR은 그 반대로 인간이 종이 위에 써 놓은 글씨를 인지하여 텍스트 데이터로 치환한다.
보통은 스캐너로 읽어들인 이미지 파일을 분석하여 텍스트나 워드 파일로 결과물을 내놓는다.

이미 존재하는 폰트와 대조하는 방식으로 이미지를 인식하므로,
적어도 300dpi 이상의 해상도에 필기체보단 정자로 또박또박 잘 쓴 글씨가 인식률이 더 높다.
물론 이전에 프린터로 인쇄했던 문서라면 가장 잘 인식된다.

 

'검색' 카테고리의 다른 글

적정 인터넷 속도  (0) 2023.06.01
스피드 테스트 세계 순위 비교  (0) 2023.06.01
원피스 사람이 언제 죽는다고 생각하나?  (0) 2023.05.08
수파리  (0) 2023.04.30
마케팅의 종류 : 홍보수단, 광고매체  (0) 2023.04.27

댓글

최신글 전체

이미지
제목
글쓴이
등록일