OCR 스캔한 문서에서 텍스트 추출

검색

OCR 스캔한 문서에서 텍스트 추출

dig it 2023. 5. 31. 11:41

OCR 스캔한 문서에서 텍스트 혹은 이미지 추출

https://blog.naver.com/cheesekim1208/221981591964

pdf 파일을 ocr로 변환해주는 사이트&프로그램 추천

아이패드를 사용하다 보면 OCR 인식이 되는 PDF파일이 필요합니다. 이럴 경우 매우 유용한 사이트 및...

blog.naver.com

https://helpx.adobe.com/kr/acrobat/using/edit-scanned-pdfs.html

스캔한 PDF 편집

설정을 사용하여 OCR 언어를 변경하고, 시스템 글꼴 사용 여부를 선택하고, 모든 페이지를 한 번에 편집할 수 있습니다. 오른쪽 창에서 [스캔한 문서] 아래의 설정을 클릭합니다. 이 대화 상자에

helpx.adobe.com

OCR

光學文字認識 / 광학 문자 인식 / Optical Character Recognition (OCR)

보통 컴퓨터가 2진법(0/1) 데이터를 폰트를 통해 인간이 인식할 수 있는 형태로 글자를 보여 준다면,
OCR은 그 반대로 인간이 종이 위에 써 놓은 글씨를 인지하여 텍스트 데이터로 치환한다.
보통은 스캐너로 읽어들인 이미지 파일을 분석하여 텍스트나 워드 파일로 결과물을 내놓는다.

이미 존재하는 폰트와 대조하는 방식으로 이미지를 인식하므로,
적어도 300dpi 이상의 해상도에 필기체보단 정자로 또박또박 잘 쓴 글씨가 인식률이 더 높다.
물론 이전에 프린터로 인쇄했던 문서라면 가장 잘 인식된다.

저작자표시 (새창열림)

'검색' 카테고리의 다른 글

적정 인터넷 속도 (0)	2023.06.01
스피드 테스트 세계 순위 비교 (0)	2023.06.01
원피스 사람이 언제 죽는다고 생각하나? (0)	2023.05.08
수파리 (0)	2023.04.30
마케팅의 종류 : 홍보수단, 광고매체 (0)	2023.04.27

현재글OCR 스캔한 문서에서 텍스트 추출

250x250

i dig it

폰트, 웹피, darth vader, 오블완, 푸드아트, 세월호, Home, 베트맨, 페이스북, 일러스트레이터, 티스토리챌린지, 냥이, 나방, 서정, 레고, 워드프레스, 스타워즈, 스티브잡스, 디자인, 다스베이더,

Today :
Yesterday :

i dig it