OCR 스캔한 문서에서 텍스트 혹은 이미지 추출
https://blog.naver.com/cheesekim1208/221981591964
pdf 파일을 ocr로 변환해주는 사이트&프로그램 추천
아이패드를 사용하다 보면 OCR 인식이 되는 PDF파일이 필요합니다. 이럴 경우 매우 유용한 사이트 및...
blog.naver.com
https://helpx.adobe.com/kr/acrobat/using/edit-scanned-pdfs.html
스캔한 PDF 편집
설정을 사용하여 OCR 언어를 변경하고, 시스템 글꼴 사용 여부를 선택하고, 모든 페이지를 한 번에 편집할 수 있습니다. 오른쪽 창에서 [스캔한 문서] 아래의 설정을 클릭합니다. 이 대화 상자에
helpx.adobe.com
OCR
光學文字認識 / 광학 문자 인식 / Optical Character Recognition (OCR)
보통 컴퓨터가 2진법(0/1) 데이터를 폰트를 통해 인간이 인식할 수 있는 형태로 글자를 보여 준다면,
OCR은 그 반대로 인간이 종이 위에 써 놓은 글씨를 인지하여 텍스트 데이터로 치환한다.
보통은 스캐너로 읽어들인 이미지 파일을 분석하여 텍스트나 워드 파일로 결과물을 내놓는다.
이미 존재하는 폰트와 대조하는 방식으로 이미지를 인식하므로,
적어도 300dpi 이상의 해상도에 필기체보단 정자로 또박또박 잘 쓴 글씨가 인식률이 더 높다.
물론 이전에 프린터로 인쇄했던 문서라면 가장 잘 인식된다.
보통 컴퓨터가 2진법(0/1) 데이터를 폰트를 통해 인간이 인식할 수 있는 형태로 글자를 보여 준다면,
OCR은 그 반대로 인간이 종이 위에 써 놓은 글씨를 인지하여 텍스트 데이터로 치환한다.
보통은 스캐너로 읽어들인 이미지 파일을 분석하여 텍스트나 워드 파일로 결과물을 내놓는다.
이미 존재하는 폰트와 대조하는 방식으로 이미지를 인식하므로,
적어도 300dpi 이상의 해상도에 필기체보단 정자로 또박또박 잘 쓴 글씨가 인식률이 더 높다.
물론 이전에 프린터로 인쇄했던 문서라면 가장 잘 인식된다.
'검색' 카테고리의 다른 글
적정 인터넷 속도 (0) | 2023.06.01 |
---|---|
스피드 테스트 세계 순위 비교 (0) | 2023.06.01 |
원피스 사람이 언제 죽는다고 생각하나? (0) | 2023.05.08 |
수파리 (0) | 2023.04.30 |
마케팅의 종류 : 홍보수단, 광고매체 (0) | 2023.04.27 |
댓글