OCR 스캔한 문서에서 텍스트 혹은 이미지 추출
https://blog.naver.com/cheesekim1208/221981591964
https://helpx.adobe.com/kr/acrobat/using/edit-scanned-pdfs.html
OCR
光學文字認識 / 광학 문자 인식 / Optical Character Recognition (OCR)
보통 컴퓨터가 2진법(0/1) 데이터를 폰트를 통해 인간이 인식할 수 있는 형태로 글자를 보여 준다면,
OCR은 그 반대로 인간이 종이 위에 써 놓은 글씨를 인지하여 텍스트 데이터로 치환한다.
보통은 스캐너로 읽어들인 이미지 파일을 분석하여 텍스트나 워드 파일로 결과물을 내놓는다.
이미 존재하는 폰트와 대조하는 방식으로 이미지를 인식하므로,
적어도 300dpi 이상의 해상도에 필기체보단 정자로 또박또박 잘 쓴 글씨가 인식률이 더 높다.
물론 이전에 프린터로 인쇄했던 문서라면 가장 잘 인식된다.
보통 컴퓨터가 2진법(0/1) 데이터를 폰트를 통해 인간이 인식할 수 있는 형태로 글자를 보여 준다면,
OCR은 그 반대로 인간이 종이 위에 써 놓은 글씨를 인지하여 텍스트 데이터로 치환한다.
보통은 스캐너로 읽어들인 이미지 파일을 분석하여 텍스트나 워드 파일로 결과물을 내놓는다.
이미 존재하는 폰트와 대조하는 방식으로 이미지를 인식하므로,
적어도 300dpi 이상의 해상도에 필기체보단 정자로 또박또박 잘 쓴 글씨가 인식률이 더 높다.
물론 이전에 프린터로 인쇄했던 문서라면 가장 잘 인식된다.
'검색' 카테고리의 다른 글
적정 인터넷 속도 (0) | 2023.06.01 |
---|---|
스피드 테스트 세계 순위 비교 (0) | 2023.06.01 |
원피스 사람이 언제 죽는다고 생각하나? (0) | 2023.05.08 |
수파리 (0) | 2023.04.30 |
마케팅의 종류 : 홍보수단, 광고매체 (0) | 2023.04.27 |
댓글