디지털 고전자료 2

OCR 검수 실전: 근거로 쓰기 전 확인 루틴

OCR은 편하지만 자동 추정이라 오류가 섞입니다.페이지 왜곡, 구획(행/열) 문제부터 자주 틀리는 글자 유형까지, 샘플 검수와 수정 기록을 남겨 다시 확인 가능한 텍스트로만드는 방법을 정리합니다. OCR은 편리하지만 확정 텍스트는 아닙니다 OCR은 이미지 속 글자를 텍스트로 변환한다기보다, 여러 후보 중 가장 그럴듯한 결과를 내놓는 과정에 가깝습니다.페이지가 비뚤어지거나(기울기), 여백과 경계선이 섞이면 행 분리가 무너지고 결과가 급격히 나빠질 수 있다는 점도OCR 도구 문서에서 반복됩니다. 함께 읽으면 좋은 글 2026.01.07 - [문헌학] - 디지털 고전자료 인용법: OCR 오류와 영구 링크로 좌표 고정하기 디지털 고전자료 인용법: OCR 오류와 영구 링크로 좌표 고정하기디지털 고전자료 인용은 ..

문헌학 2026.01.14

디지털 고전자료 인용법: OCR 오류와 영구 링크로 좌표 고정하기

디지털 고전자료 인용은 OCR 오류, 링크 변경, 판본 혼동이 변수입니다.스캔 이미지로 인용을 확정하고 영구 링크로 좌표를 고정하며, 각주 한 줄 기록 요령을 예시로 정리합니다. “출처를 적었다”와 “다시 찾을 수 있다”는 다릅니다 서지 정보를 성실히 적었는데도, 시간이 지나면 같은 화면으로 돌아가지 못하는 경우가 있습니다.디지털 고전자료에서는 특히 그렇습니다.검색 텍스트가 그럴듯해 보여도 원문과 어긋나기도 하고, 주소창 링크가 바뀌어 빈 화면을 만나기도 하며, 같은 제목의다른 판본을 섞어 인용하기도 합니다. 이 글의 목표는 단순합니다.“내가 본 그 자리”를 다시 찾아갈 수 있게 좌표를 고정하고, 인용 문장을 흔들리지 않게 확정하는 방법을 정리합니다. 디지털 고전자료는 ‘텍스트 한 덩어리’가 아니라 ..

문헌학 2026.01.07