디지털 교감 도구는 여러 본의 차이를 빠르게 찾아주지만, 무엇이 중요한 변이인지는 사람이 분류해야 합니다.
자동 대조가 되는 구간과 한계, 표기/내용 차이 분류와 기록 요령을 정리합니다.

디지털 교감 도구 비교: 자동 대조가 해주는 일과 사람이 정리해야 하는 일
여러 본(사본, 판본, 전사본)을 비교할 때 가장 시간이 오래 걸리는 일은 “어디가 다른지”를 빠짐없이 찾는 과정입니다.
디지털 교감 도구(자동 대조/콜레이션 도구)는 이 작업을 크게 줄여 줍니다.
하지만 도구가 대신해 주는 건 ‘차이의 발견’까지입니다.
그 차이가 중요한 변이인지, 표기만 다른지, 비교 과정에서 생긴 착시인지까지는 사람이 정리해야 합니다.
이 글은 자동 대조가 잘하는 구간과 약한 구간을 나눠 보고, 결과를 “근거로 남는 정리”로 바꾸는 실무 흐름을 잡는 데 초점을 둡니다.
함께 읽으면 좋은 글
2026.01.07 - [문헌학] - 디지털 고전자료 인용법: OCR 오류와 영구 링크로 좌표 고정하기
디지털 고전자료 인용법: OCR 오류와 영구 링크로 좌표 고정하기
디지털 고전자료 인용은 OCR 오류, 링크 변경, 판본 혼동이 변수입니다.스캔 이미지로 인용을 확정하고 영구 링크로 좌표를 고정하며, 각주 한 줄 기록 요령을 예시로 정리합니다. “출처를 적었
sy21chichi.com
한 문장 정리: 도구는 표시하고, 판단은 사람이 합니다
자동 대조를 처음 쓰면 “이렇게까지 다르다고?”라는 느낌이 먼저 옵니다.
여기서 중요한 건 당황하지 않고 순서를 지키는 것입니다. 도구는 차이를 모아주고, 사람은 그 차이를 “읽을 수 있는 묶음”으로
바꿉니다. 이 흐름이 잡히면, 본이 늘어도 작업이 무너지지 않습니다.
용어는 네 개만 고정하면 충분합니다
처음부터 용어를 많이 끌어오면 글이 어려워집니다.
아래 네 개만 의미를 잡아두면 이후 문장이 훨씬 편해집니다.
용어 풀이
- 콜레이션(collation): 여러 본을 나란히 두고 차이를 정리하는 작업입니다.
- 기준 본(베이스 텍스트): 비교에서 기준으로 삼는 본입니다. 무엇을 기준으로 두느냐에 따라 ‘차이의 모양’이 달라질 수 있습니다.
- 정규화(표기 통일): 비교 전에 띄어쓰기/ 철자/ 기호 같은 흔들림을 목적에 맞게 최소한으로 맞추는 작업입니다.
- 전치(자리 바꿈): 구절이나 문장 위치가 앞뒤로 이동하는 변이입니다.
자동 대조의 강점 3가지
첫째, 차이가 있는 위치를 빠르게 찍어 줍니다. 사람이 눈으로 훑다가 놓치기 쉬운 자리도 후보로 올라옵니다.
둘째, 본이 많아질수록 효과가 커집니다. 두 본 비교는 손으로도 버티지만, 다섯 본 이상부터는 자동 대조가 시간을
확실히 절약합니다.
셋째, 비교 흔적을 남기기 좋습니다. 결과 화면이나 표를 저장해 두면, 다음 작업이 ‘기억’이 아니라 ‘자료’ 위에서 이어집니다.
자동 대조가 약해지는 지점 4가지
첫째, 표기 차이와 의미 차이를 자동으로 구분하지 못합니다.
띄어쓰기나 철자 차이가 대부분 사소해도, 어떤 문장에서는 의미를 바꿉니다. 도구는 그 경계선을 모릅니다.
둘째, 기준 본을 자동으로 “정답”처럼 정해주지 못합니다. 무엇을 기준으로 잡느냐에 따라 차이의 모양이 달라집니다.
셋째, 전치(자리 바꿈)가 나오면 정렬이 흔들립니다.
엔진은 전치 후보를 다루려 해도, 무엇을 전치로 볼지 판단은 사람이 해야 합니다.
넷째, ‘중요도’를 매기지 못합니다. 도구는 “다름”을 보여주지만, 무엇을 본문에 반영할지(혹은 기록만 남길지)는 편집 판단입니다.
함께 읽으면 좋은 글
2026.01.09 - [문헌학] - 내적 근거 vs 외적 근거: 충돌할 때 판단과 기록 기준
내적 근거 vs 외적 근거: 충돌할 때 판단과 기록 기준
내적 근거(문장 쪽)와 외적 근거(자료 쪽)가 충돌하면 선택이 흔들립니다.충돌 유형별로 결정, 조건부 채택, 보류를 구분하고, 다시 확인 가능한 기록 문장까지 정리합니다. “무엇을 우선하나”
sy21chichi.com
실행 전에 세 가지만 고정하면, 결과가 훨씬 읽히게 정리됩니다.
자동 대조는 실행 버튼보다 “실행 전 결정”에서 품질이 갈립니다.
아래 세 가지를 먼저 고정해 두면 결과가 읽히게 정리됩니다.
- 비교 단위: 단어 기준으로 볼지, 글자(문자) 기준으로 볼지, 행 단위로 볼지
- 정규화 범위: 띄어쓰기 / 철자 / 기호를 어디까지 맞출지(완벽 통일이 아니라 목적에 맞춘 최소)
- 목적: 오류 패턴 찾기 / 의미 차이 분류 / 교감 정리 후보 목록 만들기 중 무엇인지
함께 읽으면 좋은 글
2026.01.10 - [문헌학] - 용어 통일 실전 규칙: 같은 개념을 한 가지 말로 고정하기
용어 통일 실전 규칙: 같은 개념을 한 가지 말로 고정하기
같은 내용을 다루는데 용어가 바뀌면 독자는 기준을 잃습니다.대표 용어를 고정하고 정의한 줄을 붙여, 표기, 약어까지 흔들리지 않게 정리하는 실전 규칙을 소개합니다. 내용이 아니라 ‘호칭
sy21chichi.com
예시 1개: 표기 차이와 내용 차이를 가르는 기준
A본이 “...라고 한다” 이고 B본이 “...라고한다”처럼 띄어쓰기만 다른 정도라면, 우선은 ‘표기 차이’로 묶어도 충분합니다.
이런 유형은 작업용 통일본을 만들 때 의미를 바꾸지 않는 범위에서 정리하고, 변이 목록에서는 과감히 덜어내도 됩니다.
하지만 A본이 “허락했다”, B본이 “거절했다”처럼 문장의 핵심 동사가 달라지면 이야기가 완전히 달라집니다.
이건 단순 표기가 아니라 ‘내용 차이’에 해당하므로, 교감 과정에서 반드시 변이로 남기고 근거까지 확인하는 편이 좋습니다.
또 같은 위치에서 한쪽 본만 구절이 통째로 빠져 있다면(누락), 이것은 띄어쓰기 수준의 정리로 넘길 문제가 아닙니다.
자동 대조 결과를 그대로 믿기보다 원자료로 돌아가 실제 누락인지, 판독, 입력 과정에서 생긴 문제인지부터 점검하는 것이
안전합니다.
도구를 고를 때는 ‘이름’보다 역할을 봅니다
도구는 많아 보여도, 실무에서의 역할은 크게 나뉩니다.
- 대조 엔진: 여러 본을 정렬하고 차이를 계산하는 역할(예: CollateX 계열)
- 결과 화면/공유: 차이를 읽고 비교하기 좋게 보여주는 역할(예: Juxta Commons 계열)
- 시각화 중심: 변이 흐름을 그래프처럼 보여 주어 탐색을 돕는 방식(예: TRAViz)
선택 기준은 간단합니다.
“본이 몇 개인지(2본/다본)”, “정렬이 어긋날 때 손으로 조정, 메모가 가능한지”, “결과를 표/텍스트로 내보내기 쉬운지”,
“공유가 필요한지”를 먼저 정한 뒤 고르는 편이 안전합니다.
차이 목록을 ‘교감 재료’로 만드는 두 번의 분류
자동 대조 결과를 그대로 옮기면 ‘차이 나열’로 보이기 쉽습니다.
아래 두 번만 가르면 결과가 근거처럼 바뀝니다.
1차 분류: 표기 차이(철자/띄어쓰기/기호) vs 내용 차이(어휘/누락/추가/순서)
2차 분류: 우연 가능성 vs 전승 흔적 가능성(여러 본이 같은 형태를 공유하는지)
함께 읽으면 좋은 글
2026.01.09 - [문헌학] - 필사 오류 패턴 읽는 법: 반복, 누락, 혼동을 근거로 정리하기
필사 오류 패턴 읽는 법: 반복, 누락, 혼동을 근거로 정리하기
사본 사이의 차이는 ‘다름’이 아니라 ‘왜 그렇게 달라졌는지’로 판단해야 합니다.필사 과정에서 자주 생기는 오류 패턴을 익히고, 변이를 근거로 정리하는 실전 루틴을 제시합니다. 차이는
sy21chichi.com
기록의 핵심은 두 가지입니다: 무엇을 했는지, 왜 했는지.
자동 대조는 ‘결정이 늘어나는 작업’입니다. 기록이 없으면 다음에 같은 지점으로 돌아가기 어렵습니다.
긴 설명 대신 한 줄로도 충분합니다.
결정 로그(대조용) 1줄 예시
2026-01-14 / 2권 145쪽 / 표기 차이는 통일본에서 제외, 내용 차이만 추림. 자리 바꿈 후보 1곳은 원자료로 재확인 후 보류 처리.
용어풀이
결정로그(Decision log): 작업 과정에서 “어떤 선택을 했는지”와 “왜 그렇게 판단했는지”를 짧게 기록해 두는 메모 체계입니다.
자동 대조의 한계는 제약이 아니라, 적용 범위를 정리해 주는 기준선입니다.
자동 대조는 비교를 빠르게 하지만, 판단을 대신하지 않습니다.
그래서 좋은 작업은 늘 같은 구조로 정리됩니다.
도구로 차이를 찾고, 사람 기준으로 분류하고, 한 줄 기록으로 되돌아갈 길을 남깁니다.
이 흐름이 잡히면 본이 늘어도 작업이 무너지지 않고, “왜 이 차이를 중요하게 봤는지”를 설명하는 문장도 훨씬 단단해집니다.
자주 하는 질문(FAQ)
Q. 디지털 자료를 확보하는 기준(스캔, 촬영 품질)과 이 글은 무엇이 다른가요?
A. 스캔과 촬영은 “근거가 되는 자료를 제대로 확보하는 단계”이고, 자동 대조는 “확보한 여러 본에서 차이를 빠르게 찾아
정리하는 단계”입니다. 기능이 다릅니다.
Q. OCR 텍스트로 바로 자동 대조를 돌려도 되나요?
A. 가능하지만 OCR 오인이 섞이면 ‘가짜 차이’가 늘어납니다. 먼저 위험 구간을 간단히 점검한 뒤, 필요하면 작업용 통일본을
만들어 비교하는 편이 안정적입니다.
Q. 결과를 그대로 교감 정리에 옮겨도 되나요?
A. 그대로 옮기기보다 표기/내용을 먼저 가르고, 중요한 차이만 남기는 편이 읽는 사람에게 훨씬 친절합니다.
Q. 어떤 도구가 “제일 좋다”라고 말할 수 있나요?
A. 본 개수(2본/다본), 정렬 통제 필요 여부, 결과 내보내기, 공유 필요 여부에 따라 달라집니다.
도구 이름보다 작업 목적이 먼저입니다.
관련 참고자료
https://collatex.net/
https://collatex.net/doc/
https://journalofdigitalhumanities.org/3-1/juxta-commons/
https://pedagogy-toolkit.org/tools/Juxta.html
https://github.com/stjaenicke/TRAViz
'문헌학' 카테고리의 다른 글
| OCR 검수 실전: 근거로 쓰기 전 확인 루틴 (0) | 2026.01.14 |
|---|---|
| 디지털 문헌학 입문: 스캔, 촬영 품질의 최소 기준 (0) | 2026.01.13 |
| 연구노트 최소 규칙: 다시 확인되는 근거를 남기는 기록법 (0) | 2026.01.13 |
| 서지 작성법: 판사항 , 권차 , 소장처까지 빠짐없이 적기 (0) | 2026.01.12 |
| 교감기 읽는 법: 기호와 약어를 뜻으로 푸는 가장 쉬운 순서 (0) | 2026.01.11 |