📖 처음이신가요? — 결과 읽는 법과 한계 (코사인 유사도란?)
이 도구는 무엇을 보여주나요?
《삼국지》 본문에서 각 단어가 어떤 말들과 함께 등장하는지(문맥)를 컴퓨터가 학습한 것입니다. 낱말의 ‘뜻’을 아는 게 아니라, 쓰임새가 닮은 단어를 찾아 줍니다. 그래서 荀彧(순욱)의 이웃으로 程昱(정욱)·荀攸(순유) 같은 조조 진영 문관들이 떠오르고, ‘승상’ 옆에는 그 속관 벼슬들이 모입니다.
코사인 유사도란?
두 단어가 얼마나 비슷한 문맥에서 쓰였는지를 0~1 사이 숫자로 나타낸 값입니다. 1에 가까울수록 거의 같은 자리에서 쓰였다는 뜻, 0에 가까우면 서로 다른 맥락이라는 뜻이에요. 딱 정해진 합격선은 없으니, 같은 검색 안에서 위쪽일수록 더 닮았다 정도로 읽으면 됩니다.
‘비슷하다’가 ‘친했다’는 아니에요
유사도가 높다고 둘이 친하거나 같은 편이라는 뜻은 아닙니다. 같은 종류로 자주 언급된다는 의미라, 라이벌이나 적장도 비슷한 전투·기록 맥락에 나오면 가깝게 묶일 수 있습니다.
⚠️ 적게 나온 단어는 조심하세요
단어 옆 ‘N회’는 《삼국지》에 그 단어가 등장한 횟수입니다. 몇 번밖에 안 나온 단어는 컴퓨터가 충분히 보지 못해 결과가 불안정합니다 — 유사어가 우연일 수 있어요. 수십~수백 회 이상 등장한 단어일수록 결과를 믿을 만합니다.
그 밖에 알아둘 점
· 이 모델은 오직 진수 《삼국지》(배송지 주 포함) 원문만 압니다. 《삼국지연의》(소설)나
다른 사서, 역사적 사실 전체를 반영하지 않으며, 원문의 서술 습관·치우침이 그대로 담깁니다.
· 한 글자 이름(亮·操 등)은 다른 뜻과 겹쳐 흐려질 수 있어 따로 묶지 않고,
諸葛亮처럼 두 글자 이상 고유명사만 한 단어로 인식합니다.
· ‘스파이 찾기’는 무리의 평균과 가장 덜 닮은 단어를 고르는 놀이입니다. 정답이 아니라 재미로 즐겨 주세요.
두 단어 비교
두 단어가 《삼국지》에서 얼마나 비슷한 맥락에 쓰였는지 보기 위해, 각 단어와 비슷한 환경에서 출현한 단어들의 목록을 나란히 놓고 비교합니다. 예시: 劉備 vs 先主
🕵️ 스파이 찾기 (어몽어스)
단어 3개 이상을 모으면, 무리에서 가장 이질적인 단어 — 스파이 — 를 찾아냅니다. 예시: 周瑜·魯肅·呂蒙·陸遜·諸葛亮
비슷한 단어 찾기
한 단어와 가장 비슷한 맥락에 쓰인 단어들을 유사도 순으로 봅니다. 예시: 曹公