바로킷

텍스트 유사도 (Levenshtein)

두 문자열의 편집 거리·유사도.

🔒 브라우저에서 처리워터마크 없음가입 불필요

사용 방법

  1. 1두 텍스트를 각각 입력합니다.
  2. 2편집 거리와 유사도(%)가 즉시 표시됩니다.

자주 묻는 질문

긴 문서도 빠른가요?+

수천 글자까지 즉시 처리됩니다. 매우 긴 문서(수만 자+)는 시간이 더 걸릴 수 있어요.

Levenshtein이 뭐예요?+

한 문자열을 다른 문자열로 만들 때 필요한 최소 편집 횟수(삽입·삭제·치환). '고양이' → '강아지'는 3회 편집.

유사도 % 의미?+

100%면 완전 동일, 0%면 전혀 다름. 보통 80% 이상이면 매우 유사, 50% 이하면 다르다고 봄.

한글에도 정확한가요?+

네. 음절 단위로 계산되므로 한글도 정확합니다. 자모 단위 비교가 필요하면 [한글 자모 분해] 도구와 함께 쓰세요.

어디 활용하나요?+

(1) 오타 자동 수정 후보 찾기, (2) 데이터베이스 중복 행 탐지, (3) 검색어 fuzzy matching, (4) 표절 검사 1차.

다른 유사도 알고리즘?+

Jaro-Winkler, Cosine similarity, n-gram 등이 있지만 Levenshtein이 가장 직관적이고 흔히 쓰입니다.

관련 도구