≈テキスト類似度 (Levenshtein)

2つの文字列のLevenshtein編集距離とパーセント類似度を計算します。タイプミス検出、類似単語の検索、検索オートコンプリート実装、データ重複検出によく使われます。

🔒 ブラウザ内処理✓ ウォーターマークなし✓ 登録不要

使い方

長文でも高速ですか?+

数千文字までは即座に処理されます。非常に長い文書(数万字以上)は時間が掛かることがあります。

Levenshteinとは?+

ある文字列から別の文字列に変えるために必要な最小編集回数(挿入・削除・置換)。「ねこ」→「いぬ」は2回編集。

類似度%の意味は?+

100%なら完全一致、0%なら全く異なる。一般に80%以上で非常に類似、50%以下で異なると見なされます。

日本語にも正確ですか?+

はい。音節単位で計算されるので日本語も正確です。仮名分解の比較が必要なら関連ツールと併用してください。

どこで活用しますか?+

(1) タイプミスの自動修正候補探し、(2) データベースの重複行検出、(3) 検索クエリのファジーマッチング、(4) 剽窃チェックの1次選別。

他の類似度アルゴリズムは?+

Jaro-Winkler、Cosine類似度、n-gramなどがありますが、Levenshteinが最も直感的でよく使われます。