≈テキスト類似度 (Levenshtein)
2つの文字列のLevenshtein編集距離とパーセント類似度を計算します。タイプミス検出、類似単語の検索、検索オートコンプリート実装、データ重複検出によく使われます。
🔒 ブラウザ内処理✓ ウォーターマークなし✓ 登録不要
使い方
- 12つのテキストをそれぞれ入力します。
- 2編集距離と類似度(%)が即座に表示されます。
よくある質問
長文でも高速ですか?+
数千文字までは即座に処理されます。非常に長い文書(数万字以上)は時間が掛かることがあります。
Levenshteinとは?+
ある文字列から別の文字列に変えるために必要な最小編集回数(挿入・削除・置換)。「ねこ」→「いぬ」は2回編集。
類似度%の意味は?+
100%なら完全一致、0%なら全く異なる。一般に80%以上で非常に類似、50%以下で異なると見なされます。
日本語にも正確ですか?+
はい。音節単位で計算されるので日本語も正確です。仮名分解の比較が必要なら関連ツールと併用してください。
どこで活用しますか?+
(1) タイプミスの自動修正候補探し、(2) データベースの重複行検出、(3) 検索クエリのファジーマッチング、(4) 剽窃チェックの1次選別。
他の類似度アルゴリズムは?+
Jaro-Winkler、Cosine類似度、n-gramなどがありますが、Levenshteinが最も直感的でよく使われます。