🔍画像OCR (光学文字認識)

写真の文字をテキストに抽出。Tesseract.jsの日本語・韓国語モデル使用。レシート入力、本・書類の写真デジタル化、画面キャプチャの文字コピー、名刺情報抽出、手書き認識(制限あり)などによく使われます。

🔒 ブラウザ内処理✓ ウォーターマークなし✓ 登録不要

使い方

精度はどのくらい?+

高解像度・印刷体の文書は90%+の精度。手書き・傾いた写真・低解像度は50〜70%に下がります。信頼度スコアも一緒に表示されます。

初回使用時はなぜ遅いですか?+

初回使用時に言語学習データ(〜10MB)をダウンロードします。以降はブラウザにキャッシュされて速くなります。

PDF内の文字も抽出?+

PDFはこのツールで直接処理されません。[PDF→画像]ツールで変換後にOCRを適用してください。ただしデジタルPDFは[PDFテキスト抽出]がOCRより正確です。

複数枚を一度に?+

現在は1枚ずつ処理されます。一括OCRは処理時間が長いのでデスクトップツールが適しています。

漢字・日本語も対応?+

日本語、中国語簡体・繁体モデルが選択可能です。漢字は日本語または中国語モデルの使用を推奨。

画像が外部に送信されますか?+

いいえ。Tesseract.jsはWebAssemblyでブラウザ内で処理され、画像・結果ともに外部に送信されません。

OCRがよく効く画像?+

(1) 文字サイズ12pt以上、(2) 背景と文字のコントラストが明瞭、(3) まっすぐ撮影、(4) ぶれのない写真。本のページを平らに広げて上から撮るのが最も正確です。