🔍画像OCR (光学文字認識)
写真の文字をテキストに抽出。Tesseract.jsの日本語・韓国語モデル使用。レシート入力、本・書類の写真デジタル化、画面キャプチャの文字コピー、名刺情報抽出、手書き認識(制限あり)などによく使われます。
🔒 ブラウザ内処理✓ ウォーターマークなし✓ 登録不要
使い方
- 1文字のある画像をアップロードします。
- 2言語を選択します(韓国語/英語/韓+英/日本語など)。
- 3OCR開始ボタンを押します。
- 4認識されたテキストをコピーするか.txtで保存します。
よくある質問
精度はどのくらい?+
高解像度・印刷体の文書は90%+の精度。手書き・傾いた写真・低解像度は50〜70%に下がります。信頼度スコアも一緒に表示されます。
初回使用時はなぜ遅いですか?+
初回使用時に言語学習データ(〜10MB)をダウンロードします。以降はブラウザにキャッシュされて速くなります。
PDF内の文字も抽出?+
PDFはこのツールで直接処理されません。[PDF→画像]ツールで変換後にOCRを適用してください。ただしデジタルPDFは[PDFテキスト抽出]がOCRより正確です。
複数枚を一度に?+
現在は1枚ずつ処理されます。一括OCRは処理時間が長いのでデスクトップツールが適しています。
漢字・日本語も対応?+
日本語、中国語簡体・繁体モデルが選択可能です。漢字は日本語または中国語モデルの使用を推奨。
画像が外部に送信されますか?+
いいえ。Tesseract.jsはWebAssemblyでブラウザ内で処理され、画像・結果ともに外部に送信されません。
OCRがよく効く画像?+
(1) 文字サイズ12pt以上、(2) 背景と文字のコントラストが明瞭、(3) まっすぐ撮影、(4) ぶれのない写真。本のページを平らに広げて上から撮るのが最も正確です。