PDF → Markdown
PDFをすべてブラウザでMarkdownに変換します — 見出し、段落、リスト、リンクまで、アップロードなしで。
PDFをここにドロップ、またはクリックして選択
ブラウザ内で処理されます — ファイルはアップロードされません
このツールについて
テキストベースのPDFをドロップすると、内容をMarkdownとして抽出します — 見出し(フォントサイズから推定)、段落、箇条書き・番号付きリスト、リンク、太字/斜体。すべてpdf.jsでローカル処理され、ファイルはブラウザを出ません。契約書・履歴書・社内文書で特に重要です。
LLMに文書を渡す前の整理、Wiki・Notionへの移行、2版の比較に便利です。PDFは実際の構造を持たず位置付けされた文字だけなので、変換はベストエフォートの再構成です。
よくある質問
私のPDFはどこかにアップロードされますか?+
いいえ。解析はすべてブラウザ内でpdf.jsにより行われ、サーバーには何も送信されません。機密文書をアップロード型の変換ツールではなく本ツールで扱う最大の理由です。
一部のPDFで出力が乱れるのはなぜですか?+
PDFは構造ではなく位置付けされた文字を保存するため、見出し・段落・リストはフォントサイズと間隔から推定して再構成します。多段組み、脚注、複雑な表が最も難しく、乱れることがあります。
スキャンされたPDFも変換できますか?+
いいえ。スキャンPDFは選択可能なテキストのない画像で、OCRが必要ですが非対応です。出力が空ならほぼ確実にスキャンです。
表はどう処理されますか?+
正直なところ、うまくいきません。表のセルは行・列情報のない座標上のテキストにすぎず、通常は行に展開されます。表データは元データからCSVに書き出す方がはるかに確実です。
一部の見出しが間違うのはなぜですか?+
見出しレベルは相対フォントサイズから推定します。サイズではなく太さや色で見出しを表す文書や、サイズ種類が多い文書では推定が外れることがあるので、変換後に数行だけ手で修正してください。