ubin.sh

PDF → Markdown

PDFをすべてブラウザでMarkdownに変換します — 見出し、段落、リスト、リンクまで、アップロードなしで。

PDFをここにドロップ、またはクリックして選択

ブラウザ内で処理されます — ファイルはアップロードされません

このツールについて

テキストベースのPDFをドロップすると、内容をMarkdownとして抽出します — 見出し(フォントサイズから推定)、段落、箇条書き・番号付きリスト、リンク、太字/斜体。すべてpdf.jsでローカル処理され、ファイルはブラウザを出ません。契約書・履歴書・社内文書で特に重要です。

LLMに文書を渡す前の整理、Wiki・Notionへの移行、2版の比較に便利です。PDFは実際の構造を持たず位置付けされた文字だけなので、変換はベストエフォートの再構成です。

よくある質問

私のPDFはどこかにアップロードされますか?+

いいえ。解析はすべてブラウザ内でpdf.jsにより行われ、サーバーには何も送信されません。機密文書をアップロード型の変換ツールではなく本ツールで扱う最大の理由です。

一部のPDFで出力が乱れるのはなぜですか?+

PDFは構造ではなく位置付けされた文字を保存するため、見出し・段落・リストはフォントサイズと間隔から推定して再構成します。多段組み、脚注、複雑な表が最も難しく、乱れることがあります。

スキャンされたPDFも変換できますか?+

いいえ。スキャンPDFは選択可能なテキストのない画像で、OCRが必要ですが非対応です。出力が空ならほぼ確実にスキャンです。

表はどう処理されますか?+

正直なところ、うまくいきません。表のセルは行・列情報のない座標上のテキストにすぎず、通常は行に展開されます。表データは元データからCSVに書き出す方がはるかに確実です。

一部の見出しが間違うのはなぜですか?+

見出しレベルは相対フォントサイズから推定します。サイズではなく太さや色で見出しを表す文書や、サイズ種類が多い文書では推定が外れることがあるので、変換後に数行だけ手で修正してください。

関連ツール