Question 1

私のPDFはどこかにアップロードされますか？

Accepted Answer

いいえ。解析はすべてブラウザ内でpdf.jsにより行われ、サーバーには何も送信されません。機密文書をアップロード型の変換ツールではなく本ツールで扱う最大の理由です。

Question 2

一部のPDFで出力が乱れるのはなぜですか？

Accepted Answer

PDFは構造ではなく位置付けされた文字を保存するため、見出し・段落・リストはフォントサイズと間隔から推定して再構成します。多段組み、脚注、複雑な表が最も難しく、乱れることがあります。

Question 3

スキャンされたPDFも変換できますか？

Accepted Answer

いいえ。スキャンPDFは選択可能なテキストのない画像で、OCRが必要ですが非対応です。出力が空ならほぼ確実にスキャンです。

Question 4

表はどう処理されますか？

Accepted Answer

正直なところ、うまくいきません。表のセルは行・列情報のない座標上のテキストにすぎず、通常は行に展開されます。表データは元データからCSVに書き出す方がはるかに確実です。

Question 5

一部の見出しが間違うのはなぜですか？

Accepted Answer

見出しレベルは相対フォントサイズから推定します。サイズではなく太さや色で見出しを表す文書や、サイズ種類が多い文書では推定が外れることがあるので、変換後に数行だけ手で修正してください。

PDFをMarkdownに変換

このツールについて