PDFからテキストをコピーすると文言が重複してしまうとき
PDFファイルからテキストをコピー&ペーストした際に、
文言が重複してしまうときがありませんか?
私は過去に何回もあり、
結局は目視で確認・修正したのですが・・・
例えば、上記
左のPDFファイルからテキスト全てをコピーしてメモ帳にペーストしました。
すると、あいうえお の部分が2回繰り返されています。
せっかくコピーしているのになんだか効率悪く、
何ともつらい気持ちになります・・・
これは、
PDF書き出し時のオプション設定「アクセシビリティ用の構造タグ」が
ONになっている場合に発生する
だということがわかりました。
———————
PDFの元になっているファイルが手元にある場合
例えば、Wordだと、
「名前を付けて保存」で保存する際に「オプション」ボタンをクリック。
オプション設定で
↓「アクセシビリティ用のドキュメント構造タグ」のチェックをはずします。
このチェックを外して保存したPDFファイルから
テキストをコピー&ペーストすると
文言は重複しませんでした。
———————
ただ、
元ファイルが手元に無いということもあるかと思いますが、
その時は GoogleChrome でブラウザ上でPDFを開いて
そこからコピー&ペーストすると良いそうです。
———————
▼参考にさせていただきました
PDF内のテキストをコピペすると文言が重複してしまうエラーの対処方法
困っていたので助かりました。
ありがとうございます。m(_ _)m
この記事の投稿者
iziz
Webデザイナー&HTMLコーダーときどきイラストレーター。