Extract Text, Images from pdf
想要在linux下將pdf檔中的文字取出來,使用xpdf中的pdftotext,它是放在xpdf-utils: /usr/bin/pdftotext
/usr/bin/pdftops /usr/bin/pdftotext /usr/bin/pdfinfo /usr/bin/pdffonts /usr/bin/pdfimages
如果想要取出其中的image檔,可用pdfimages來實作。
詳情可看Extract Images from pdf