要提取PDF文件的內容,你可以使用Python中的PyPDF2庫。首先,你需要安裝這個庫。可以使用以下命令來安裝:
pip install PyPDF2
安裝完成后,你可以使用以下代碼提取PDF文件的文本內容:
import PyPDF2
def extract_text_from_pdf(file_path):
with open(file_path, 'rb') as file:
pdf_reader = PyPDF2.PdfFileReader(file)
text = ''
for page_num in range(pdf_reader.numPages):
page = pdf_reader.getPage(page_num)
text += page.extractText()
return text
pdf_file = 'example.pdf'
text = extract_text_from_pdf(pdf_file)
print(text)
請注意,這種方法提取的文本可能不夠準確,因為有些PDF文件可能包含圖像或其他非文本內容。