在各种情况下可能需要将 PDF 转换为 Excel,例如,将 PDF 中的表格数据导出到电子表格、在 Excel 中自动执行任务以及使用 Excel 的其他数据操作功能。以编程方式处理 PDF 和 Excel 文件时,您可能需要在 Python 中自动将 PDF 转换为 Excel。为了实现这一目标,本文为您提供了在 Python 中将 PDF 文件转换为 Excel 的最简单的解决方案。
此外,您还将了解如何使用不同的选项自定义 PDF 到 Excel 的转换。此外,您还将获得一个免费的在线 PDF 到 Excel 转换器,您可以随时随地使用。
Python PDF 到 Excel 转换器
在 Python 中将 PDF 转换为 XLS
在 Python 中将 PDF 转换为 XLSX
自定义 PDF 到 Excel 转换
在线 PDF 到 Excel 转换器
Python PDF 到 Excel 转换器
对于 PDF 到 Excel XLS/XLSX 的转换,我们将使用 Aspose.PDF for Python。该库旨在从 Python 应用程序中创建、处理和转换 PDF 文件。
使用以下 pip 命令从 PyPI 安装库。
pip 安装 aspose-pdf
在 Python 中将 PDF 转换为 Excel XLS
Aspose.PDF for Python 使将 PDF 转换为 Excel XLS 变得非常容易。您只需加载 PDF 文件并将其以 XLS 格式保存到所需位置。您可以按照下面给出的步骤在 Python 应用程序中将 PDF 文件转换为 XLS。
创建 Document 类的实例并使用输入 PDF 文件的路径对其进行初始化。
创建 ExcelSaveOptions 类的对象并将输出格式设置为 XML_SPREAD_SHEET2003。
使用输出 XLS 文件的名称和 ExcelSaveOptions 作为参数调用 Document.save() 方法。
以下代码示例展示了如何在 Python 中将 PDF 转换为 XLS。
输入PDF文件
转换后的 Excel 工作表
在 Python 中将 PDF 保存为 XLSX
您还可以以类似的方式将 PDF 转换为 XLSX。在这种情况下,您不需要指定任何输出格式。只需使用 .xlsx 扩展名保存转换后的 Excel 文件即可。以下是在 Python 中将 PDF 转换为 XLSX 的步骤。
使用 Document 类加载 PDF 文件。
创建 ExcelSaveOptions 类的对象。
调用 Document.save() 方法并将输出文件的名称和 DocSaveOptions 对象作为参数传递。
以下代码示例展示了如何在 Python 中将 PDF 转换为 XLSX。
自定义 PDF 到 Excel 转换
您还可以使用不同的选项自定义 PDF 到 Excel 的转换。以下部分演示如何使用一些可用选项。
PDF 到 Excel,第一列空白
此选项用于在转换后的 Excel 工作表中添加空白的第一列。要设置此选项,您将使用 ExcelSaveOptions 类。以下代码示例展示了如何使用此选项。
尽量减少工作表的数量
默认情况下,PDF 中的每个页面都会转换为 Excel 文件中的一个工作表。但是,您可以覆盖此行为以最大限度地减少 Excel 文件中的工作表数量。为此,您需要将 ExcelSaveOptions.minimize_the_number_of_worksheets 属性设置为 True。以下代码示例演示如何最大限度地减少 PDF 到 Excel 转换中的工作表数量。
在线 PDF 到 Excel 转换器
如果您想在线将 PDF 文件转换为 Excel 格式,请使用我们的高质量且免费的 PDF 到 Excel 转换器,该转换器是使用 Aspose.PDF 库开发的。
免费 PDF 到 XLS 转换器
您可以获得免费许可证,将 PDF 文件转换为 Excel 格式,没有评估限制。
探索 PDF 到 Excel 转换器
您可以使用文档了解有关我们的 Python PDF 库的更多信息。此外,您可以随时通过我们的论坛告知我们您的疑问。
结论
在本文中,您学习了如何使用 Python 将 PDF 文件转换为 Excel。我们已经明确介绍了 PDF 到 XLS 和 XLSX 的转换。此外,您还了解了如何使用不同的选项自定义 PDF 到 Excel 的转换。此外,最后还提供了一个免费的在线 PDF 到 Excel 转换器,您可以使用它来转换任意数量的 PDF 文件。
另请参阅
在 C# 中将 PDF 转换为 Word
在 Java 中将 PDF 转换为 Word
Python PDF 到 XLS 转换