我想要一个 python 函数,它接受 pdf 并返回文档中注释注释的文本列表。我看过 python-poppler ( https://code.launchpad.net/~poppler-python/poppler-python/trunk ) 但我不知道如何让它给我任何有用的东西。
我找到了 get_annot_mapping
方法并修改了提供的演示程序以通过 self.current_page.get_annot_mapping()
调用它,但我不知道如何处理 AnnotMapping 对象。好像没有完全实现,只提供了copy方法。
如果有任何其他库提供此功能,那也没关系。
以防万一有人正在寻找一些工作代码。这是我使用的脚本。