pip install pymupdf
pip install fitzimport fitz # PyMuPDFdef get_pdf_links(pdf_path):# 打开PDF文件document = fitz.open(pdf_path)links = []for page_num in range(len(document)):page = document[page_num]# 获取当前页面的链接for link in page.get_links():links.append((page_num, link))document.close()return links
link=get_pdf_links(pdf_path)
print(link)
如图所示
这段代码会打开指定的PDF文件,遍历每一页,并获取每一页上的超链接。每个链接是一个元组,包含页码(从0开始)和链接的字符串