最近项目需要使用到Azure Document intelligence,于是去做POC,但是发现最简单的demo跑的时候都会报这个错,解决了一下午终于搞定了,记录下。
首先是官方文档:
Quickstart: Document Intelligence (formerly Form Recognizer) client libraries - Azure AI services | Microsoft Learn
从Azure portal里面copy endpoint以及key
然后是安装依赖
pip install azure-ai-documentintelligence==1.0.0b2
最后是demo代码。这个PDF应该是公共可以访问的。
from azure.ai.documentintelligence import DocumentIntelligenceClient
from azure.ai.documentintelligence.models import AnalyzeDocumentRequestfrom azure.core.credentials import AzureKeyCredential# 设置端点和API密钥
endpoint = "<your_endpoint>"
key = "<your_key>"# 创建DocumentAnalysisClient实例
client = DocumentIntelligenceClient(endpoint=endpoint, credential=AzureKeyCredential(key))
pdfUrl="https://raw.githubusercontent.com/Azure-Samples/cognitive-services-REST-api-samples/master/curl/form-recognizer/sample-layout.pdf"
data=AnalyzeDocumentRequest(url_source=pdfUrl)
poller = client.begin_analyze_document("prebuilt-layout",data )
result = poller.result()# 输出分析结果
for page in result.pages:print(f"Page Number: {page.page_number}")for line in page.lines:print(f"Line: {line.content}")
然后我就一直报错:
解决了一下午,终于解决了。
查到了居然是区域的问题,本来是不太相信的,
抱着试一试的心态尝试去重新创建了个DI,我一开始是southeast Asia,新建了一个是East US的区域的DI,然后修改代码里面的endpoint和key。重新跑代码,居然成功了