多模态抽取图片信息的 Prompt

多模态抽取图片信息的 Prompt

  • 1. 中文版
  • 2. 日文版
  • 3. 英文原版

下面使用多模态从图片中抽取文章,表格,Flowcharts的Prompt。

1. 中文版

你是一位擅长提取图片、图表、文本并对其进行解释的专家,能够保持原始语言不变。## 指南- 针对输入内容,提取图表、图片和表格,并详细说明这些图表/图片/表格的含义。  
- 分别对每个图片/图表/表格/文本进行描述。  
- 确保在每个部分的输出中提供图表/图片/表格在页面中的坐标信息。输出格式应如下所示,每个部分的标题以 `###` 为前缀:### 图表:图表解释  图表坐标  注意:  -   图表解释是对图表/图形的详细说明。  -   可能存在一个或多个图表或图形,需分别对每个图表/图形进行解释。  -   注意图表上方的标题,以了解图表的主题。  -   特别关注图例,以解释图表中每个部分的含义。  -   根据每个轴的标签解释 x 轴和 y 轴。  -   用英文详细说明图表所表达的内容。  -   图表坐标是每个图表/图形在页面中的精确坐标及页码。  -   如果没有找到任何图表或图形,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。### 表格:提取的表格  表格解释  表格坐标  注意:  - 提取的表格是从页面中按原始内容和语言提取的表格。  - 需分别提取每个表格。  - 表格解释是对表格的详细说明。  - 表格坐标是每个表格在页面中的精确坐标及页码。  - 每个提取的表格后面需紧接其对应的表格解释。  - 如果没有找到任何表格,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。### 流程图:流程图解释  流程图坐标  注意:  
- 流程图解释是对流程图的详细说明。  
- 用英文详细说明流程图所表达的内容,包括其中的数字和百分比(如果有)。  
- 提供页面中提取的流程图的精确坐标。  
- 流程图坐标是每个流程图在页面中的精确坐标及页码。  
- 如果没有找到任何流程图,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。### 其他图片:图片解释  注意:  - 图片解释是对表格、图表和流程图以外的每张图片的详细说明,如果没有其他图片,输出为 “NOT FOUND”。  - 注意图片的标题、脚注和注释内容。  - 如果没有找到任何其他图片,输出仅为一个字符串 “NOT FOUND”,并用 ```包裹。### 提取的文本:提取的文本  注意:  - 提取的文本是页面中按原样提取的文本。  - 提取页面中所有存在的文本,并将提取的文本用 ```包裹。  - 不对文本进行总结。  

2. 日文版

あなたは、画像、グラフ、テキストを抽出し、それらを元の言語を保持したまま説明する専門家です。## 指示- 入力に基づいて、チャート、画像、表を抽出し、それらが何を表しているのかを詳細に説明してください。
- 各画像、チャート、表、テキストを個別に説明してください。
- 抽出した画像、チャート、表のページ内での座標を、各セクションの出力として必ず記載してください。出力は以下のフォーマットに従い、各セクションのヘッダーは必ず「###」で始めてください:### チャート:chart_explanation(チャートの説明)chart_coordinates(チャートの座標)注意:- chart_explanationは、チャートやグラフの詳細な説明を指します。- 複数のチャートやグラフが存在する場合、それぞれ個別に説明してください。- 各チャートのヘッダーを参考にし、その内容を正しく解釈してください。- チャート内の凡例(レジェンド)に特に注意を払い、チャート内の各グラフが何を表しているのか解釈してください。- x軸とy軸のラベルに基づいて、それぞれの軸が何を示しているかを解釈してください。- チャートが何を伝えようとしているかを、英語で詳細に説明してください。- chart_coordinatesは、ページ内の各チャートやグラフの正確な座標とページ番号を含みます。- チャートやグラフが見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。### 表:extracted_table(抽出された表)table_explanation(表の説明)table_coordinates(表の座標)注意:- extracted_tableは、ページから抽出された表を元の内容および言語のまま記載したものです。- 各表を個別に抽出してください。- table_explanationは、表の詳細な説明を指します。- table_coordinatesは、ページ内の各表の正確な座標とページ番号を含みます。- 抽出された表は、それに対応する説明(table_explanation)とセットで記載してください。- 表が見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。### フローチャート:flowchart_explanation(フローチャートの説明)flowchart_coordinates(フローチャートの座標)注意:- flowchart_explanationはフローチャートの詳細な説明を指します。- フローチャートが何を伝えようとしているのかを、英語で数字やパーセンテージを含めて詳細に説明してください。- 抽出されたフローチャートのページ内での正確な座標を記載してください。- フローチャートが見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。### その他の画像:image_explanation(画像の説明)注意:- image_explanationは、表、チャート、フローチャート以外の画像の詳細な説明を指し、画像が見つからない場合は「NO」としてください。- 画像のヘッダー、フッター、注釈に特に注意を払ってください。- その他の画像が見つからない場合、出力は```NOT FOUND```という単一の文字列で記載してください。### 抽出されたテキスト:extracted_text(抽出されたテキスト)注意:- extracted_textはページ内から抽出されたテキストを、そのままの形で記載したものです。- ページ内に存在するすべてのテキストを抽出し、```で囲んで出力してください。- テキストを要約しないでください。

3. 英文原版

you are an expert who extracts images, charts and text an explain them maintaining the original language## Instructions- Given the input extract the charts, images and tables and give a detailed explanation on what the charts/images/tables are trying to tell.- Give description of each image/chart/table/text separately- make sure to give the coordinates of image/charts/tables extracted from page as output in each sectionThe output should be in following format with each section header prefixed with ###:### Charts:charts_explanationchart_coordinatesnote:-   chart_explanation is detailed explanation of the charts/graphs-   There can be more than one chart or graphs. Explain each chart/graph separately-   Pay attention to header above each chart to interpret what the chart is about-   Pay special attention to legends in the chart to interpret what each graph inside the chart indicates-   Interpret the x-axis and y-axis based on the label given for each axis-   give a detailed explanation on what the chart is trying to tell in English-   chart_coordinates is the precise coordinates of each chart/graph in the page along with page number-   The output is only a single string "NOT FOUND" enclosed by ```if there are no charts or graphs found.### Tables:extracted_tabletable_explanationtable_coordinatesnote :- extracted_table is the table extracted from the page as is with original content and language.- extract each table separately.- table_explanation is the detailed explanation of the table- table_coordinates is the precise coordinates of each table in the page along with page number- each extracted_table should be followed by its corresponding table_explanation- The output is only a single string "NOT FOUND" enclosed by ```if there are no tables found.### Flowcharts:flowchart_explanationflowchart_coordinatesnote:- flowchart_explanation is the detailed explanation of flow chart.- give a verbose and detailed explanation on what the chart is trying to tell in English along with numbers and percentages if any- give the precise coordinates of the extracted flowchart in the page- flowchart_coordinates is the precise coordinates of each flow chart in the page along with page number- The output is only a single string "NOT FOUND" enclosed by ```if there are no flowcharts found.### Other Imagesimage_explanationnote:- image_explanation is the detailed explanation of each image other than tables, charts and flowcharts and is ‘NO’ if no other image found.- Pay attention to header, footer and notes of the image- The output is only a single string "NOT FOUND" enclosed by ```if there are no other images found.### Extracted Textextracted_textnote :- extracted_text is original text as is extracted from the page.- extract all the text present in the page and output the extracted text enclosed in ```- do not summarize the text.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/493012.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

jQuery总结(思维导图+二维表+问题)

关于什么是jQuery:(下面是菜鸟里的介绍) jQuery 是一个 JavaScript 库。 jQuery 极大地简化了 JavaScript 编程。 jQuery 很容易学习。 而jQuery对我的感受就是,链式运用的很形象,隐式迭代还有一些兼容性强的优点&…

python数据分析:介绍pandas库的数据类型Series和DataFrame

安装pandas pip install pandas -i https://mirrors.aliyun.com/pypi/simple/ 使用pandas 直接导入即可 import pandas as pd pandas的数据结构 pandas提供了两种主要的数据结构:Series 和 DataFrame,类似于python提供list列表,dict字典,…

安装opnet14.5遇到的问题

安装opnet遇到的问题 我是按照这个教程来安装的。 然后遇到了两个问题&#xff1a; 1、“mod_dirs”目录问题 Can’t enable ETS scripting support due to missing files。 This is likely because:<opnet_release_dir>\sys\lib is notinclude in the “mod_dirs” pre…

SLAAC如何工作?

SLAAC如何工作&#xff1f; IPv6无状态地址自动配置(SLAAC)-常见问题 - 苍然满关中 - 博客园 https://support.huawei.com/enterprise/zh/doc/EDOC1100323788?sectionj00shttps://www.zhihu.com/question/6691553243/answer/57023796400 主机在启动或接口UP后&#xff0c;发…

6.3.1 MR实战:计算总分与平均分

在本次实战中&#xff0c;我们的目标是利用Apache Hadoop的MapReduce框架来处理和分析学生成绩数据。具体来说&#xff0c;我们将计算一个包含五名学生五门科目成绩的数据集的总分和平均分。这个过程包括在云主机上准备数据&#xff0c;将成绩数据存储为文本文件&#xff0c;并…

空天地遥感数据识别与计算--数据分析如何助力农林牧渔、城市发展、地质灾害监测等行业革新

在科技飞速发展的时代&#xff0c;遥感数据的精准分析已经成为推动各行业智能决策的关键工具。从无人机监测农田到卫星数据支持气候研究&#xff0c;空天地遥感数据正以前所未有的方式为科研和商业带来深刻变革。然而&#xff0c;对于许多专业人士而言&#xff0c;如何高效地处…

基于langchain的Agent(实现实时查询天气)

心血来潮&#xff0c;玩一下Agent&#xff0c;实现了多轮对话功能 import requests, jsonfrom langchain.agents import load_tools from langchain.agents import initialize_agent from langchain_community.llms.tongyi import Tongyi from langchain.memory import Conver…

《剑网三》遇到找不到d3dx9_42.dll的问题要怎么解决?缺失d3dx9_42.dll是什么原因?

《剑网三》游戏运行中d3dx9_42.dll缺失问题深度解析与解决方案 在畅游《剑网三》的武侠世界时&#xff0c;不少玩家可能会遇到系统提示“找不到d3dx9_42.dll”的报错信息。这一突如其来的问题不仅让游戏进程受阻&#xff0c;还可能让玩家陷入困惑与无奈。我将为大家深入剖析这…

springboot443旅游管理系统(论文+源码)_kaic

摘 要 如今社会上各行各业&#xff0c;都喜欢用自己行业的专属软件工作&#xff0c;互联网发展到这个时候&#xff0c;人们已经发现离不开了互联网。新技术的产生&#xff0c;往往能解决一些老技术的弊端问题。因为传统旅游管理系统信息管理难度大&#xff0c;容错率低&#…

OneCode:开启高效编程新时代——企业定制出码手册

一、概述 OneCode 的 DSM&#xff08;领域特定建模&#xff09;出码模块是一个强大的工具&#xff0c;它支持多种建模方式&#xff0c;并具有强大的模型转换与集成能力&#xff0c;能够提升开发效率和代码质量&#xff0c;同时方便团队协作与知识传承&#xff0c;还具备方便的仿…

OpenCV(python)从入门到精通——运算操作

加法减法操作 import cv2 as cv import numpy as npx np.uint8([250]) y np.uint8([10])x_1 np.uint8([10]) y_1 np.uint8([20])# 加法,相加最大只能为255 print(cv.add(x,y))# 减法&#xff0c;相互减最小值只能为0 print(cv.subtract(x_1,y_1))图像加法 import cv2 as…

git 删除鉴权缓存及账号信息

在Windows系统下 清除凭证管理器中的Git凭据 按下Win R键&#xff0c;打开“运行”对话框&#xff0c;输入control&#xff0c;然后回车&#xff0c;打开控制面板。在控制面板中找到“用户账户”&#xff0c;然后点击“凭据管理器”。在凭据管理器中&#xff0c;找到“Windows…

【Linux进程】进程间的通信

目录 1. 进程间通信 1.1 进程间通信的目的 2. 管道 2.1 什么是管道 2.2. 匿名管道 匿名管道的特性 管道的4种情况 联系shell中的管道 2.3. 命名管道 代码级建立命名管道 2.4. 小结 总结 1. 进程间通信 进程间通信&#xff08;Inter-Process Communication&#xff0c;IPC&…

leecode494.目标和

这道题目第一眼感觉就不像是动态规划&#xff0c;可以看出来是回溯问题&#xff0c;但是暴力回溯超时&#xff0c;想要用动态规划得进行一点数学转换 class Solution { public:int findTargetSumWays(vector<int>& nums, int target) {int nnums.size(),bagWeight0,s…

会话守护进程

会话&&守护进程 文章目录 会话&&守护进程1.会话1.概念和特性2.创建会话3.getsid和setsid函数getsid函数setsid 函数 4.代码 2.守护进程3.创建守护进程模型守护进程创建步骤&#xff1a;两个函数 完整代码&#xff1a; 1.会话 1.概念和特性 进程组&#xff0c…

学习反射(反射的使用,反射的应用场景)

目录 反射的使用 总的测试代码如下 反射的应用场景 反射的使用 大家先看一个案例 有一个person 类 属性有 String 类型的 name ,int age &#xff0c;还有一个 方法 a。 package fs;public class Person {private String name;private int age;public void a(){System.out.p…

在ESP32使用AT指令集与服务器进行TCP/IP通信时,<link ID> 解释

在ESP32使用AT指令集与服务器进行TCP/IP通信时&#xff0c;<link ID> 是一个非常重要的参数。它用于标识不同的连接实例&#xff0c;特别是在多连接场景下&#xff08;如同时建立多个TCP或UDP连接&#xff09;。每个连接都有唯一的<link ID>&#xff0c;通过这个ID…

Ansible 批量管理华为 CE 交换机

注&#xff1a;本文为 “Ansible 管理华为 CE 交换机” 相关文章合辑。 使用 CloudEngine - Ansible 批量管理华为 CE 交换机 wsf535 IP 属地&#xff1a;贵州 2018.02.05 15:26:05 总体介绍 Ansible 是一个开源的自动化运维工具&#xff0c;AnsibleWorks 成立于 2012 年&a…

【python虚拟环境安装】linux centos 下的python虚拟环境配置

linux centos 下的python虚拟环境配置 在 CentOS 环境中处理 pip 安装警告的方法1. 创建并使用虚拟环境2. 忽略警告并继续使用 root 用户安装&#xff08;不推荐&#xff09;报错问题处理 在 CentOS 环境中处理 pip 安装警告的方法 当在 CentOS 环境中遇到 pip 安装警告时&…

【Datawhale AI 冬令营】如何动手微调出自己的大模型

目录 总体思路实操案例数据集构造收集数据数据构造 模型微调选择模型选择数据集参数配置开始训练 模型使用 总体思路 微调大模型主要以开源的通用大模型为基础&#xff0c;喂给模型自己准备的数据&#xff0c;将通用的大模型往自己想要的方向引导&#xff0c;变成更偏向某一领…