chatGPT看图写小作文

 从学校毕业好多年了,但是语文科目的看图写话这种作文形式给我的困扰还是历历在目,为了弥补这一遗憾,决定用AI来给我看图写话,哈哈。

01

图像说明

    Illustrated Image Captioning(图片说明)是一种人工智能技术,它将图像自动描述为文字,同时为图像添加图像化的补充说明。与基本的图像标注技术相比,Illustrated Image Captioning可以生成更具表现力和详细的图像说明。例如,对于一张照片中的人像,Illustrated Image Captioning 能够生成像“一个年轻女性穿着蓝色的连衣裙,在风中微微地微笑着”的说明。这种技术可以应用于视觉搜索引擎、智能相册和自动翻译等领域,可以帮助计算机更好地理解和语言化图像内容,从而更好地为人类服务。

b7781c4fe8bbad0b74233e7ec1fecdd7.png

    视觉编码器解码器模型可以使用任何预训练的基于Transformer的视觉模型,比如ViT,BEiT,DeiT和Swin作为编码器,以及任何预训练的语言模型,比如RoBERTa,GPT2,BERT和DistilBERT作为解码器,从而初始化一个图像到文本模型。

    图像字幕生成是一个例子,其中编码器模型用于对图像进行编码,之后自回归语言模型,即解码器模型生成字幕

02


模型构建

主要的思路是借助图片总结模型,生成对模型总结的一句话,然后利用openai对这句话进行扩写

from transformers import VisionEncoderDecoderModel, ViTImageProcessor, AutoTokenizer
import torch
from PIL import Image
import gradio as grfrom revChatGPT.V3 import Chatbotchatbot = Chatbot(api_key="your api key")model = VisionEncoderDecoderModel.from_pretrained("nlpconnect/vit-gpt2-image-captioning",cache_dir="vit-gpt2-image-captioning",resume_download=True)
feature_extractor = ViTImageProcessor.from_pretrained("nlpconnect/vit-gpt2-image-captioning")
tokenizer = AutoTokenizer.from_pretrained("nlpconnect/vit-gpt2-image-captioning")device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)max_length = 100
num_beams = 40
gen_kwargs = {"max_length": max_length, "num_beams": num_beams}
def predict_step(image,style):i_image = Image.fromarray(image.astype('int8'),'RGB')pixel_values = feature_extractor(images=i_image, return_tensors="pt").pixel_valuespixel_values = pixel_values.to(device)output_ids = model.generate(pixel_values, **gen_kwargs)preds = tokenizer.batch_decode(output_ids, skip_special_tokens=True)preds = [pred.strip() for pred in preds]prompt = "根据这句话写一篇200字的散文,散文是{}的风格:{}".format(style,preds[0])result = chatbot.ask(prompt)# result = llm.generate([prompt])return resultdemo = gr.Interface(fn=predict_step,inputs=[gr.Image(),gr.Dropdown(["鲁迅", "徐志摩", "莫言", "老舍"],label="Style",info="选择你需要的作文的风格.")],outputs=[# gr.Textbox(label="prediction"),gr.Textbox(label= "Essay")])demo.launch()

如下图是生成的结果,看上去像那么回事了,但是感觉还是有点胡扯,哈哈

64052ccecda38b1bc0da1b5980c21806.png

如果你也想用AI看图说话,那就试试吧

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/3295.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ChatGPT写全国甲卷,光问一遍怎么可能写出好作文,一文教你高效提问AI ~

作者 | 乐意奥AI 点个关注呀 版本 | v2306.0 人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。 这句引人深思的话来自今年的全国甲卷。 各位读者肯定在各大自媒体平台都看到了各个博主实测 AI大战高考作文,但是大部分的博主只是简单地将…

ChatGpt写新课标I卷(江苏)2023高考语文作文,并给出评分

阅读下面的材料,根据要求写作。(60分) 好的故事,可以帮我们更好地表达和沟通,可以触动心灵、启迪智慧;好的故事,可以改变一个人的命运,可以展现一个民族的形象……故事是有力量的。 …

chatgpt3.5和chatgpt4的区别

ChatGPT4是基于GPT-3模型的一个实例,但ChatGPT4已经进行了进一步的改进和优化。GPT-3(第三 代生成式预训练模型)是OpenAl开发的一个大型语言模型,它在很多自然语言处理任务中表现出色。 ChatGPT4继承了GPT-3的基本架构和能力&…

ChatGPT开源替代来了!参数量200亿,在4300万条指令上微调而成

OpenChatKit 是一个类 ChatGPT 开源工具包,内含一个 20B 参数量的大模型,而且该模型在 4300 万条指令上进行了微调。 转自《机器之心》 2023 年,聊天机器人领域似乎只剩下两个阵营:「OpenAI 的 ChatGPT」和「其他」。 ChatGPT 功能…

如何使用 ChatGPT (人工智能聊天机器人) 运行 Docker 容器

公众号关注 「奇妙的 Linux 世界」 设为「星标」,每天带你玩转 Linux ! 最近一款新的聊天 AI 被网友们玩疯了。 它可以直接生成代码、可以给你的代码 debug 以及提出优化... 可以模仿莎士比亚风格写作... 还可以解答各种各样的问题,而且显然不…

ChatGPT新突破:打造自己的智能机器人控制系统

💖 作者简介:大家好,我是Zeeland,全栈领域优质创作者。📝 CSDN主页:Zeeland🔥📣 我的博客:Zeeland📚 Github主页: Undertone0809 (Zeeland) (github.com)&…

国内最新的ChatGpt4模型可用介绍镜像CODE-MJ 分析 报道

近期,国内最新的ChatGPT4模型备受关注,尤其是其白泽AI 镜像CODE的引入。这一进展为自然语言处理领域带来了新的探索和应用前景。在本文中,我们将对白泽AI 进行深入分析,以揭示其潜力和创新之处。 首先,白泽AI 镜像COD…

【ChatGPT】预训练模型微调及其应用(ChatGLM-6B、duckduckgo_search、GPT在科研的应用等)

note instructGPT(基于提示学习的系列模型)——>GPT3.5(大规模预训练语言模型)——>ChatGPT模型(高质量数据标注反馈学习)。chatGPT三大技术:情景学习、思维链、自然指令学习。GPT4飞跃式…

ChatGPT 有什么新奇的使用方式?

你别说,你还真别说,我对象一般用它谈恋爱!!! 我对象在谈一种很新的恋爱,不建议模仿,因为根本停不下来! 事情是这样的,我最近开始对ChatGPT感兴趣,但我这个技…

【跟着ChatGPT学深度学习】ChatGPT带我入门NLP

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

【ChatGPT散文篇】ChatGPT-清华大学的讲座要点

刚听了清华大学关于ChatGPT的讲座,总结几个要点: 1、AI有可能成为地球上最初的硅基生命。 2、AI已迭代至博士研究生的智力水平。 3、以后将不存在学科和专业的概念,也不存在文科理科的区分,将是学科大融合。因为一个文科生哪怕不懂代码&a…

【跟着ChatGPT学深度学习】ChatGPT教我文本分类

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️ 👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博…

ChatGPT 被居心不良的人拿去搞黄色了...

此前,推出的各类AI绘画工具。 想要制作出还能看得过去的作品,需要一定的美术功底和美感,上手门槛一点也不低。 大部分绅士顶多做个饱饱眼福的观众,完全没有参与感。 啪得一下很快啊,最近一个新的AI又火了,终…

3个技术男搞恋爱版ChatGPT,估值10亿美元

过去几个月,我们见证了GPT从3.5到4.0,从只能做结构化搜索整合到接近人类思维的对话,我们还看到了 GPT逐步掌握画画、写作、剪辑、制表、做 PPT 等技能。最可怕的是AI的迭代速度,简直是一天一个样。 这股这股前所未有的技术浪潮&a…

【ChatGPT恋爱攻略】给女朋友编睡前小故事

曾经有一只小鸟,它在森林里翱翔,在阳光明媚的早晨,发现了一条美丽的蜘蛛丝。这个小鸟陶醉于那条丝线的美丽与精巧,深感自己的运气有多好能够发现它。 小鸟开始孜孜不倦地尝试把细线拽下来,但总是它突然断裂&#xff0…

表白ChatGPT被秒拒!网友奇招打破电子人的「沉睡魔咒」

点击上方“视学算法”,选择加"星标"或“置顶” 重磅干货,第一时间送达 视学算法报道 编辑:昕朋 【导读】想和ChatGPT谈恋爱吗?Reddit网友手把手教你。 ChatGPT已经火了一段时间,世界各地的人才也把它的功能…

如何使用ChatGPT API训练自定义知识库AI聊天机器人

原文:如何使用ChatGPT API训练自定义知识库AI聊天机器人 - 闪电博 在我们之前的文章中,我们演示了如何用ChatGPT API建立一个AI聊天机器人,并指定一个角色来进行个性化处理。但如果你想在自己的数据上训练人工智能呢?例如&#x…

当 chatGPT 被职场 PUA ,笑麻了!

大家最近是不是被 chatGPT 刷屏了?简单来说,chatGPT 是一个智能聊天引擎。 那 chatGPT 和小爱同学、 siri 有什么区别呢? 如果体验过的朋友,能感受到区别还是很大,chatGPT 的智能表现过于优秀,远远超过了这…

多设备智能语音交互—小爱协同唤醒

一、背景 2014年11月,亚马逊推出了一款全新概念的智能音箱:Echo,这款产品最大的亮点是将智能语音交互技术植入到传统音箱中,从而赋予了音箱人工智能的属性。这个被称为“Alexa”的语音助手可以像你的朋友一样与你交流,…

小爱同学 语音唤醒 息屏唤醒 可控麦克风占用 个人制作

今年四月份入了红米note5,我买的第一台小米设备。颜值高,全面屏操作,着实是很出色。 使用过程中发现,小爱同学,只能通过点击图标的形式开启,没有语音唤醒功能,着实是一大缺憾。 趁着五一假期&am…