CogVideo 实测,智谱「清影」AI视频生成,全民免费,连 API 都开放了!

不得不说,AI 视频生成界最近非常火热~

前有快手「可灵」开放内测,一下子带火了老照片修复,全网刷屏:

怕是你还没拿到内测资格,被称为 “国货之光” 的「可灵」就结束了免费无限量模式。每天只有66点的免费额度,对应 6 次 5 秒视频,也就够你尝个鲜~

就在昨天,国产大模型头部玩家智谱震撼出手,推出了自家的视频生成工具 -「清影」,底层是自家的视频生成大模型 CogVideo。

划重点:全民免费,不用排队,不限次数! 连 API 都开放了,开发者的福音。

生成速度怎么样?

据官方介绍,6s 的 1440x960 视频,只需 30s,这推理速度,杠杠的~

要知道,前天分享的阿里开源的视频生成模型 EasyAnimate-v3,猴哥本地亲测,足足需要 188s !

话不多说,上链接,感兴趣的小伙伴可以去试试~

https://chatglm.cn/video

实测体验

首次使用,需要申请内测资格,不到 5 分钟就审核通过了。

功能介绍

目前支持「文生视频」和「图生视频」,两个 Tab 切换,非常简洁,简单是小白零门槛。

  • 文生视频:只需要输入提示词,选择视频风格、情感氛围、运镜方式,点「生成视频」即可

  • 图生视频:需要上传一张底图,输入提示词,点「生成视频」即可。

万事俱备,只差输入提示词了~ 可是:我不会写提示词,怎么办?

其实,无论是 AI 对话AI 绘画,还是这里的 AI 视频生成,提示词的套路都有一个核心原则:

那就是:结构化!结构化还有一个好处,就是让你的思路变得条理清晰。

对于 AI 视频生成 而言:

  • 简单结构:[摄像机移动]+[建立场景]+[更多细节]

  • 复杂结构:[镜头语言] + [光影] + [主体 (主体描述)] + [主体运动] +[场景 (场景描述)] +[情绪/氛围/风格]

为了帮助大家写好 提示词,官方还贴心地出了份文档,需要的小伙伴可以前往查看:

https://zhipu-ai.feishu.cn/wiki/MFxywuqcbiKmOrkXwJzcEuqwnJd

怕你连文档都没时间看,官方直接制作了两个「帮你写提示词」的智能体!免费取用~

  • 文生视频:https://chatglm.cn/main/gdetail/669911fe0bef38883947d3c6

输入简单的描述,智能体就给出了 3 个不同风格的提示词。

“您是否需要更换 3 个风格?” 不满意,随意换!

  • 图生视频:https://chatglm.cn/main/gdetail/669fb16ffdf0683c86f7d903

使用方法也是类似的,输入图像主体,选择一个风格即可。

就目前的体验而言,尽管视频只有6s,无论从流畅度、可控性来看,基本可以达到以假乱真的程度了,那么「清影」是怎么做到的?

API 调用

对于开发者而言,最关心的还是:有没有开放的 API,方便集成到自己的应用中。

答案是肯定的,前往智谱 AI 开放平台注册一个账号,新用户会赠送 18 元额度,后续使用中注意账户余额哦,不过体验是绰绰有余了~

智谱 AI 开放平台:https://open.bigmodel.cn/

接下来,需要拿到智谱的 API Key。

如果之前注册过,直接在这里取用:

如果没有,点击这里,新生成一个:

拿到 API Key 之后,我们前往模型中心,发现CogVideoX已经上线了:

由于视频生成时间较长,所以该接口是异步调用的。

也就是返回给你的是一个任务订单号-id,然后你根据这个 id 去查询是否生成成功。

这里我们以 Python 为例,实现 文生视频 功能:

from zhipuai import ZhipuAIclient = ZhipuAI(api_key="") # 请填写您自己的APIKeyresponse = client.videos.generations(model="cogvideox",prompt="比得兔开小汽车,游走在马路上,脸上的表情充满开心喜悦。"
)
print(response)

如果是图生视频,还需要传入底图的 image_url,支持通过 URL 或 Base64 编码传入图片,图片大小不超过 5 M。

返回的 response 的示例:

id='8868902201637896192' request_id='654321' model='cogvideox' task_status='PROCESSING'

接下来,我们根据这个 id 去查询结果(注意不是 request_id):

from zhipuai import ZhipuAIclient = ZhipuAI(api_key="") # 请填写您自己的APIKeyresponse = client.videos.retrieve_videos_result(id="8868902201637896192"
)
print(response)

返回的 response 示例:

{"model": "cogvideox","request_id": "8868902201637896192","task_status": "SUCCESS","video_result": [{"cover_image_url": "https://sfile.chatglm.cn/testpath/video_cover/4d3c5aad-8c94-5549-93b7-97af6bd353c6_cover_0.png","url": "https://sfile.chatglm.cn/testpath/video/4d3c5aad-8c94-5549-93b7-97af6bd353c6_0.mp4"}]
}

写在最后

Sora 的出现引爆了 AI 视频生成,那时国内的视频生成工具还屈指可数~

直至今天,AI 视频生成已经在国内遍地开花,比如字节跳动的即梦(Dreamina),快手的可灵,爱诗科技的 PixVerse。

智谱的清影,继续为国产 AI 视频生成 + 1

后续打算出一篇汇总文: 盘点那些好用的 AI 视频生成工具,包括国外的、国内的;开源的、闭源的…

感兴趣的小伙伴敬请关注~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/384424.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

看 Unity 组件的源码 —— ILSpy

ILSpy 是开源的 .NET 程序集浏览器和解编译器。 下载 ILSpy ILSpy Github 地址:icsharpcode/ILSpy: .NET Decompiler with support for PDB generation, ReadyToRun, Metadata (&more) - cross-platform! (github.com) 它有 Release 包可以下载 也提供 IDE 的…

静态路由学习笔记

1. 静态路由应用场景 (1)静态路由由网络管理员手动配置,配置方便,对系统要求低,适用于拓扑结构简单并且稳定的小型网络。 (2)缺点是不能自动适应网络拓扑的变化,需要人工干预过多。…

Python爬虫技术 第13节 HTML和CSS选择器

在爬虫技术中,解析和提取网页数据是核心部分。HTML 和 CSS 选择器被广泛用于定位网页中的特定元素。下面将详细介绍这些选择器如何在 Python 中使用,特别是在使用像 Beautiful Soup 或 Scrapy 这样的库时。 HTML 选择器 HTML 选择器基于 HTML 元素的属性…

企业公户验证API如何使用JAVA、Python、PHP语言进行应用

在纷繁复杂的金融与商业领域,确保每笔交易的安全与合规是至关重要的。而企业公户验证API,正是这样一位默默守护的数字卫士,它通过智能化的手段,简化了企业对公账户验证流程,让繁琐的审核变得快捷且可靠。 什么是企业公…

ShadingModel一些分析

一、算法分级 二、DFGTexture 用拟合替换DFGTexture(Ref:Cod-Black Ops II) 优点:节省一张纹理的采样。 缺点: 1、效果上会变得暗一些,并且由于用拟合的原因,会多一点指令计算。 2、后续如…

《Milvus Cloud向量数据库指南》——BGE-M3:多功能、多语言、多粒度的文本表示学习模型

引言 在自然语言处理(NLP)领域,随着大数据时代的到来,对文本信息的精准处理与高效检索成为了研究热点。BERT(Bidirectional Encoder Representations from Transformers)作为近年来NLP领域的里程碑式模型,以其强大的上下文理解能力在多项任务中取得了显著成效。然而,面…

Android APP 音视频(01)MediaCodec解码H264码流

说明: 此MediaCodec解码H264实操主要针对Android12.0系统。通过读取sd卡上的H264码流Me获取视频数据,将数据通过mediacodec解码输出到surfaceview上。 1 H264码流和MediaCodec解码简介 1.1 H264码流简介 H.264,也被称为MPEG-4 AVC&#xff…

【Linux】一些基本指令

文章目录 前言Linux下基本指令Linux下一些常见的通配符Linux下的引号引用whoamiwholswhichaliaswhereisfindtouchmkdirrmdir & rmmancpmvcatmorelessheadtailechodatecalgrepzip & unziptarrz & szuname几个重要的热键关机 前言 在学习操作系统的时候,我…

Dav_笔记12:Automatic SQL Tuning 之 1 概述

自动调整优化器概述 Oracle数据库使用优化程序为已提交的SQL语句生成执行计划。优化器以以下模式运行: ■普通模式 优化器编译SQL并生成执行计划。正常模式为绝大多数SQL语句生成合理的计划。在正常模式下,优化器以非常严格的时间约束运行&#xff0c…

Python 高阶语法

前言: 我们通过上篇文章学习了Python的基础语法,接下来我们来学习Python的高阶语法 1.初识对象 在Python中我们可以做到和生活中那样,设计表格、生产表格、填写表格的组织形式的 面向对象包含 3 大主要特性:  封装  继承 …

Oracle系统表空间的加解密

实验环境 数据库选择的是orclpdb1,当前系统表空间未加密: SQL> show con_nameCON_NAME ------------------------------ ORCLPDB1SQL> select TABLESPACE_NAME, STATUS, ENCRYPTED from dba_tablespaces;TABLESPACE_NAME STATUS …

软件测试:Postman 工具的使用。开发及测试均需要掌握的测试工具

工具介绍 各个模块功能的介绍如下: 1、New:在这里创建新的请求、集合或环境;还可以创建更高级的文档、Mock Server 和 Monitor以及API。 2、Import:这用于导入集合或环境。有一些选项,例如从文件,文件夹导…

【Linux】远程连接Linux虚拟机(MobaXterm)

【Linux】远程连接Linux虚拟机(MobaXterm) 零、原因 有时候我们在虚拟机中操作Linux不太方便,比如不能复制粘贴,不能传文件等等,我们在主机上使用远程连接软件远程连接Linux虚拟机后可以解决上面的问题。 壹、软件下…

学习小型gpt源码(自用)

数据集构建_哔哩哔哩_bilibili (b站上有一系列课,从数据处理到模型构建和训练使用) 什么是batch? 为什么一个batch内的句子要一样长? 不同batch的长度可以不一样,但是同一个batch内长度一样!…

回文子串转二维dp的方式

目录 写在最前: 1. 首先我们要考虑一个问题:如何判断一个字符串是回文子串 2.如何创建dp[i][j]表示回文子串 3. 如何初始化? 4. 如何实现 问题引入: LCR 020. 回文子串 给定一个字符串 s ,请计算这个字符串中有…

Spring Boot入门指南:留言板

一.留言板 1.输⼊留⾔信息,点击提交.后端把数据存储起来. 2.⻚⾯展⽰输⼊的表⽩墙的信息 规范: 1.写一个类MessageInfo对象,添加构造方法 虽然有快捷键,但是还是不够偷懒 项目添加Lombok。 Lombok是⼀个Java⼯具库,通过添加注…

C语言 | Leetcode C语言题解之第279题完全平方数

题目: 题解: // 判断是否为完全平方数 bool isPerfectSquare(int x) {int y sqrt(x);return y * y x; }// 判断是否能表示为 4^k*(8m7) bool checkAnswer4(int x) {while (x % 4 0) {x / 4;}return x % 8 7; }int numSquares(int n) {if (isPerfect…

项目实战1(30小时精通C++和外挂实战)

项目实战1(30小时精通C和外挂实战) 01-MFC1-图标02-MFC2-按钮、调试、打开网页05-MFC5-checkbox及按钮绑定对象06--文件格式、OD序列号08-暴力破解09-CE10-秒杀僵尸 01-MFC1-图标 这个外挂只针对植物大战僵尸游戏 开发这个外挂,首先要将界面…

【SpringCloud】 微服务分布式环境下的事务问题,seata大合集

目录 微服务分布式环境下的事务问题 分布式事务 本地事务 BASE理论与强弱一致性 BASE理论 强弱一致性 常见分布式事务解决方案 - 2PC 常见分布式事务解决方案 - TCC 常见分布式事务解决方案 - 最大努力通知 常见分布式事务解决方案 - 最终一致性 Seata介绍与术语 Seata…

学习测试10-4自动化 web自动化

网页资源 链接: https://pan.baidu.com/s/17XL2c2lkw_R6BD–VnOQqw?pwd43dr 提取码: 43dr 复制这段内容后打开百度网盘手机App,操作更方便哦 框架之间切换 driver.switch_to.frame("idframe1") # 父切子 参数用id和name# 子切子必须先转回父 driver.sw…