CogView4:生成中英双语高清图片的开源文生图模型综合介绍
CogView4 是由清华大学 KEG 实验室(THUDM)开发的一款开源文生图模型,专注于将文本描述转化为高质量图像。它支持中英双语提示词输入,尤其擅长理解中文提示并生成带有汉字的图像,非常适合广告设计、短视频创作等场景。作为首个支持在画面中生成汉字的开源模型,CogView4 在复杂语义对齐和指令跟随能力上表现出色。它基于 GLM-4-9B 文本编码器,支持任意长度的提示词输入,并能生成高达 2048 分辨率的图像。项目托管在 GitHub 上,提供详细代码和使用文档,吸引了大量开发者与创作者关注与参与。
最新的 CogView4 模型将于3月13日上线 智谱清言 官网。
在线体验:https://huggingface.co/spaces/THUDM-HF-SPACE/CogView4
功能列表
- 中英双语提示词生成图像:支持中文和英文描述,能精准理解并生成符合提示的图