斯坦福大学提出电影剧本可视化工具ScriptViz:能够根据剧本中的文本和对话自动检索相关的电影画面,帮助剧作家更好地构思和调整剧情

title:斯坦福大学提出电影剧本可视化工具ScriptViz:能够根据剧本中的文本和对话自动检索相关的电影画面,帮助剧作家更好地构思和调整剧情

斯坦福大学的研究者们开发了一个电影剧本可视化工具ScriptViz工具,ScriptViz的工作原理可以简单地理解为一个智能助手,它帮助剧作家将文字变成生动的画面。

比如,如果剧作家写了一个在沙漠中的对话场景,ScriptViz会找到一些电影中在沙漠拍摄的镜头,并将这些镜头展示给剧作家。这样,剧作家就可以看到他们想要的场景是怎样的,并根据这些画面来调整和丰富他们的剧本。这种方法让剧作家在创作时不仅依赖想象,还能看到实际的视觉效果,从而更好地表达他们的故事。

下面来看一个例子:

一位编剧写了主角“戴夫”,他脾气暴躁,被困在沙漠中。她脑子里有几句话,如上图所示。她想在创作之初就为一天中的时间和其他角色的性别选择一个合适的设置。通过将这些设置为变体属性,她看到了三行不同的可视化效果,并更喜欢第三行。她看到的夜景更好地反映了角色们疲惫一整天的糟糕处境。背景中的枯树加强了这种紧张感,也通过在底部添加细节(粗体红色文字)改变了她的剧本。这些添加通过增强戴夫的个性创造了一个更好的主角。

|Stanford|ACM UIST 2024|⭐️⭐️

用户界面

ScriptViz 界面由四个组件组成。用户输入AMPAS标准的脚本(A),添加SQL格式的属性控制(B)组件,然后单击提交按钮(C)。 ScriptViz 提供来自不同电影场景的可视化输出 (D),其中每个场景都包含一个既定的镜头概述以及脚本中每一行对话的图像。

相关链接

论文地址:http://arxiv.org/abs/2410.03224v1

项目主页:https://virtualfilmstudio.github.io/projects/scriptviz

论文阅读

ScriptViz:基于大型电影数据库的辅助剧本创作的可视化工具

摘要

编剧通常依靠心理可视化来创作生动的故事,他们利用想象力去观察、感受和体验他们正在写的场景。除了心理可视化之外,他们还经常参考电影中现有的图像或场景,并分析视觉元素以创造特定的情绪或氛围。

本文提出了ScriptViz,为编剧过程提供基于大型电影数据库的外部可视化。它根据剧本的文本和对话从大型电影数据库中动态检索参考视觉效果。该工具提供了两种对视觉元素的控制,使编剧能够

  1. 准确地看到他们想要的固定视觉元素

  2. 看到不确定元素的变化。

15位编剧的用户评估表明,ScriptViz 能够为编剧提供一致但多样的视觉可能性,与他们的剧本紧密结合并帮助他们创作。

方法

ScriptViz 建立在 MovieNet 之上,这是一个包含 1、100 部电影的数据库,这些电影在不同级别上进行了注释,具有各种属性,例如电影级属标签、场景级位置标签、镜头级电影风格标签和帧级角色边界框注释。一个关键步骤是对数据库进行预处理并提高每个属性的可识别性。使用时,ScriptViz根据用户的输入检索场景。它基于对视觉属性的两种类型的控制,使作者能够通过固定的视觉元素准确地看到他们想要的内容,并看到不确定元素的变化。然后它检索每个脚本对话序列的图像。

数据库预处理过程中提高各属性可识别性的方法。左图显示,我们计算设置标签和视觉帧之间的CLIP视觉文本相似度,以获得每帧设置标签的可识别性分数,并检测正面以获得每帧中每个字符的可识别性分数。右图显示我们的预处理方法可以成功检索建立镜头和角色的清晰帧。

unsetunset实验unsetunset

编剧在卧室里写了一场“遗嘱讨论”场景,哈里森先生是一位 80 多岁的老人,睿智,举止温暖善良,而詹姆斯则是一位年轻人,哈里森先生的儿子或孙子,体贴而细心。在使用 ScriptViz 之前,编剧脑子里已经有了一些基本的对话,如图 6 顶部所示。通过指定固定位置属性“卧室”和角色属性“2 个男性角色,其中 Character1Age>70 且 Character2Age=Variable” ,ScriptViz 返回结果如图 6 所示,其中第一行 James 的年龄为 30 岁,第二行为 10 岁,第三行为 50 岁。在所有这些可视化中,编剧选择了第三种,因为它更符合詹姆斯深思熟虑、细心的性格。根据第三个老人与年轻人交谈的形象、他们的面部表情和邀请的气氛,编剧放慢了对话的节奏,用较长的句子和诸如“我的孩子”和“充足的时间”之类的词。这种缓慢的节奏更能体现出哈里森先生温暖善良的性格编剧用较长的句子和诸如“我的孩子”和“充足的时间”之类的词语减慢了对话的节奏。这种缓慢的节奏更能体现出哈里森先生温暖善良的性格编剧用较长的句子和诸如“我的孩子”和“充足的时间”之类的词语减慢了对话的节奏。这种缓慢的节奏更能体现出哈里森先生温暖善良的性格

编剧编写了爱丽丝和鲍勃夫妇之间的争论场景。最初,她将场景设定在夜间的一家“餐厅”。她想写鲍勃,他的特点是自信且有点自以为是,正如他与爱丽丝的互动所表明的那样。然而,她对这场冲突的气氛仍然不满意。然后她意识到,由于爱丽丝和鲍勃已经互相认识,因此在更亲密或更随意的环境(例如家里)中引发冲突可能更合适。她把它改成了夜间的“餐厅”。于是,她将第一句的对话从“点菜”改为“做饭”比喻鲍勃入侵爱丽丝的厨房。在第三句话中,爱丽丝直接通过强调“厨房”来表达她的不高兴情绪。

编剧首先在约翰和斯黛拉的“客厅”中创造一段对话,以营造约翰在工作中面临的紧张局势。将地点更改为移动的“汽车”后,约翰变得更加忙碌,他的注意力分散在道路和谈话上,这给他的处境增添了更多的紧张感。因此,约翰的讲话断断续续地较短。在汽车场景中,约翰和斯特拉呈线性排列,约翰专注于驾驶,斯特拉作为乘客。这会产生一种分离感。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/448051.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

oceanbase的日志量太大,撑爆磁盘,修改下日志级别

oceanbase的日志量太大,撑爆磁盘,修改下日志级别: [adminlnpg ~]$ obclient -h127.0.0.1 -uroot -P2881 -plinux123 Welcome to the OceanBase. Commands end with ; or \g. Your OceanBase connection id is 3221561020 Server version: O…

echarts显示隐藏柱状图柱子的背景色

showBackground: true, //控制是否显示背景色backgroundStyle: {// color: rgba(180, 180, 180, 0.4) //背景色的颜色color: red} 关键代码是 showBackground: true, //控制是否显示背景色 设置为false或者直接而不写就是不显示背景色,默认是不显示背景色 true的时…

IO作业代码

问题 通过 fwrite和 fread去拷贝 文件到另外一个文件上 #include<myhead.h> #include <stdio.h> #include <string.h> #include <stdlib.h> #include<errno.h> #include<time.h> int main(int argc, const char *argv[]) { FILE *fp fo…

ES 全文检索完全匹配高亮查询

我们ES会将数据文字进行拆词操作&#xff0c;并将拆解之后的数据保存到倒排索引当中几十使用文字的一部分也能查询到数据&#xff0c;这种检索方式我们就称之为全文检索&#xff0c;ES的查询结果也会倒排索引中去查询匹配 下面的查询结果中输入的词&#xff0c;就是输入小也可…

【量化交易】聚宽安装

安装JQData 更换源&#xff1a; 如果使用的是pip默认的PyPI源&#xff0c;可以尝试更换为一个更快的国内镜像源。例如阿里云、豆瓣等提供的PyPI镜像。 更改方法可以通过设置环境变量或者在pip命令中直接指定&#xff1a; PS C:\Users\bilirjs\Documents> pip config set …

第100+28步 ChatGPT学习:概率校准 Bayesian Calibration

基于Python 3.9版本演示 一、写在前面 最近看了一篇在Lancet子刊《eClinicalMedicine》上发表的机器学习分类的文章&#xff1a;《Development of a novel dementia risk prediction model in the general population: A large, longitudinal, population-based machine-learn…

Qt-窗口对话框相关操作(50)

目录 描述 创建 使用 点击弹出对话框 内存泄漏问题 自定义对话框 纯代码 界面操作 模态和非模态对话框 描述 对话框是 GUI 程序中不可或缺的组成部分。⼀些不适合在主窗⼝实现的功能组件可以设置在对话框中。对话框通常是⼀个顶层窗⼝&#xff0c;出现在程序最上层&am…

2024年腾讯外包面试题(微创公司)

笔试&#xff1a; 1、判断异步执行顺序 console.log(1);setTimeout(()>{Promise.resolve().then(()>{console.log(2);})console.log(3);},0);new Promise ((resolve)>{for(let i0; i<1000;i ){if(i1000){resolve();}}console.log(4);}).then(()>{console.log(5…

高可用之限流 08-leaky bucket漏桶算法

限流系列 开源组件 rate-limit: 限流 高可用之限流-01-入门介绍 高可用之限流-02-如何设计限流框架 高可用之限流-03-Semaphore 信号量做限流 高可用之限流-04-fixed window 固定窗口 高可用之限流-05-slide window 滑动窗口 高可用之限流-06-slide window 滑动窗口 sen…

SCALABLEANDEFFECTIVE IMPLICIT GRAPH NEURALNETWORKS ON LARGEGRAPHS

ICLR24 推荐指数&#xff1a; #paper/⭐⭐ 领域&#xff1a; 大图&#xff0c;图扩展 大概的工作&#xff1a;提出了针对子图的虚拟节点&#xff0c;让所有点都与其相连 相关工作&#xff1a; 传统GNN与Inplicit gnn 传统GNN的传播函数&#xff1a; Z ( l 1 ) ϕ ( W ( …

Karmada核心概念

以下内容为翻译&#xff0c;原文地址 Karmada 是什么&#xff1f; | karmada 一、Karmada核心概念 一&#xff09;什么是Karmada 1、Karmada&#xff1a;开放&#xff0c;多云&#xff0c;多集群Kubernetes业务流程 Karmada (Kubernetes Armada)是一个Kubernetes管理系统&…

【OpenCV】(六)—— 阈值处理

阈值处理&#xff08;Thresholding&#xff09;用于将灰度图像转换为二值图像。通过设定一个或多个阈值&#xff0c;可以将图像中的像素分为不同的类别&#xff0c;通常用于分割前景和背景、简化图像、去除噪声等任务。OpenCV 提供了多种阈值处理方法&#xff0c;下面介绍基本阈…

让AI像人一样思考和使用工具,reAct机制详解

reAct机制详解 reAct是什么reAct的关键要素reAct的思维过程reAct的代码实现查看效果引入依赖&#xff0c;定义模型定义相关工具集合工具创建代理启动测试完整代码 思考 reAct是什么 reAct的核心思想是将**推理&#xff08;Reasoning&#xff09;和行动&#xff08;Acting&…

探索人工智能:深度解析未来科技的核心驱动力

目录 &#x1f354; 人工智能的应用方向 &#x1f354; 人工智能的发展历史 &#x1f354; 人工智能、机器学习、深度学习关系 &#x1f354; 为什么学习机器学习&#xff1f; &#x1f354; 小节 学习目标 &#x1f340; 了解人工智能的应用方向 &#x1f340; 了解人工智…

【千库网-注册安全分析报告】

前言 由于网站注册入口容易被黑客攻击&#xff0c;存在如下安全问题&#xff1a; 暴力破解密码&#xff0c;造成用户信息泄露短信盗刷的安全问题&#xff0c;影响业务及导致用户投诉带来经济损失&#xff0c;尤其是后付费客户&#xff0c;风险巨大&#xff0c;造成亏损无底洞…

iPad备份软件哪个好?好用的苹果备份软件推荐

苹果手机在将数据备份到电脑时&#xff0c;需要通过第三方的管理软件&#xff0c;才可以将手机连接到电脑进行备份。苹果手机备份软件有很多&#xff0c;常用的有&#xff1a;爱思助手、iMazing、iTuns等。那么这三款常用的备份软件究竟哪款更好呢&#xff1f;下面就给大家盘点…

uniapp学习(004-2 组件 Part.2生命周期)

零基础入门uniapp Vue3组合式API版本到咸虾米壁纸项目实战&#xff0c;开发打包微信小程序、抖音小程序、H5、安卓APP客户端等 总时长 23:40:00 共116P 此文章包含第31p-第p35的内容 文章目录 组件生命周期我们主要使用的三种生命周期setup(创建组件时执行)不可以操作dom节点…

Kimi AI助手重大更新:语音通话功能闪亮登场!

Kimi人工智能助手近日发布了一项令人瞩目的重大更新&#xff0c;其中最引人注目的是新增的语音通话功能。这一创新不仅拓展了用户与AI互动的方式&#xff0c;还为学习和工作场景提供了突破性的解决方案。 Ai 智能办公利器 - Ai-321.com 人工智能 - Ai工具集 - 全球热门人工智能…

使用 python 下载 bilibili 视频

本文想要达成的目标为&#xff1a;运行 python 代码之后&#xff0c;在终端输入视频链接&#xff0c;可自动下载高清 1080P 视频并保存到相应文件夹。 具体可分为两大步&#xff1a;首先&#xff0c;使用浏览器开发者工具 F12 获取请求链接相关信息&#xff08;根据 api 接口下…

性能测试持续继承 CICD

目录 一、如何实现性能测试持续继承操作 下载ant 验证ant是否安装成功 二、jmeterant结合 1、我们需要把jmeter中extres 中的ant-jmeter-1.1.1.jar 复制到ant的安装目录中的lib目录中 2、把jmeter中extres中的build.xml 复制到ant的安装目录中的bin目录 3、编辑build.x…