2016年亚太杯APMCM数学建模大赛C题影视评价与定制求解全过程文档及程序

2016年亚太杯APMCM数学建模大赛

C题 影视评价与定制

原题再现

  中华人民共和国成立以来,特别是政治改革和经济开放后,随着国家经济的增长、科技的发展和人民生活水平的提高,中国广播电视媒体取得了显著的成就,并得到了迅速的发展。截至目前,中国广播电视传媒已经为未来产业发展奠定了良好的基础。

  2012年,中国共制作了893部电影,总票房170.73亿元,比上年增长30.18%。其中,中国国产电影票房达到82.73亿元,占全年总票房的48.46%。这是自2003年以来,中国国产电影首次被进口电影击败。2012年2月,中美双方就WTO电影相关问题达成《WTO谅解备忘录》,并决定增加进口电影配额。在最初的20部进口电影配额之外,还将有14部高科技格式的美国电影。票房分账的比例也从之前的17.5%上升到了25%。国内电影市场现在处境不佳。

  美国的文化产业,也就是所谓的版权产业,占GDP的10%,而中国只有不到3%。如今,在中国,一集电视节目的价格可以达到7位数,未来可能达到8位数。这也符合中国的经济发展。富裕经济后对文化和娱乐的需求增加,将推动该行业快速增长,成为未来增长最快的企业之一。

  在“十二五”期间,中国将大力发展影视制作、文化创作、娱乐表演等七大重点文化产业。在此期间,中国影视产业将迎来一个重要的战略机遇期;政府将加大扶持力度,为中国影视业创造良好的营商环境。中国电影奖委员会将在未来5年保持每年500部电影的产量。2014年,中国电影市场票房将突破300亿元,预计观影人数将达到11.12亿,相当接近全国总人口。此外,影院将变得更加多样化;小众电影和艺术电影也将有自己的放映空间。国务院《电影产业繁荣发展促进指导意见》指出,到2015年底,通过改革创新、加大投资、加快发展,我国将建立健全公平的市场竞争、企业自主经营的电影产业经营体系、市场运作、企业管理、,政府采购,以及电影公共服务体系的公共利益。

  当前的中国电视市场竞争激烈,充满了不同的风格和话题。虽然每年的电视剧产量仍然很高,但电视台并没有太多的购买欲望,这导致了电视剧供过于求。据统计,每年有一半以上的电视作品在没有买家的情况下被浪费,造成了巨大的资源浪费。数量从来都不是电视剧的问题,但质量一直是我们需要解决的问题。如何降低成本,摆脱草率粗暴的电视投资,决定着电视剧的未来发展。未来电视剧之间的竞争将是一场质量竞赛。只有保证电视剧的质量,才能获得最大的回报。

  同时,利用2014年的大数据作为测试电视市场的分析工具也取得了相当成功。虽然大数据无法创建脚本,但它可以非常精确地分析数据和预测。这可以应用于剧本编写、电视收视率预测、电视广告结果和电视剧购买。可以降低电视投资风险,提高剧本质量,预测观众反应,以确保最大效益。

  在影视剧市场中,如何对影视剧进行评价和定制等问题一直是一个制作过程中关注的焦点。现在请尝试使用数学建模方法来解决以下问题。

  问题1:根据排名指数对电视剧进行排名,并用附件1和附件2中的数据说出你的前十名。

  问题2:演员的受欢迎程度排名对电视剧的制作可能非常有用。请收集并使用相关数据作为基础,设计一个明星人气指数,并尝试通过givi来证明你的指数的可达性。

import requests
import re
import httplib
import md5
import urllib
import random
import json
def translate(q):appid = '20151113000005349'secretKey = 'osubCEzlGjzvw8qdQc41'httpClient = Nonemyurl = '/api/trans/vip/translate'fromLang = 'zh'toLang = 'en'salt = random.randint(32768, 65536)sign = appid+q+str(salt)+secretKeym1 = md5.new()m1.update(sign)sign = m1.hexdigest()myurl =
myurl+'?appid='+appid+'&q='+urllib.quote(q)+'&from='+fromLang+'&to='+
toLang+'&salt='+str(salt)+'&sign='+sign
try:httpClient = httplib.HTTPConnection('api.fanyi.baidu.com')httpClient.request('GET', myurl)#response HTTPResponseresponse = httpClient.getresponse()return json.loads(response.read())['trans_result'][0]['dst']except Exception, e:print efinally:if httpClient:httpClient.close()
tags =
['love','comedy','city','Suspense''Costume','idol','crime','history',
'war','Martial arts','Police bandit','Science Fiction']
def get_page(tag):url = "http://v.sogou.com/teleplay/list/style-%s+zone-内
地.html"%(tag)con = requests.get(url).textreturn con
def find_vedio(context):# print contextpattern = r'target=\"_blank\">(.*?)<\/a><\/div>'return re.findall(pattern, context)
def get_data(tags):out = []for tag in tags:data = {}vedios = find_vedio(get_page(tag))data[tag] = vediosout.append(data)return out
if __name__ == '__main__':data = get_data(tags)for tag in data:key = tag.keys()[0]# print key
vedios = tag.values()[0]for vedio in vedios:# print data so that can be covertd to csv format.print translate(key)+','+translate(vedio.encode('utf-8'))

整体求解过程概述(摘要)

  明星和戏剧问题基于大数据。为了解决这些问题,从互联网上搜索可靠的数据,过滤掉坏值,确定权重并给出预测具有重要意义。
  首先,关于电视剧排名,我们选择电视剧评分、每部电视剧的评论家数量和电视剧集数量作为前三个重要指标来判断最终排名。为了找出三个指标中最合理的权重,我们使用TOPSIS法来计算最佳权重。最后,当直接计算指标之间的关系不明确时,基于灰色关联度和单层次综合评价给出了剧集的排名。
  其次,我们认为评判明星人气的指标是丰富的、非官方的,因此Apriori算法可以用来过滤不重要的指标,只保留高权重的指标。通过遍历从互联网上收集的多个数据,我们得到了最终的频繁n项集,其中n项集是最重要的索引。然后利用主成分分析法得到相关指标的权重。除此之外,还应考虑特殊情况,例如由花边新闻在短时间内引起的剧烈变化。最后,我们将基于我们的指数的排名与官方网站上的排名进行比较,发现大致相等。
  第三,为了建立一个新的团队来创建新产品,我们可以使用爬虫从互联网上搜索到的数据,如点击率、评论家、主演、制作团队等。为了过滤掉不重要的指标,可以使用逐步回归方法,然后我们可以得到标准化。通过这个等式,每个指数都将对应一个权重,该权重衡量对最终指数的贡献。然后,将导出的排名与官方排名进行比较,以获得可信度,并判断该指数是可接受的。根据最终指标,描述一个理想的生产团队。
  最后,从观众的浏览历史和每个频道的评分中获得最合适的推荐。这里使用LDA算法,找出主要趋势和主要类型的历史。赋值主要取决于历史数据具有不同类型的概率,然后通过余弦计算找到拟合度最高的数据。使用标准化后的数据,我们证明了该模型的可信度高达93.2%。此外,当依赖于评级时,该模型也是可靠的。
  每个模型都经过了来自现实的数据测试,这些数据来自互联网,由Python中的爬虫搜索。

模型假设:

  1) 数据可以正确反映受欢迎程度。没有恶意提高知名度的网络雇佣兵。
  2) 所有以明星或戏剧名字命名的论坛都在谈论这个主题。论坛上有所有相关的帖子
  3) 知名网站的排名没有商业猜测。所有的排名都依赖于现实,而且必须是客观的。
  4) 这些模型具有通用性。因为来自互联网的数据不可能包含所有的明星和剧集。通过计算足够大的数据规模来考虑。衍生出的模型可以适用于所有的明星和戏剧。而且错误太小,无法组织。

问题重述:

  当前的中国电视市场竞争激烈,充满了不同的风格和话题。虽然每年的电视剧产量仍然很高,但电视台并没有太多的购买欲望,这导致了电视剧供过于求。数量从来都不是电视剧的问题,但质量一直是我们需要解决的问题。如何降低成本,摆脱草率粗暴的电视投资,决定着电视剧的未来发展。
  同时,利用2014年的大数据作为测试电视市场的分析工具也取得了相当成功。虽然大数据无法创建脚本,但它可以非常精确地分析数据和预测。这可以应用于剧本编写、电视收视率预测、电视广告结果和电视剧购买。可以降低电视投资风险,提高剧本质量,预测观众反应,以确保最大效益。
  在影视剧市场中,如何对影视剧进行评价和定制等问题一直是一个制作过程中关注的焦点。现在请尝试使用数学建模方法来解决以下问题。
  根据排名指数对电视剧进行排名,并说出你的前十名。
  请收集并使用相关数据作为基础,设计一个明星人气指数,并通过今年的真实例子来证明你的指数的可及性。
  描述一个理想的制作团队,包括制片人和演员。试着用一个真实的例子来证明你的观点。
  通过观看历史和节目收视率,找到最适合观众和每个地方电视台的剧本内容。收集相关数据,使用数学建模方法提供解决方案,并使用真实的例子来证明你的观点。

模型的建立与求解整体论文缩略图

在这里插入图片描述
在这里插入图片描述

全部论文及程序请见下方“ 只会建模 QQ名片” 点击QQ名片即可

程序代码:

部分程序如下:
import requests
import re,json
def get_stars(url):strs = '''<span class="rank_left_name" person-id="529">Liyin 
Zhao</span><span clas'''\'''s="rank_left_value"><b class="rlv_gray">9.0814</b>'''req = requests.get(url).textpattern = r"<span.*?personid=\"\d*?\">(.*?)</span>.*?\">([\d,\.]*?)</b>"out = re.findall(pattern,req)for i in out:print i[0] + "," + i[1] # print stars so that wo can covert 
the file to a csv format.return out # return the list of stars.
def get_rank():url_1 = "http://www.xunyee.cn/rank-person-index-3.html"get_stars(url_1)length = []for i in range(2,35):url_2 = "http://www.xunyee.cn/rank-person-index-3-
page-%d.html"%(i)length.append(get_stars(url_2))return length
# the stars list
stars = [u'Zhao Liying', u'Li Yifeng', u'Lay', u'Yang Zi', u'Ma 
Tianyu', u'Yang Yang', u'Hu Ge', u'William Chan',u'Liu Tao', u'Yang Mi', u'Victoria', u'Zheng Shuang', u'Wang 
Kai', u'Tang Yan', u'Ruby Lin', u'Liu Shishi',u'Guan Xiaotong', u'Wang Ziwen', u'Wallace Huo', u'Zhang Yishan',
u'Zhangruoyun', u"Zhang Tian'ai", u'Di Ali Gerba',u'Joker', u'Cheney Chen', u'Fan Bingbing', u'Maggie Jiang',
u'Zhang Han', u'Joe Chen', u'Gulnazar', u'Honglei Sun',
u'Jiang Xin', u'Wu Lei', u'Zhang Meng', u'Hawick Lau', u'Mark', u'Qin 
Junjie', u'Juen-Kai Wang', u'Angela Baby', u'Tansongyun', u'Chenhe', u'Liu Yifei', u'YoonA', u'Song Joong 
Ki', u'Yuan Wang', u'Tangyixin', u'Wu You', u'William Feng',u'Jiangjinfu', u'Through', u'Jin Dong', u'Liuhaoran', u'Li 
Zhongshuo', u'Dongyu Zhou', u'Jackson Yi', u'Zhong Hanliang',u'Kan Kiyoko', u'Deng Chao', u'Luyi Zhang', u'Li Chen', u'Sun 
Li', u'Guo Degang', u'Liu Yan', u'Lu Yi', u'Huang Lei',u'Zhangmingen', u'Luhan', u'Ju Jingyi', u'Cheng Yi', u'Ji Chang 
Wook', u'Xiaozhan', u'Zheng Kai', u'Mao Zijun',u'Huang Xiaoming', u'Yu Hewei', u'Hai Qing', u'Luo Jin', u'Qi 
Wei', u'Huang Bo', u'Li Qin', u'Wu Xiubo',u'Xinyi Zhang', u'Qing Jia', u'Huang Haibing', u'Yuan Shanshan',
u'Jia Nailiang', u'Du Chun', u'Cary Woodworth',u'Zu Feng', u'Baishu', u'Qiao xin2', u'Zhao Wei', u'Liyan Tong',
u'Yuan Hong', u'Chen Xiao', u'Maoxiaotong',u'Qiao Zhenyu', u'Ady Ann', u'Gao Yuanyuan', u'Yang Shuo', u'Chen 
Xiang', u'Zheng Yin', u'Hye gyo Song', u'Nicky Wu',u'Wujiacheng', u'Chen yao1', u'Lee Jun-ki', u'Xiao Che', u'Zhang 
Yi', u'Huyunhao', u'Joe Cheng', u'Gilbert air',u'Baoqiang Wang', u'Janine Chang', u'Jin Chen', u'For the',
u'Eddie Peng', u'Sheenah', u'Hongchen', u'Wang Ou',u'Faye Yu', u'Sun Yi Chau', u'Pets Ceng', u'Fuchengpeng', u'Jing 
Bairan', u'Qiao Renliang', u'Show Luo', u'Wu Jing',u'Zhe Han Zhang', u'Handongjun', u'Liyitong', u'Alec Su',
u'Loura', u'Zhang Danfeng', u'Yan Ni', u'krystal',u'The white buildings', u'Guozifan', u'Houmengsha', u'Louis Koo',
u'Hubingqing', u'Park Shin Hye', u'Andy',u'Jimmy Lin', u'Pengchuyue', u'Rong Yang', u'Zifeng Zhhang',
u'Shuyaxin', u'Zhang Xinyu', u'Kris', u'Yangle',u'Yuanbingyan', u'Zhu Yawen', u'Maidina', u'Zhangxueying', u'Ng 
Cheuk Hai', u'Kelsey', u'Kyle Cui', u'Xuhaiqiao',u'Happy', u'Qian Wu', u'Jay Chou', u'Wang Xiaochen', u'Li 
Xiaoran', u'Liu Ye', u'Zhao Lei', u'Xu Doudou', u'Jiro Wang',u'Yanzidong', u'Ouyang Nana', u'Gao Yixiang', u'Benny Chan',
u'Song Jia', u'Jordan Chan', u'Bea Hayden', u'Michelle Chen',u'Yan Yi wide', u'Stephen Chow', u'Alyssa Chia', u'Ying Er',
u'Raymond Lam', u'Bosco Wong', u'Xiong Naijin', u'Hu Bing',u'Bing Shao', u'Angela Chang', u'Anita Yuen', u'Baijingting',
u'Vincent Chiao', u'Gillian Chung', u'JJ Lin', u'iu', u'Xu',u'Kenny', u'Charmaine Sheh', u'Angie Chiu', u'Tsung-Han Lee',
u'Kim Su Hyon', u'Zihan Chen', u'Yu-chi Chen', u'Ariel Lin',
u'Wang Yuexin', u'Du Haitao', u'Jiangzile', u'Chenruoxuan', u'Ma 
Sichun', u'Pubaojian', u'Niujunfeng', u'Peter Ho',u'Gujiacheng',
]
def getFansAndPosts():pattern = r"<span 
class=\"card_menNum\">([\d,\,]*?)</span>[\w\W]*?<span 
class=\"card_infoNum\">([\d,\,]*?)</span>"for i in stars:url = "http://tieba.baidu.com/f?kw=%s"%(i)# print urlreq = requests.get(url).textresult = re.findall(pattern,req)[0]# print results so that wo can covert the file to a csv 
format.print result[0].replace(',','')+','+result[1].replace(',','')
def calc(ll):out = 0;for i in ll:out += int(i)return out/len(ll)
def getIndexAndMedia():for i in stars:try:get_media_url =
"http://index.so.com/index.php?a=soMediaJson&q=%s"%imedia =
json.loads(requests.get(get_media_url).text)['data']['media'].values(
)[0].split('|')[-300:-1]get_index_url =
"http://index.so.com/index.php?a=soIndexJson&q=%s"%iindex =
json.loads(requests.get(get_index_url).text)['data']['index'].values(
)[0].split('|')[-300:-1]# calculate the average num of Media Focusavg_media = calc(media)# calculate the average num of Index.
avg_index = calc(index)# print stars so that wo can covert the file to a csv format.print str(avg_index) + "," + str(avg_media)except Exception,e:print iexit(0)
if __name__ == '__main__':getIndexAndMedia()
全部论文及程序请见下方“ 只会建模 QQ名片” 点击QQ名片即可

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/171046.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JVM虚拟机:对象在内存中的存储布局

本文重点 在前面的过程中,我们学习了对象创建过程,那么一个对象在内存中的布局是什么样的呢? 对象在内存中的存储布局 普通对象 当我们创建一个对象的时候,它由三部分组成,分别为对象头(MarkWord+class指针(指向class对象)),实例数据(对象的成员变量),填充。如果…

特殊类设计[下] --- 单例模式

文章目录 5.只能创建一个对象的类5.1设计模式[2.5 万字详解&#xff1a;23 种设计模式](https://zhuanlan.zhihu.com/p/433152245)5.2单例模式1.饿汉模式1.懒汉模式 6.饿汉模式7.懒汉模式7.1饿汉模式优缺点:7.2懒汉模式1.线程安全问题2.单例对象的析构问题 8.整体代码9.C11后可…

react-组件间的通讯

一、父传子 父组件在使用子组件时&#xff0c;提供要传递的数据子组件通过props接收数据 class Parent extends React.Component {render() {return (<div><div>我是父组件</div><Child name"张" age{16} /></div>)} }const Child …

【洛谷 P3654】First Step (ファーストステップ) 题解(模拟+循环枚举)

First Step (ファーストステップ) 题目背景 知らないことばかりなにもかもが&#xff08;どうしたらいいの&#xff1f;&#xff09; 一切的一切 尽是充满了未知数&#xff08;该如何是好&#xff09; それでも期待で足が軽いよ&#xff08;ジャンプだ&#xff01;&#xff09…

华为---DHCP中继代理简介及示例配置

DHCP中继代理简介 IP动态获取过程中&#xff0c;客户端&#xff08;DHCP Client&#xff09;总是以广播&#xff08;广播帧及广播IP报文&#xff09;方式来发送DHCPDISCOVER和DHCPREQUEST消息的。如果服务器&#xff08;DHCP Server&#xff09;和 客户端不在同一个二层网络(二…

人工智能:CNN(卷积神经网络)、RNN(循环神经网络)、DNN(深度神经网络)的知识梳理

卷积神经网络&#xff08;CNN&#xff09; 卷积神经网络&#xff08;CNN&#xff09;&#xff0c;也被称为ConvNets或Convolutional Neural Networks&#xff0c;是一种深度学习神经网络架构&#xff0c;主要用于处理和分析具有网格状结构的数据&#xff0c;特别是图像和视频数…

VSCode 开发 Vue 语法提示

一. 打开应用商店&#xff0c;搜索 vetur &#xff0c;选择第一个&#xff0c;点击安装。 二. 安装完成后&#xff0c;还可以下载 Vue Language Features 解决代码警告的问题。 最后重启 VSCode 就可以使用啦。另外输入 按回车键还可以自动生成 vue 代码格式哦。 原创作者&…

原生mysql与mybatis执行update语句的差异

在做一个解除绑定的接口中&#xff0c;发现了这个一个问题&#xff1a; 连续对接口进行测试&#xff0c;发现一直fan返回解除成功&#xff0c;但是逻辑上应该是解除之后&#xff0c;在解除它后就应该回显已解除绑定才对 就一直找原因&#xff0c;sql中使用的是mybatis的…

【Qt之QtConcurrent】描述及使用

描述 QtConcurrent是一个Qt库中的模块&#xff0c;用于实现多线程并发编程。它提供了一些高级API&#xff0c;使得在多核处理器上并行执行代码变得更加容易。 示例&#xff1a; 使用的话&#xff0c; 需要在pro文件中添加&#xff1a;QT concurrent模块。 #include <QC…

基于机器视觉的车道线检测 计算机竞赛

文章目录 1 前言2 先上成果3 车道线4 问题抽象(建立模型)5 帧掩码(Frame Mask)6 车道检测的图像预处理7 图像阈值化8 霍夫线变换9 实现车道检测9.1 帧掩码创建9.2 图像预处理9.2.1 图像阈值化9.2.2 霍夫线变换 最后 1 前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分…

Virtual DOM

目录 Virtual DOM 前言 用法 代码 理解 Virtual DOM的工作原理&#xff1a; 为什么使用Virtual DOM? 哪些库/框架使用Virtual DOM? 总结 Virtual DOM&#xff08;虚拟DOM&#xff09;是一种编程概念&#xff0c;它是对真实DOM的轻量级抽象表示。在前端开发中&#x…

RHCE8 资料整理(四)

RHCE8 资料整理 第四篇 存储管理第13章 硬盘管理13.1 对磁盘进行分区13.2 交换分区&#xff08;swap分区&#xff09; 第14章 文件系统14.1 了解文件系统14.2 了解硬链接14.3 创建文件系统14.4 挂载文件系统14.5 设置永久挂载14.6 查找文件14.7 find的用法 第15章 逻辑卷管理15…

Go基础——数组、切片、集合

目录 1、数组2、切片3、集合4、范围&#xff08;range&#xff09; 1、数组 数组是具有相同唯一类型的一组已编号且长度固定的数据项序列&#xff0c;这种类型可以是任意的原始类型例如整型、字符串或者自定义类型。 Go 语言数组声明需要指定元素类型及元素个数&#xff0c;与…

基于图像识别的跌倒检测算法 计算机竞赛

前言 &#x1f525; 优质竞赛项目系列&#xff0c;今天要分享的是 基于图像识别的跌倒检测算法 该项目较为新颖&#xff0c;适合作为竞赛课题方向&#xff0c;学长非常推荐&#xff01; &#x1f9ff; 更多资料, 项目分享&#xff1a; https://gitee.com/dancheng-senior/…

GO语言代码示例

首先&#xff0c;我们需要安装 rod 库&#xff0c;这是一个用于构建网络爬虫的 Go 语言库。 使用 go get 命令安装 rod 库&#xff1a;go get -u github.com/gofiber/rod 创建一个新的 Go 程序文件&#xff0c;例如&#xff1a;main.go 在 main.go 文件中&#xff0c;导入 r…

c++系列之vector类模拟实现

&#x1f497; &#x1f497; 博客:小怡同学 &#x1f497; &#x1f497; 个人简介:编程小萌新 &#x1f497; &#x1f497; 如果博客对大家有用的话&#xff0c;请点赞关注再收藏 &#x1f31e; 构造函数 vector() //_begin表示有效成员的开始 //_finish表示有效成员的大小…

配置Sentinel 控制台

1.遇到的问题 服务网关 | RuoYi 最近调试若依的微服务版本需要用到Sentinel这个组件&#xff0c;若依内部继承了这个组件连上即用。 Sentinel是阿里巴巴开源的限流器熔断器&#xff0c;并且带有可视化操作界面。 在日常开发中&#xff0c;限流功能时常被使用&#xff0c;用…

力扣:142. 环形链表 II(Python3)

题目&#xff1a; 给定一个链表的头节点 head &#xff0c;返回链表开始入环的第一个节点。 如果链表无环&#xff0c;则返回 null。 如果链表中有某个节点&#xff0c;可以通过连续跟踪 next 指针再次到达&#xff0c;则链表中存在环。 为了表示给定链表中的环&#xff0c;评…

第13期 | GPTSecurity周报

GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区&#xff0c;集成了生成预训练 Transformer&#xff08;GPT&#xff09;、人工智能生成内容&#xff08;AIGC&#xff09;以及大型语言模型&#xff08;LLM&#xff09;等安全领域应用的知识。在这里&#xff0c;您可以…

k8s 金丝雀发布与声明式管理

Deployment控制器支持自定义控制更新过程中的滚动节奏&#xff0c;如“暂停(pause)”或“继续(resume)”更新操作。比如等待第一批新的Pod资源创建完成后立即暂停更新过程&#xff0c;此时&#xff0c;仅存在一部分新版本的应用&#xff0c;主体部分还是旧的版本。然后&#xf…