从B站 (哔哩哔哩) 泄露的源码里发现了B站视频推荐的秘密

这两天闲来无事,回顾了一下年前B站沸沸扬扬的代码泄露事件,大致翻阅了一些泄露的代码发现了一些有意思的事情,其中就包括 B站视频推荐 加权部分算法 的相关代码。

不过后期 B站官方辟谣说是老版本代码,并且已经进行相应的防御措施,但是后端大体的架构还是不会变化太多,所以就仁者见仁智者见智了,仅供吃瓜参考。

姊妹篇:   B站 (哔哩哔哩) 泄露源码中的有趣片段(彩蛋)

 

首先回顾一下B站源码泄露事件始末

北京时间 2019年4月22日下午16点左右,一个名叫“openbilibili”的用户在Github上创建了“go-common”代码库,而那显然就是B站网站后台工程源码。B站在技术圈炸锅,其后端源码被恶意“开源”,被上传至 GitHub 供全球用户下载。

通俗一点来解释,这就好像是有人把你家的房子图纸发在了微博上,门在哪锁在哪甚至钥匙在哪都标得一清二楚。虽然单凭这个还不至于让所有人都能进你家门,但其实也足够头疼了。

结果就是截至北京时间17:04,该项目已获得6597个标星。fork数量已经突破6000(这个操作会将被Fork的代码仓库中所有的信息,包括源代码、原仓库中的issus、历史提交等全部复制到你的账号中),issues已经成了弹幕,场面已经失控。

最终B站官方也是就此做出了 “回应”,这一代码库已被GitHub「封杀」,微博上已经看不到此事的踪影,知乎上关于该事件的话题也基本被删。

不过总的来说次此泄露对B站的影响也是不可估量的,也是导致了B站股价直接下跌4%.

 

有关B站的推荐和加权算法

抱着吃瓜的心理在翻看后台代码时,发现了这么一段代码,注意上面的注释。

//countArcHot 视频=硬币*0.4+收藏*0.3+弹幕*0.4+评论*0.4+播放*0.25+点赞*0.4+分享*0.6 最新视频(一天内发布)提权[总值*1.5]
func countArcHot(t *api.Stat, ptime int64) int64 {if t == nil {return 0}hot := float64(t.Coin)*0.4 +float64(t.Fav)*0.3 +float64(t.Danmaku)*0.4 +float64(t.Reply)*0.4 +float64(t.View)*0.25 +float64(t.Like)*0.4 +float64(t.Share)*0.6if ptime >= time.Now().AddDate(0, 0, -1).Unix() && ptime <= time.Now().Unix() {hot *= 1.5}return int64(math.Floor(hot))
}// countArtHot 专栏=硬币*0.4+收藏*0.3+评论*0.4+阅读*0.25+点赞*0.4+分享*0.6 最新专栏(一天内发布)提权[总值*1.5]
func countArtHot(t *model.Meta) int64 {if t.Stats == nil {return 0}hot := float64(t.Stats.Coin)*0.4 +float64(t.Stats.Favorite)*0.3 +float64(t.Stats.Reply)*0.4 +float64(t.Stats.View)*0.25 +float64(t.Stats.Like)*0.4 +float64(t.Stats.Share)*0.6if int64(t.PublishTime) >= time.Now().AddDate(0, 0, -1).Unix() && int64(t.PublishTime) <= time.Now().Unix() {hot *= 1.5}return int64(math.Floor(hot))
}

接下来就是对这段代码的解读:

首先像大多数的推荐算法一样,小破站的视频推荐也是通过对各项数据进行加权求得视频权重然后在进行再区分,提高视频出现概率;

我们能帮助提高视频在哪些地方的出现概率呢?
① b站『搜索』时出现的默认结果页面
② 对该视频话题感兴趣的其他用户的首页
③ 任何会有推荐视频的地方,比如用户看完一个视频后网站自动推荐一组视频

其中影响权重的主要是以下因素:

视频是: 硬币、收藏、弹幕、评论、播放量、点赞数、分享数、更新时间。

专栏文章是:硬币、收藏、评论、阅读量、点赞数、分享数、更新时间。

总结:

  • 视频多了一个弹幕加成。
  • 在2个内容里,分享都占到了最高权重,有0.6,这个可以理解,大部分平台都是分享权重无限高。
  • 播放量和阅读量真的是弟弟,两边都是最低权重,不过相比评论这些二次互动,权重低可以理解。
  • 评论比收藏的权重要高,这个有点特殊。因为不少平台是收藏权重大于评论的。为什么呢?因为一般来说,很多人看见内容都会评论,但是只有感觉特别好的内容,才会收藏。

收藏权重高,意味着重视内容质量,更重视大家觉得好的干货。

评论权重高,则意味着注重互动,更重视能吸引大家讨论的内容。

目前B站在代码上的思路来看,更重视能引发讨论热议的内容。

 

那么对于我们来说这段代码有什么实际意义呢?

在如今的流量时代,高曝光就意味着能有更多的人看到,从而转化为 高流量、高粉丝,高收益

如果你是UP主 : 

那么想要提高自己视频/文章的曝光度,尽可能增加 分享,评论,弹幕的数量 会是更有效的方法,而去刷播放量则意义不大(这样就很好的解释了为什么有些UP老是骗弹幕 ~)

如果你是用户 :   

点赞、硬币、阅读量 可能更多的影响的是你所看UP的收益,想要为喜欢的UP增加曝光不如多刷几条弹幕和评论

如何搞定自己的首页推荐内容  ——— 对视频点击不感兴趣能极大的减少相关话题的权重。

首页看到不感兴趣的视频,首页视频缩略图下面右边按钮点击,选择不感兴趣,调教一段时间就好了。

 

如果有什么要补充的,欢迎下方👇评论区留言

1份赞许 = 100分的认可,如果感觉还不错,点个赞👍 支持一下吧 ~

不定期分享 有趣、有料、有营养内容,欢迎 订阅关注 👌 我的博客 ,期待在这里与你相遇 ~

好文推荐:   20秒 一键配置 VSCode (Visual Studio Code) C/C++开发环境 !

                     一道微软面试题引出的 int与unsigned隐式转换问题

                     Facebook前身 哈佛“选美”网站Facemash核心算法 --- ELO等级分制度(附源码)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/67747.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

哔哩哔哩用户需求分析报告

先说总结与建议 根据需求优先级列表排序和用户需求程度排序&#xff0c;基于对目标群体的认知和日常使用&#xff0c;总结出以下几点优化建议&#xff1a; 内容方面 加强内容审查&#xff0c;同时加快内容审核。针对UP主上传的视频内容&#xff0c;可提供用户评分功能&#…

国足晋级12强 | 爬取《NBA30支球队》“现役球员信息”,再来看看篮球吧!

我爸对篮球真可是相当钟爱&#xff0c;基本是每个赛季必追。我就不同了&#xff0c;自从高中毕业后&#xff0c;就再也没怎么看篮球了。于是&#xff0c;我就有感而发&#xff0c;是否可以爬取现役球员的一些信息&#xff0c;看看我还有几个认识的。 1. 页面分析 我爬取的页…

“元宇宙”是什么?涂子沛:人可在数据空间“复活”

点击上方“程序猿技术大咖”&#xff0c;关注并选择“设为星标” 回复“加群”获取入群讨论资格&#xff01; 来源&#xff1a;https://view.inews.qq.com/a/20211204A047MY00 “最近热火的‘元宇宙’&#xff0c;其实是在原有的空间中增加了数据空间&#xff0c;在这个数据空间…

计算机学院篮球赛,“新生杯”,篮球热火——记重庆大学计算机学院小组篮球赛第五场...

2016年11月3日中午12点40分&#xff0c;梅园篮球场&#xff0c;等待着与计算机学院少年的篮球之约&#xff0c;阳光正好&#xff0c;少年风华正茂。 参与篮球赛第五场的共有两组比赛。第一组是16级物联VS16级计科6班&#xff0c;由15级计科1班的洪浩和16级计科3班的李润南担任裁…

云中,雁门关外

大同&#xff0c;塞外&#xff0c;黄土高坡&#xff0c;云中。 晋剧、北路梆子、耍孩、数来宝&#xff0c;汇聚一堂。 这里是贾樟柯的英雄地&#xff1a;《任逍遥》《江湖儿女》皆出于此地。这里的男人说话爱拍肩膀拍胸脯拍大腿。 大同的天气四季分明&#xff0c;常年少雨&…

热火赛前获专家一致看好 凯尔特人难再入总决赛

资料图&#xff1a;詹姆斯在场上仍然势不可挡。中新社发 张炜 摄 中新网5月28日 随着凯尔特人在抢七中大胜费城76人&#xff0c;NBA东部决赛的对阵双方也已尘埃落定。对此&#xff0c;ESPN邀请了14位篮球专家对东区决赛的前景进行了预测。结果显示&#xff0c;迈阿密热火的支持…

最近抖音热火的华为太空人手表,附源码下载

一、效果展示 用javascript写的一个太空人表盘。源码请从文章末尾获取下载 原文地址&#xff1a;https://blog.csdn.net/weixin_43532890/article/details/115047940 源码下载&#xff1a;https://pan.baidu.com/s/1SFOFQCIW1Jn9J5u0HjTQKg 密码: 5mv9

猜想:企业SaaS热火之后……

企业SaaS目前热火涌动&#xff0c;尤其在云计算、大数据、移动应用、互联网金融等新概念簇拥下&#xff0c;创业者、投资者、客户似乎对于这一并不很新的概念追捧度大幅提升。 那企业SaaS未来将会怎样&#xff0c;试着做些猜想。 从碎片化到集成 现在的企业SaaS业务基本都是从某…

AI数据标注工具Doccano

Doccano是一款开源的标注工具&#xff0c;用于自然语言处理和机器学习任务。它提供了用户友好的界面&#xff0c;使用户能够轻松地标注文本、序列标注、文本分类和文本配对等任务。doccano支持多种标注格式&#xff0c;并且可以方便地与其他机器学习工具集成。它的简单性和灵活…

人工智能会率先发现外星生命吗?

重要提示 亲爱的读者朋友&#xff0c;微信又改版啦&#xff01;如果没有加星标&#xff0c;或者不常读我们的文章&#xff0c;我们的文章就不会在您的“订阅号消息”里大图展示&#xff0c;甚至不被推送&#xff0c;太容易错过了。ಥ_ಥ 请星标Nature Portfolio&#xff0c;常读…

chatgpt赋能python:Python界面的黑色设置

Python界面的黑色设置 Python是一种高级编程语言&#xff0c;广泛应用于各种领域。然而&#xff0c;许多人在使用Python编写代码时&#xff0c;可能会对其默认的白色界面颜色感到厌烦。本文将介绍如何将Python界面设置为黑色&#xff0c;以提高编程体验。 为什么要将Python界…

在latex中使用GB/T 7714—2015参考文献著录规则

毕业论文中的参考文献要求参照《文后参考文献著录规则》(GB/T 7714&#xff0d;2005)的要求书写&#xff1a; http://www.cessp.org.cn/uploads/1/file/public/201607/20160708142456_8mqgu0dpgk.pdf 我直接使用的是 gbt7714 package&#xff0c; GitHub 链接&#xff1a; ht…

Latex-bibliographystyle参考文献风格介绍(按照姓氏排序)

https://jingyan.baidu.com/article/574c52196e12496c8d9dc1c5.html&#xff08;百度知道&#xff09; https://www.jianshu.com/p/2e18415cfa72&#xff08;这里有更详细资料&#xff09; LaTeX 参考文献标准选项及其样式共有以下8种&#xff1a; plain&#xff0c;按字母的…

Amazon SageMaker简直就是机器学习平台的天花板

一、前言 最近参与了亚马逊云科技【云上探索实验】活动&#xff0c;通过Amazon SageMaker基于Stable Diffusion模型&#xff0c;非常简单快速搭建的第一个AIGC&#xff0c;一开始以为非常复杂&#xff0c;不懂动手操作&#xff0c;但实际上操作非常简单&#xff0c;没有想象中…

smardaten简直是无代码软件开发的天花板

目录 前言 一、smardaten简单介绍 二、基于smardaten创建应用 1、创建一个炫酷的大屏 2、创建一个web端和移动端共存的应用 三、smardaten功能特性和优势 1、操作简单&#xff0c;快速上手 2、圆桌开发&#xff0c;效率倍升 3、图形编排&#xff0c;拖拽生效 4、低无代…

A股市场全景分析系列—指数已企稳,挖掘板块机会

近期&#xff0c;各大指数逐步企稳&#xff0c;震荡中进入到平台位置。这个时候风险释放差不多了&#xff0c;我们可以用全景分析工具观察下后续哪些板块可以布局。 这轮下跌调整从23年1月30日开始算起至今&#xff0c;板块间的涨跌幅度有很大的差别。 概念板块中&#xff0c;比…

群聊!AI时代,人类的终极欲望到底是什么?从《阿凡达2》找到一个答案!

昨天半夜&#xff0c;我在梦里想通了人类的终极欲望。准确点&#xff0c;应该只是终极欲望之一&#xff1a;长生不老&#xff01;&#xff01;&#xff01; 这个答案&#xff0c;是我看了《阿凡达2》电影后得来的。大家有看吗&#xff1f; 有一个情节&#xff0c;人类捕杀图鲲&…

从业余项目到全世界最受欢迎的编程语言之一,Rust 是如何做到的?

【CSDN 编者按】从日常生活中发现电梯软件的系统崩溃&#xff0c;到将一个业余项目发展成为最受开发者喜爱的编程语言&#xff0c;这是全球开发者Graydon Hoare与Rust的一段奇妙故事。 原文链接&#xff1a;https://www.technologyreview.com/2023/02/14/1067869/rust-worlds-f…

4月24日大模型日报合集(持续更新)

熔岩羊驼LLaVA来了&#xff1a;像GPT-4一样可以看图聊天&#xff0c;无需邀请码&#xff0c;在线可玩 链接&#xff1a;https://news.miracleplus.com/share_link/7263 该模型展示出了一些接近多模态 GPT-4 的图文理解能力&#xff1a;相对于 GPT-4 获得了 85.1% 的相对得分。…

Visual Studio Code 和 GitHub Copilot

翻译自 Chris Dias 的博客 AI 这个话题&#xff0c;近期我们看到它被大家广泛地谈论&#xff0c;有些人很兴奋&#xff0c;也有些人表达了担忧。进步几乎每天都在发生&#xff0c;速度前所未有。每天有超过一百万的 Copilot 用户&#xff0c;如果你有机会尝试&#xff0c;你可…