LSTM模型实战案例:TensorFlow实现预测3位彩票号码

640?wx_fmt=gif

向AI转型的程序员都关注了这个号👇👇👇

大数据挖掘DT机器学习  公众号: datayx

使用人工智能技术来预测彩票,是这次的主题,那么预测哪种彩票呢?我们先选择简单一些的,就是排列组合少一些的,如果证明我们的模型work,再扩展到其他的彩票上。最终我选择了排列三, 从000-999的数字中选取1个3位数,一共有1000种,中奖概率就是千分之一,够简单了吧。 

完整代码、 数据集

关注微信公众号 datayx  然后回复 彩票 即可获取。

数据是按照每期一组数的顺序排列的,从第一期到最新的一期,实际上是时间序列的数据。跟回归预测有很大的区别,因为特征上没有特殊的意义,不具备一组特征x映射到label y的条件。但是按照时间序列来训练的话就不一样了,输入x是一期的开奖结果,要学习的y是下一期的开奖结果。

LSTM介绍

我们需要从过往的历史数据中寻找规律,LSTM再适合不过了。如果你对LSTM不熟悉的话,以下几篇文章建议你阅读: 

http://colah.github.io/posts/2015-08-Understanding-LSTMs/

[译] 理解 LSTM 网络

 http://www.jianshu.com/p/9dc9f41f0b29

RNN以及LSTM的介绍和公式梳理

http://blog.csdn.net/Dark_Scope/article/details/47056361


看看数据集的结构

640?wx_fmt=png

一共4656条记录,4600多期了。共出现了988个不重复的结果,就是说还有(1000 – 988)12组数到现在还没有开出来过。文件中第一行是最新的一期,第二行是之前的一期,。。。,最后一行是第一期。 

预测网络介绍

网络的输入是每一期的开奖结果,总共有1000组数,用one hot编码是一个1000维的稀疏向量:

640?wx_fmt=png

网络训练的代码,使用了几个trick,在下文<构建计算图>和<训练>章节会做说明,<结论>在最后。

实现数据预处理

首先要做的事是对数据进行预处理,要实现下面的函数: 

使用词向量之前,我们需要先准备好单词(彩票开奖记录)和ID之间的转换关系。在这个函数中,创建并返回两个字典:

  • 单词到ID的转换字典: vocab_to_int

  • ID到单词的转换字典: int_to_vocab

640?wx_fmt=png

构建计算图

使用实现的神经网络构建计算图。 

640?wx_fmt=png

训练

在预处理过的数据上训练神经网络。

  • Top K准确率: 预测结果中,前K个结果的预测准确率。

  • 与预测结果距离最近的Top K准确率: 先得到预测结果,使用嵌入矩阵计算与预测结果Top 1距离最近的相似度向量,取这个相似度向量中前K个结果的预测准确率。

  • 浮动距离中位数范围K准确率:得到预测结果之后,计算正确结果在预测结果中的距离中位数,这个距离实际上是元素在向量中的位置与第一个元素位置的距离。这个距离数据告诉我们真正的结果在我们的预测向量中的位置在哪。每次训练之后,距离中位数都会有变化,所以是浮动的,当然也可以考虑使用众数或均值。使用中位数表示真正的结果通常会在我们的预测向量中大部分时候(平均、或者说更具代表性的)位置在哪。所以这个准确率就是以中位数为中心,范围K为半径预测准确的概率。

这里距离中位数准确率我分别在预测结果向量和与预测结果Top 1距离最近的相似度向量中都做了统计,从结果来看在相似度向量中的距离中位数准确率要稍好一些。 

640?wx_fmt=png

最后一次迭代输出的结果:

640?wx_fmt=png

640?wx_fmt=png

实现生成预测函数

选择号码

实现 pick_word() 函数从概率向量 probabilities或相似度向量sim中选择号码。

  • sim:从相似度向量Top K中选号。

  • median:从浮动距离中位数(相似度向量)Range K中选号。

  • topk:从概率向量Top K中选号。

  • max:从概率向量中选择最大概率的号码。

640?wx_fmt=png

结论

先从数据上说,训练的最后打印出的准确率如下:

Epoch 24 floating median sim range k accuracy 0.0325Epoch 24 floating median range k accuracy 0.01125Epoch 24 similar top k accuracy 0.0275Epoch 24 top k accuracy 0.025Epoch 24 accuracy 0.0

正常的开奖概率是1‰。

新的思路

既然不能准确的预测,唯一能给我们提供思路的就是学习器学到的趋势,来看看下面的代码。

  • int_sentences:里面保存着上面生成的若干期号码

  • val_data:是最新几期的开奖号码,作为validate数据集

640?wx_fmt=png

看得出来,虽然每期预测的号码不对,但是下一期号码的大概范围以及若干期号码的变化趋势学习的还可以,剩下的就要靠运气了:) 

https://blog.csdn.net/chengcheng1394/article/details/78756522


阅读过本文的人还看了以下:

不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

640?wx_fmt=jpeg

长按图片,识别二维码,点关注

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/19194.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

从风靡全球到风口,Tiktok是如何做到的?

大家好&#xff0c;我是瑞卡迪电子商务。我们是从2019年下半年就注意到了TikTok的风口&#xff0c;并在2020年初&#xff0c;团队就开始投入TikTok的运营及商业变现。从2019年起&#xff0c;围绕TikTok一系列的产品功能迭代和商业模式开放的声音一直不绝于耳&#xff0c;直至今…

tiktok海外版某音,分析协议构造,我们浅谈一下

大家好&#xff0c;我叫任雪飘&#xff0c;今天带大家一起学习一下海外版本的D音,这个大家不陌生吧。 在这之前先强调一下我们中国的网络安全法&#xff0c;一定要准时法理法规。 wss是WebSocket协议的一种通信协议的缩写。wss 和wss不同的是一个采用加密&#xff0c;一个直接…

如何了解(海外抖音TiKToK)与国内抖音的区别以及介绍

一、海外抖音TK平台的优势 自从抖音在中国大受欢迎后&#xff0c;海外也推出了海外版抖音TK平台。尽管两者都是视频分享平台&#xff0c;但它们在一些方面具有明显的区别和独特的优势。下面将详细介绍海外抖音TK平台的优势以及与国内抖音的区别性。 优势&#xff1a; 1. 多元…

常见的TikTok变现方式,你知道几种?

在众多的海外社交媒体中&#xff0c;TikTok以其极具特色的娱乐化短视频&#xff0c;吸引了庞大的用户群体。目前TikTok仍处于发展阶段&#xff0c;竞争压力小、营销效果显著&#xff0c;属于变现的红利期。那么常见的TikTok变现方式&#xff0c;你知道几种呢&#xff1f; 变现方…

跨境人看过来:为什么要使用 TikTok 进行 B2B 营销

每个月&#xff0c;8000 万人平均在 TikTok 上花费 24 小时。这一新机遇彻底改变了 B2C 品牌与客户互动的方式。用于 B2B 营销的 TikTok 能否释放同样的潜力&#xff1f; 相当多的品牌正试图自己回答这个问题。并非所有 B2B 公司都可以利用这些即时#TikTokMadeMeBuyIt B2C 转换…

如何利用ChatGPT打造热门TikTok内容?

TikTok已经成为了全球最流行的短视频平台之一&#xff0c;它每天都有数百万的用户发布和观看视频。 但是&#xff0c;如何在这个平台上发布有吸引力的内容&#xff0c;并吸引更多的粉丝&#xff1f;答案是利用ChatGPT。 ChatGPT是一种基于人工智能的语言模型&#xff0c;可以生…

别等ChatGPT开源了,升级版OPT开源模型来了!

源&#xff5c;新智元 编&#xff5c;Joey 昕朋 今年五月&#xff0c;MetaAI官宣发布了基于1750亿参数的超大模型OPT-175B&#xff0c;还对所有社区免费开放。 12月22日&#xff0c;该模型的更新版本OPT-IML&#xff08;Open Pre-trained Transformer&#xff09;正式上线&…

微软发布「升级版」多模态大模型 Kosmos-2!新增局部理解能力,解锁实体级交互

夕小瑶科技说 原创 作者 | 小戏、ZenMoore 三个多月前&#xff0c;微软亚洲研究院在论文《Language Is Not All You Need: Aligning Perception with Language Models》中发布了一个强大的多模态大模型 Kosmos-1&#xff0c;成功将感知与语言对齐&#xff0c;在 ChatGPT 的多…

OpenAI居然能自动写论文?导师直言我都犯难了...

最近两个月以来&#xff0c;刷屏网络技术圈的莫过于chatGPT 莫属了&#xff01;闲暇之余&#xff0c;自己也去注册了一个账号来看看它的魔力&#xff0c;毕竟也有很多博主抵挡不住其中的诱惑&#xff0c;好吧&#xff0c;我也抵挡不住&#xff0c;也就去开了openAI实验了一番&a…

ChatGPT 太火爆了,为什么不被开发者所欢迎?

可以说&#xff0c;ChatGPT是近几个月最受欢迎的话题之一&#xff0c;毕竟这个聊天机器人比它的前辈们“聪明”了很多&#xff0c;除了聊天之外&#xff0c;还会打草稿和编写代码&#xff0c;在某种程度上也能提高生产力。 记得 ChatGPT 最开始上线不久的时候&#xff0c;看到…

如何搭建公共聊天室

搭建公共聊天室 一、聊天室介绍 本聊天室主要运用了udp协议&#xff0c;应用于局域网范围之内&#xff0c;可以支持多个处于同一个局域网的主机在局域网内相互传递消息。本聊天室由一个服务器端和若干个客户端组成&#xff0c;由一台主机打开服务器端&#xff0c;其他主机通过…

实战:向人工智能看齐用Docker部署一个ChatGPT

文章目录 前言鉴赏chatgpt环境要求开始搭建云安装docker从docker仓库拉取chatgpt-web镜像创建容器并运行chatgpt-web创建容器启动chatgpt-web访问自己的chatgpt 总结 前言 目前GPT-4都官宣步入多模态大型语言模型领域了&#xff0c;大佬竟然还没有体验GPT么。作为一个资深搬砖…

ChatGPT | Poe AI—体验多个不同 AI 人工智能对话模型

近日&#xff0c;随着ChatGPT等AI产品不断推陈出新&#xff0c;问答平台Quora现也开放新的AI聊天机器人应用Poe&#xff0c;可供用户随意访问。用户可以向它提出问题&#xff0c;Poe从多种AI聊天机器人处获取答案&#xff0c;包括ChatGPT背后母公司OpenAI以及Anthropic等其他公…

MySQL 8.0原理与实战一网打尽,甲骨文数据库专家硬刚5年之作

一、MySQL 8.0势在必行 据权威数据库技术排名网站DB-Engines今年4月的最新数据&#xff0c;MySQL是全球最流行的开源数据库&#xff0c;没有之一。在所有数据库排名中&#xff0c;MySQL仅次于Oracle&#xff0c;“屈居”亚军之位。但大家从截图中可以看出&#xff0c;MySQL与O…

嵌入式音视频疑惑汇总

小小的脑袋里&#xff0c;大大的疑问&#xff0c;该文是博主在工作中遇见问题后&#xff0c;主要面向chatGPT学习的记录笔记 1、bypass hdr 是什么&#xff1f; “Bypass HDR” 是指绕过高动态范围&#xff08;HDR&#xff09;功能的一种设置。HDR 是指一种显示技术&#xff0…

40岁程序员谈修bug的心态问题

【CSDN 编者按】于程序员而言&#xff0c;如果说写代码是一种能力的体现&#xff0c;那么解决问题的能力也同等重要&#xff0c;排查问题的能力或许能决定你的职业生涯走的有多远。因此&#xff0c;常有人戏言&#xff0c;程序员不是写代码&#xff0c;而是在写 bug。本文作者是…

一次查找分子级Bug的经历,过程太酸爽了

“Debugging is like trying to find a needle in a haystack, except the needle is also made of hay.” Debug调试就像是在大片的干草堆中找针一样&#xff0c;只不过针也是由干草制成的。 在软件开发的世界里&#xff0c;偶尔会出现一些非常隐蔽的 Bug&#xff0c;这时候工…

ChatGPT 修得了别人的 Bug,修不了自己的!OpenAI 直指开源数据库 Redis 漏了底

作者 | 屠敏 出品 | CSDN&#xff08;ID&#xff1a;CSDNnews&#xff09; ChatGPT 的火爆&#xff0c;超出了很多人的想象。今年初&#xff0c;根据 UBS&#xff08;瑞士银行巨头瑞银集团&#xff09;的一份报告显示&#xff0c;ChatGPT 推出仅两个月后&#xff0c;它在 2023 …

chatgpt赋能python:Python题库搜题:提高编程效率的利器

Python题库搜题&#xff1a;提高编程效率的利器 作为一名有10年Python编程经验的工程师&#xff0c;经常遇到需要快速查找解决问题的情况&#xff0c;而Python题库搜题是我常用的工具之一。本文将着重介绍Python题库搜题的功能和使用方法&#xff0c;以及如何通过优化搜索关键…

chatgpt赋能python:使用Python在SEO中找到完美数

使用Python在SEO中找到完美数 SEO是一项关键技能&#xff0c;它可以使网站或者博客在搜索引擎中获得更好的排名&#xff0c;吸引更多的访问者。Python是一门最流行的编程语言之一&#xff0c;它也是一个很好的SEO工具。本文将介绍如何使用Python来找到完美数&#xff0c;以帮助…