flappy-bird-gymnasium

flappy-bird-gymnasium

news/2025/4/2 17:57:16/文章来源:https://blog.csdn.net/gyh101010/article/details/145474191

flappy-bird-gymnasium 是一个基于 OpenAI Gymnasium 的环境，旨在为 Flappy Bird 游戏提供强化学习研究平台。该项目的游戏逻辑和图形实现基于 Talendar 的 flappy-bird-gym 项目。

一、主要特点

1. 状态空间

环境提供两种观察选项：

（1） LIDAR 传感器读取： 基于论文《基于运动识别的 Flappy Bird 游戏控制方法》，环境提供 180 个 LIDAR 传感器读取值。

（2） 游戏状态数值： 包括以下信息：

• 最后一个管道的水平位置

• 最后一个上方管道的垂直位置

• 最后一个下方管道的垂直位置

• 下一个管道的水平位置

• 下一个上方管道的垂直位置

• 下一个下方管道的垂直位置

• 下下个管道的水平位置

• 下下个上方管道的垂直位置

• 下下个下方管道的垂直位置

• 玩家的垂直位置

• 玩家的垂直速度

• 玩家的旋转角度

2. 动作空间

包含两个动作：

• 0 - 不采取任何动作

• 1 - 拍动翅膀

二、奖励机制

• 每存活一帧：+0.1

• 成功通过一个管道：+1.0

• 死亡：-1.0

• 触碰屏幕顶部：-0.5

三、安装方法

使用以下命令安装 flappy-bird-gymnasium：

pip install flappy-bird-gymnasium

四、使用方法

以下是一个简单的示例，展示如何创建环境并运行一个随机策略的智能体：

import flappy_bird_gymnasium
import gymnasium as gym

# 创建环境
env = gym.make("FlappyBird-v0", render_mode="human", use_lidar=True)

# 重置环境
obs, _ = env.reset()

while True:
# 选择动作（此处为随机选择）
action = env.action_space.sample()

# 执行动作
obs, reward, terminated, _, info = env.step(action)

# 检查游戏是否结束
if terminated:
break

# 关闭环境
env.close()

五、人类玩家模式

您可以通过以下命令以人类玩家模式玩游戏：

flappy_bird_gymnasium

要观看随机智能体的游戏过程，可以使用以下命令：

flappy_bird_gymnasium --mode random

此外，该项目还提供了一个使用深度 Q 网络（DQN）算法的智能体，您可以通过以下命令观看其表现：

flappy_bird_gymnasium --mode dqn

六、关于项目

该项目的源代码和详细信息可在其 GitHub 仓库中找到：

https://github.com/markub3327/flappy-bird-gymnasium

该仓库提供了关于环境的详细说明、安装指南以及使用示例，适合用于强化学习算法的开发和测试。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/13737.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

第16章 Single Thread Execution设计模式（Java高并发编程详解：多线程与系统设计）

第16章 Single Thread Execution设计模式（Java高并发编程详解：多线程与系统设计）

简单来说， Single Thread Execution就是采用排他式的操作保证在同一时刻只能有一个线程访问共享资源。 1.机场过安检 1.1非线程安全先模拟一个非线程安全的安检口类，旅客(线程)分别手持登机牌和身份证接受工作人员的检查，示例代码如所示。…

阅读更多...

OSPF基础（2）：数据包详解

OSPF基础（2）：数据包详解

OSPF数据包(可抓包) OSPF报文直接封装在IP报文中，协议号89 头部数据包内容： 版本(Version):对于OSPFv2，该字段值恒为2(使用在IPV4中)；对于OSPFv3，该字段值恒为3(使用在IPV6中)。类型(Message Type):该OSPF报文的类型。…

阅读更多...

MAC 安装mysql全过程记录

MAC 安装mysql全过程记录

4.然后等待下载吧，（下载中。。。。），好了，网速的问题，半个小时终于下载好了，开始安装吧。 5.得到如下安装包，mac下也是双击直接下载，来，我们来看看下载的过程…

阅读更多...

神经网络常见激活函数 1-sigmoid函数

神经网络常见激活函数 1-sigmoid函数

sigmoid 1 函数求导 sigmoid函数 σ ( x ) 1 1 e ( − x ) \sigma(x) \frac{1}{1e^{(-x)}} σ(x)1e(−x)1 sigmoid函数求导 d d x σ ( x ) d d x ( 1 1 e − x ) e − x ( 1 e − x ) 2 ( 1 e − x ) − 1 ( 1 e − x ) 2 1 1 e − x − 1 ( 1 e − x ) 2 …

阅读更多...

微软发布基于PostgreSQL的开源文档数据库平台DocumentDB

微软发布基于PostgreSQL的开源文档数据库平台DocumentDB

我们很高兴地宣布正式发布DocumentDB——一个开源文档数据库平台，以及基于 vCore、基于 PostgreSQL 构建的 Azure Cosmos DB for MongoDB 的引擎。过去，NoSQL 数据库提供云专用解决方案，而没有通用的互操作性标准。这导致对可互操作、可移植…

阅读更多...

【苍穹外卖 Day1】前后端搭建 Swagger导入接口文档

【苍穹外卖 Day1】前后端搭建 Swagger导入接口文档

项目技术选型前端直接使用打包好的nginx运行。后端 1、导入初始代码结构如下： 2、将代码上传远程仓库。 3、创建数据库，并修改数据库配置。 4、断点调试，前后端联调。 5、使用Nginx代理，修改Nginx配置好处：提…

阅读更多...

零基础Vue入门6——Vue router

零基础Vue入门6——Vue router

本节重点： 路由定义路由跳转前面几节学习的都是单页面的功能（都在专栏里面https://blog.csdn.net/zhanggongzichu/category_12883540.html），涉及到项目研发都是有很多页面的，这里就需要用到路由（vue route…

阅读更多...

深度学习里面的而优化函数 Adam，SGD，动量法，AdaGrad 等 | PyTorch 深度学习实战

深度学习里面的而优化函数 Adam，SGD，动量法，AdaGrad 等 | PyTorch 深度学习实战

前一篇文章，使用线性回归模型逼近目标模型 | PyTorch 深度学习实战本系列文章 GitHub Repo: https://github.com/hailiang-wang/pytorch-get-started 本篇文章内容来自于强化学习必修课：引领人工智能新时代【梗直哥瞿炜】深度学习里面的而优化函数 …

阅读更多...

mybatis-plus updateById源码

mybatis-plus updateById源码

1.版本 : mybatis-plus-core 3.5.1 2.入口:MybatisPlusAutoConfiguration类sqlSessionFactory中的factory.getObject() 3.注入AbstractSqlInjector类中的inspectInject方法中 Overridepublic void inspectInject(MapperBuilderAssistant builderAssistant, Class<?> m…

阅读更多...

RabbitMQ 从入门到精通：从工作模式到集群部署实战（三）

RabbitMQ 从入门到精通：从工作模式到集群部署实战（三）

文章目录使用CLI管理RabbitMQrabbitmqctlrabbitmq-queuesrabbitmq-diagnosticsrabbitmq-pluginsrabbitmq-streamsrabbitmq-upgraderabbitmqadmin 使用CLI管理RabbitMQ RabbitMQ CLI 工具需要安装兼容的 Erlang/OTP版本。这些工具假定系统区域设置为 UTF-8（例如en…

阅读更多...

PlanLLM: 首个支持开放词汇与封闭集任务的跨模态视频程序规划框架

PlanLLM: 首个支持开放词汇与封闭集任务的跨模态视频程序规划框架

2025年1月7号，由杨德杰、赵子敬、刘洋联合提出PlanLLM，一种基于可微调大型语言模型（LLM）的跨模态联合学习框架，用于解决视频程序规划任务。通过引入LLM增强规划模块和互信息最大化模块，PlanLLM突破了现有方…

阅读更多...

WGCLOUD监控系统部署教程

WGCLOUD监控系统部署教程

官网地址：下载WGCLOUD安装包 - WGCLOUD官网第一步、环境配置 #安装jdk 1、安装 EPEL 仓库： sudo yum install -y epel-release 2、安装 OpenJDK 11： sudo yum install java-11-openjdk-devel 3、如果成功，你可以通过运行 java …

阅读更多...

6-图像金字塔与轮廓检测

6-图像金字塔与轮廓检测

文章目录 6.图像金字塔与轮廓检测（1）图像金字塔定义（2）金字塔制作方法（3）轮廓检测方法（4）轮廓特征与近似（5）模板匹配方法6.图像金字塔与轮廓检测（1）图像金字塔定义高斯金字塔拉普拉斯金字塔高斯金字塔：向下采样方法(缩小) 高斯金字塔：向上采样方法(放大)…

阅读更多...

DeepSeek-V3 与 DeepSeek R1 对比分析：技术与应用的全面解析

DeepSeek-V3 与 DeepSeek R1 对比分析：技术与应用的全面解析

一、背景在当今科技飞速发展的时代，深度学习技术如同一股强大的浪潮，席卷了自然语言处理（NLP）、计算机视觉（CV）以及多模态模型等众多领域。从智能语音助手到图像识别技术，从文本生成工具到多模…

阅读更多...

基于 Spring Cloud + Spring AI + VUE 的知识助理平台介绍以及问题

基于 Spring Cloud + Spring AI + VUE 的知识助理平台介绍以及问题

前言（一些废话） 在看这篇文章的各位大佬，感谢你们留出几分钟时间，来看这个产品介绍，其实重点说实话，不是这个产品怎么样。而是在最后有一个郁结在心里的几个问题，希望大佬们能给出一些建议。万…

阅读更多...

IEEE 802.3/802.2 | LLC / SNAP

IEEE 802.3/802.2 | LLC / SNAP

注：本文为 “IEEE 802.3/802.2 | LLC / SNAP” 相关文章合辑。未整理去重。第三篇部分内容出自第二篇。 802.2 协议 haoay321 2010-01-28 20:52:02 LLC 协议 LLC（Logic Link Control，逻辑链路控制）是 IEEE 802.2 协议中规定…

阅读更多...

【Elasticsearch】Geo-distance聚合

【Elasticsearch】Geo-distance聚合

geo_distance聚合的形状是圆形。它基于一个中心点（origin）和一系列距离范围来计算每个文档与中心点的距离，并将文档分配到相应的距离范围内。这种聚合方式本质上是以中心点为圆心，以指定的距离范围为半径的圆形区域来划分数据。为…

阅读更多...

Chapter 4-1. Troubleshooting Congestion in Fibre Channel Fabrics

Chapter 4-1. Troubleshooting Congestion in Fibre Channel Fabrics

This chapter covers the following topics: 本章包括以下内容： Congestion troubleshooting methodology and workflow. Hints and tips for troubleshooting congestion. Cisco MDS NX-OS commands for troubleshooting congestion. Case studies demonstrating troubleshoo…

阅读更多...

【字节青训营-7】：初探 Kitex 字节微服务框架（使用ETCD进行服务注册与发现）

【字节青训营-7】：初探 Kitex 字节微服务框架（使用ETCD进行服务注册与发现）

本文目录一、Kitex概述二、第一个Kitex应用三、IDL四、服务注册与发现一、Kitex概述长话短说，就是字节跳动内部的 Golang 微服务 RPC 框架，具有高性能、强可扩展的特点，在字节内部已广泛使用。如果对微服务性能有要求，又希望…

阅读更多...

设计模式Python版享元模式

设计模式Python版享元模式

文章目录前言一、享元模式二、享元模式示例前言 GOF设计模式分三大类： 创建型模式：关注对象的创建过程，包括单例模式、简单工厂模式、工厂方法模式、抽象工厂模式、原型模式和建造者模式。结构型模式：关注类和对象之间的组合&…

阅读更多...

最新文章

推荐文章