基于聚类与LSTM对比特币价格深度分析与预测

1.项目背景

比特币作为全球最具影响力的加密货币之一,其价格受到多种复杂因素的共同作用,包括市场情绪、政策变化、大型机构的投资行为等,这些因素在不同的市场阶段对比特币价格波动产生直接或间接的影响。通过对比特币市场的深入分析,可以更清晰地了解价格动态和市场行为,进而为投资决策提供更可靠的依据。

本项目对比特币市场进行了全面而深入的分析,采用多种技术指标和数据分析方法,揭示了比特币价格动态和市场行为的关键特征,详细刻画了比特币的市场波动性,还提供了对市场结构和未来价格走势的深刻洞察,这些成果对于投资者、交易者和市场研究人员具有重要的参考价值,能够帮助他们制定更加明智且数据驱动的决策。然而,尽管本项目揭示了比特币市场的许多关键特征,投资者仍需意识到虚拟货币市场的高风险性。比特币等虚拟货币的价格波动极大,常常受全球市场情绪、政策变化和大型机构投资行为的影响,容易出现剧烈的价格波动,此外,虚拟货币市场缺乏足够的监管保护,存在较大的金融风险。

2.数据说明

字段名说明
Date交易日期
Open开盘价(当天交易开始时的价格)
High最高价(当天交易中的最高价格)
Low最低价(当天交易中的最低价格)
Close收盘价(当天交易结束时的价格)
Adj Close复权收盘价(经过调整的收盘价格) 在加密货币中,调整收盘价通常较少使用,因为它不涉及股息或拆股。
Volume成交量(当天的比特币交易总量)

3.Python库导入及数据读取

import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.dates as mdates
from pandas.plotting import register_matplotlib_converters
import numpy as np
from matplotlib.ticker import MaxNLocator
from sklearn.preprocessing import StandardScaler,MinMaxScaler
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import LSTM, Dense, Dropout
from sklearn.metrics import mean_squared_error, mean_absolute_error
from tensorflow.keras import Input
from tensorflow.keras.optimizers import Adam
from keras_tuner import RandomSearch
import seaborn as sns
from keras_tuner.engine.hyperparameters import HyperParameters
data = pd.read_csv('/home/mw/input/09068560/BTC-USD (2014-2024).csv')

4.数据预览及预处理

查看数据信息:

这里先处理日期,把日期转为正确的日期格式,再对缺失值进行处理。

查找缺失值所在的行:

发现数据在“2024-01-20”这一天全部都丢失了,考虑丢失的比较少,可以使用插值法进行填充。

可以看到,通过插值法填充的数据,还是相对合理的,这里观察数据的起始时间。

该数据集的日期范围是从 2014年9月18日 到 2024年1月21日,并且日期列中没有缺失值。数据是连续的。

5.可视化分析

5.1K线图

  1. 长期增长趋势:从2014年到2024年,比特币价格整体呈现显著的上升趋势,尽管存在周期性波动。

  2. 主要周期:

    • 2014-2016年:价格低位徘徊期
    • 2017年:第一个主要牛市,价格急剧上升
    • 2018-2020年初:长期调整期
    • 2020年中-2021年底:第二个主要牛市,创历史新高
    • 2022年:大幅回调
    • 2023年至今:新一轮上涨趋势
  3. 关键价格点:

    • 2017年末:首次突破20,000美元
    • 2021年4月和11月:两次突破60,000美元,达到历史最高点
  4. 波动性:

    • 早期(2014-2016):相对低波动
    • 中期(2017-2019):波动性增大
    • 近期(2020-2024):呈现更大幅度的价格波动
  5. 调整幅度:

    • 2018年初的回调:从近20,000美元跌至约3,000美元
    • 2022年的回调:从约69,000美元高点跌至约15,000美元

这里由Claude列出比特币价格走势中的重要事件节点,并将其与价格变动相关联,以下是主要事件及其对应的时间点:

  1. 2017年末急涨:

    • 价格从低位急剧上涨至约20,000美元高点
    • 背景:首次加密货币热潮,比特币期货合约推出
  2. 2018年初大跌:

    • 从高点快速回落至约6,000美元
    • 事件:多国开始收紧加密货币监管
  3. 2020年末至2021年初快速上涨:

    • 价格突破50,000美元
    • 背景:机构投资者大规模进入,特斯拉宣布购入比特币
  4. 2021年11月历史新高:

    • 达到接近70,000美元的历史最高点
    • 事件:首只比特币期货ETF在美国上市
  5. 2022年中大幅下跌:

    • 价格跌破20,000美元
    • 背景:全球加息周期开启,加密货币市场整体低迷
  6. 2023年初至今显著上涨:

    • 价格再次突破40,000美元
    • 背景:比特币现货ETF获批预期升温

5.2价格趋势分析

总体来看,尽管比特币价格有周期性的波动,但整体趋势是上升的,说明比特币在长期内的投资价值依然得到一定的市场认可。

  1. 短期与长期价格趋势变化:

    • 短期趋势(由30天线表示)变化更为频繁,对价格变动反应更敏感
    • 长期趋势(由100天线表示)变化相对平缓,反映整体方向
    • 2020年底至2021年末,短期和长期趋势都呈现强劲上升
    • 2022年上半年,短期和长期趋势均转为下降
    • 2023年中期开始,短期和长期趋势再次转为上升
  2. 买卖信号:

    • 黄金交叉(30天线从下向上穿过100天线):买入信号
      • 2020年7月出现明显黄金交叉,随后价格大幅上涨
      • 2023年初再次出现黄金交叉,预示新一轮上涨趋势
    • 死亡交叉(30天线从上向下穿过100天线):卖出信号
      • 2021年中期短暂出现死亡交叉,但很快恢复
      • 2022年初出现显著死亡交叉,随后价格大幅下跌
  3. 趋势确认:

    • 牛市期间:价格线位于30天线之上,30天线高于100天线
    • 熊市期间:价格线位于30天线之下,30天线低于100天线
    • 2023年下半年,价格线突破并保持在两条均线之上,确认上升趋势
  4. 波动性观察:

    • 价格波动幅度随时间增大,但近期相对2021年峰值有所收窄
    • 均线之间的距离反映市场波动性,距离越大表示波动越剧烈
  5. 当前市场状况(2024年初):

    • 价格处于30天和100天均线之上,表明短期和中期趋势向好
    • 30天线位于100天线之上,进一步确认上升趋势
    • 需密切关注价格是否能持续保持在均线之上,以确认趋势持续性

5.3相对强弱指数

超买:当资产的价格在短时间内快速上涨到超过其内在价值或历史平均水平时,称为超买,通常表明投资者情绪过于乐观,价格可能存在回调的风险。
超卖:当资产的价格在短时间内快速下跌到低于其内在价值或历史平均水平时,称为超卖,通常表明投资者情绪过于悲观,价格可能存在反弹的机会。
超买和超卖的概念在技术分析中用于帮助识别潜在的价格反转点。
RSI值显示了该股票的强弱程度。通常RSI值高于70表示股票处于超买状态,可能有回调的风险;低于30表示股票处于超卖状态,可能有反弹的机会。

5.4布林带

  1. 长期趋势:

    • 从2015年到2024年,比特币价格整体呈现上升趋势
  2. 重要价格突破:

    • 2017年末和2021年初,价格突破上轨,预示了显著的上涨行情
    • 2022年中期,价格跌破下轨,标志着熊市的到来
  3. 波动性变化:

    • 2021年布林带显著展开,反映了该时期巨大的市场波动性
    • 相比之下,2019-2020年布林带相对收窄,表明那段时期波动较小
  4. 近期趋势(2023-2024):

    • 价格逐渐上升,突破中轨,显示出上升趋势
    • 布林带开始缓慢展开,可能预示新一轮波动性增加
  5. 当前市场状况:

    • 价格位于中轨和上轨之间,暗示短期内可能继续上涨
    • 但尚未突破上轨,表明上涨动能还不够强劲

5.5成交量走势

  • 2021年初出现了最显著的成交量峰值,远超其他时期,可能与当时比特币价格创历史新高有关。
  • 成交量随着价格波动而波动,在价格较高时,成交量相对较大,尤其是在价格剧烈波动期间。

5.6比特币价格波动与异常检测

  • 2015-2017年:价格波动相对平稳。
  • 2017年末-2018年初:出现第一次显著的价格波动和异常点集中,可能是由ICO热潮和比特币期货合约推出推动。
  • 2020年后:价格波动和异常点明显增多,特别是2021年达到峰值,可能是受机构投资者进入、特斯拉购买比特币、萨尔瓦多将比特币列为法定货币等因素影响。

5.7比特币成交量与异常检测

  • 2015-2017年:成交量较低,无明显异常点。
  • 2017年末-2018年初:首次出现明显的成交量增长。
  • 2020年后:成交量显著增加,异常点更为频繁,反映机构投资者大规模进入市场,以及比特币价格创新高时的市场狂热。

6.市场特征聚类分析

6.1数据预处理

选择用于聚类的特征: 价格波动和成交量,并且进行标准化处理。

6.2K-Means聚类

1.左图为肘部法则图,通过此图可以看到,在聚类数4到5之间,曲线开始明显平缓。
2.右图为轮廓系数图,轮廓系数在聚类数为5时达到最高点。
结合两个图,选择5作为聚类数。

聚类特征概述

  1. 聚类 0(紫色):中等波动、中等成交量

    • 价格波动:中等(约500-1500 USD)
    • 成交量:中等(约0.2-0.4)
    • 特征:市场稳定期,可能是调整或蓄势阶段
  2. 聚类 1(蓝色):低波动、低成交量

    • 价格波动:最低(< 500 USD)
    • 成交量:最低(< 0.1)
    • 特征:市场低迷期,可能是早期阶段或熊市底部
  3. 聚类 2(绿色):极高波动、高成交量

    • 价格波动:最高(4000-8000 USD,有极端值超过12000 USD)
    • 成交量:较高(0.5-1.0,有极端值接近3.5)
    • 特征:市场极度活跃期,可能是牛市顶峰或剧烈波动期
  4. 聚类 3(单点,2021-02-26)

    • 价格波动:高(约4000 USD)
    • 成交量:极高(3.5)
    • 特征:代表单一极端事件
  5. 聚类 4(黄色):高波动、高成交量

    • 价格波动:高(2000-4000 USD)
    • 成交量:高(0.3-0.5)
    • 特征:市场活跃期,可能是牛市上升阶段或高度投机期

市场演变分析

  1. 早期阶段(2014-2017年中)

    • 主要表现为聚类1(蓝色),低波动低成交量
    • 市场处于萌芽期,参与度低
  2. 首次爆发期(2017年底-2018年初)

    • 出现聚类4(黄色)和聚类2(绿色)
    • 市场经历第一次大规模牛市,价格和成交量显著上升
  3. 调整期(2018-2020年中)

    • 主要为聚类0(紫色)和聚类1(蓝色)
    • 市场进入调整,波动和成交量回落但仍高于初期水平
  4. 成熟爆发期(2020年底-2021年)

    • 大量聚类2(绿色)和聚类4(黄色)出现
    • 市场达到前所未有的高度活跃状态,价格和成交量创历史新高
  5. 高位波动期(2022-2024年初)

    • 聚类0(紫色)、聚类4(黄色)和少量聚类2(绿色)交替出现
    • 市场维持在较高水平但波动性增加,可能进入新的调整期

7.基于LSTM模型预测比特币价格

7.1数据预处理

对数据进行归一化,归一化到0-1之间后,划分数据集,并且将数据调整为 LSTM 所需的格式。

7.2建立模型

原始模型性能:

均方误差 (MSE): 1874807.721

平均绝对误差 (MAE): 920.989

7.3优化参数

最佳超参数:

{‘num_lstm_layers’: 1,

‘lstm_units_0’: 32,

‘dropout_0’: 0.4,

‘dense_units’: 48,

‘learning_rate’: 0.0031256760850773423,

‘lstm_units_1’: 32,

‘dropout_1’: 0.4,

‘lstm_units_2’: 96,

‘dropout_2’: 0.1}

优化后的模型性能:

均方误差 (MSE): 897151.138

平均绝对误差 (MAE): 663.656

  1. LSTM模型对比特币价格的整体趋势预测较为准确。
  2. 优化确实带来了一定的改进,但改进幅度不大。
  3. 对于日常波动,两个模型都表现良好,但在预测大幅度价格变动时仍有改进空间。
  4. 这种预测模型适合用于中短期趋势分析,但不应过度依赖于其对具体价格点的预测。

8.总结

本项目对比特币市场进行了全面而深入的分析,采用多种技术指标和数据分析方法,揭示了比特币价格动态和市场行为的关键特征。

具体而言,项目包括以下主要组成部分:

  1. 多维度可视化分析:

    • 绘制K线图,直观展示价格变动。
    • 进行价格趋势分析,识别长期走势。
    • 运用移动平均线,平滑短期波动并突显趋势。
    • 通过RSI(相对强弱指数)分析,评估市场过买过卖状况。
    • 利用布林带,量化价格波动范围和潜在突破点。
    • 分析成交量走势,洞察市场参与度变化。
  2. 异常检测:

    • 实施价格异常波动检测,识别重大市场事件。
    • 进行成交量异常值检测,发现潜在的市场操纵或重大交易活动。
  3. 市场状态聚类分析:

    • 应用K-Means聚类算法,将市场状态划分为五个不同类别。
    • 深入理解不同市场阶段的特征和行为模式。
  4. 高级预测模型:

    • 构建并优化LSTM(长短期记忆)神经网络模型。
    • 对比特币收盘价进行预测,为投资决策提供数据支持。

通过这一系列全面的分析和建模,本项目不仅详细刻画了比特币的市场波动性,还提供了对市场结构和未来价格走势的深刻洞察,这些成果对于投资者、交易者和市场研究人员具有重要的参考价值,能够帮助他们制定更加明智且数据驱动的决策。然而,尽管本项目揭示了比特币市场的许多关键特征,投资者仍需意识到虚拟货币市场的高风险性。比特币等虚拟货币的价格波动极大,常常受全球市场情绪、政策变化和大型机构投资行为的影响,容易出现剧烈的价格波动,此外,虚拟货币市场缺乏足够的监管保护,存在较大的金融风险。
本项目仅供学习参考!建议投资者在做出任何投资决策时,结合市场走势和政策变化,尽量控制风险,避免盲目跟风。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/419637.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

66城代表齐聚!蓝卓分享“全国经验”,批量复制推动中小企业数字化转型

9月6日下午&#xff0c;2024中小企业数字化转型现场交流活动在浙江宁波隆重举行。 全国66个中小企业试点城市500多名中小企业主管部门及专家学者&#xff0c;制造业企业、数字化转型服务商等重点企业代表齐聚宁波&#xff0c;共同探讨中小企业数字化转型的模式和路径。 工业和…

酒店智能轻触开关:智慧化的创新实践

在追求高品质住宿体验的今天&#xff0c;酒店智能轻触开关作为智慧酒店建设的关键一环&#xff0c;正逐步成为提升酒店服务品质、优化运营效率、增强顾客满意度的有力工具。本文将深入探讨酒店智能轻触开关如何助力酒店实现智慧化管理&#xff0c;以及它所带来的多重变革。 一、…

VSCode连接docker

1.启动ssh服务 vim /root/.bashrc 或者 vim ~/.bashrc /usr/sbin/sshd #启动ssh服务~代表主目录&#xff0c;cd ~会返回root目录 cd / 返回最根上的目录 为了防止每次打开容器都要输入此指令&#xff0c;我们直接在 ~/.bashrc文件最后一行添加sshd启动命令即可。 打开终端…

【JAVA开源】基于Vue和SpringBoot的图书个性化推荐系统

本文项目编号 T 015 &#xff0c;文末自助获取源码 \color{red}{T015&#xff0c;文末自助获取源码} T015&#xff0c;文末自助获取源码 目录 一、系统介绍1.1 业务分析1.2 用例设计1.3 时序设计 二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究…

掌握ChatGPT写论文六步提问法,会提问才能写出优质好论文

大家好,感谢关注。我是七哥,一个在高校里不务正业,折腾学术科研AI实操的学术人。关于使用ChatGPT等AI学术科研的相关问题都可以分享,相互成就,共同进步,为大家带来最酷最有效的智能AI学术科研写作攻略。 今天给大家分享的是借助GPT一年发两篇SCI的学术大拿总结的ChatGPT六…

IPS和IDS有啥区别?

吉祥知识星球http://mp.weixin.qq.com/s?__bizMzkwNjY1Mzc0Nw&mid2247485367&idx1&sn837891059c360ad60db7e9ac980a3321&chksmc0e47eebf793f7fdb8fcd7eed8ce29160cf79ba303b59858ba3a6660c6dac536774afb2a6330&scene21#wechat_redirect 《网安面试指南》…

ChatGPT付费创作系统V3.0.6独立版 WEB+H5+小程序端 (新增AI全网搜索+文档解析+豆包AI通道)安装部署教程

播播资源GPT付费体验系统最新版系统是一款基于ThinkPHP框架开发的AI问答小程序&#xff0c;是基于国外很火的ChatGPT进行开发的Ai智能问答小程序。这是一种基于人工智能技术的问答系统&#xff0c;可以实现智能回答用户提出的问题。相比传统的问答系统&#xff0c;ChatGPT可以更…

认识Linux及Linux的环境搭建

目录 1、什么是Linux2、Linux环境搭建2.1 下载安装 Xshell2.2 下载安装 VMware Workstation Pro2.3 选择适合自己系统 1、什么是Linux Linux&#xff0c;一般指GNU/Linux&#xff08;单独的Linux内核并不可直接使用&#xff0c;一般搭配GNU套件&#xff0c;故得此称呼&#xff…

ARM基础知识---CPU---处理器

目录 一、ARM架构 1.1.RAM---随机存储器 1.2.ROM---只读存储器 1.3.flash---闪存存储器 1.4.时钟&#xff08;振晶&#xff09; 1.5.复位 二、CPU---ARM920T 2.1.R0~R12---通用寄存器 2.2.PC程序计数器 2.3.LR连接寄存器 2.4.SP栈指针寄存器 2.5.CPSR当前程序状态寄存…

java,php,go,nodejs,Python开发web项目优缺点对比

Java 优点:java 是一门广泛应用于企业级开发的语言,丰富且庞大的开发框架和库。有较高的性能和可伸缩性。生态系统庞大且成熟,拥有大量的开源框架和工具,可以加速开发过程。 内置对多线程的支持,适合处理高并发的 Web 项目。 缺点:相比其他语言,Java 的语法相对冗长繁琐…

【H2O2|全栈】关于Photoshop | PS(4)

PS的一些杂谈&#xff08;亖&#xff09; 目录 PS的一些杂谈&#xff08;亖&#xff09; 前言 准备工作 图形工具 基本属性 混合选项 形状图层 文字工具 基本属性 进一步变化文字 组和图层 UI设计案例 预告和回顾 后话 前言 这一篇博客我将会写一下图形工具和…

【C++】STL学习——priority_queue(了解仿函数)

目录 priority_queue介绍迭代器种类priority_queue实现仿函数仿函数的使用 priority_queue介绍 优先队列是一种容器适配器&#xff0c;根据严格的弱排序标准&#xff0c;它的第一个元素总是它所包含的元素中最大的。此上下文类似于堆&#xff0c;在堆中可以随时插入元素&#x…

Python | Leetcode Python题解之第394题字符串解码

题目&#xff1a; 题解&#xff1a; class Solution:def decodeString(self, s: str) -> str:def dfs(s, i):res, multi "", 0while i < len(s):if 0 < s[i] < 9:multi multi * 10 int(s[i])elif s[i] [:i, tmp dfs(s, i 1)res multi * tmpmulti…

SpringCache源码解析(三)——@EnableCaching

一、源码阅读 让我们进行源码阅读把。 1.1 阅读源码基础&#xff1a; Import(xxx.class)里的类可以有两种类&#xff1a; ImportSelector接口的实现类&#xff1b;ImportBeanDefinitionRegistrar接口的实现类&#xff1b; 两种接口简介&#xff1a; ImportSelector接口&am…

什么是 TDengine?

TDengine 是一款专为物联网、工业互联网等场景设计并优化的大数据平台&#xff0c;其核心模块是高性能、集群开源、云原生、极简的时序数据库。它能安全高效地将大量设备、数据采集器每天产生的高达 TB 甚至 PB 级的数据进行汇聚、存储、分析和分发&#xff0c;对业务运行状态进…

kaggle竞赛平台上数据集下载详解

引言 kaggle作为一个数据分析竞赛平台不仅可以上传代码和数据集&#xff0c;参与一些公开的竞赛&#xff0c;同时也可以下载别人上传的数据集。本文着重介绍如何注册kaggle账号&#xff0c;在本地机上安装kaggle API,以及从kaggle数据集界面上下载想要的数据集到指定位置。 文章…

腾讯面试:说说6大Nginx负载均衡?手写一下权重轮询策略?

尼恩说在前面 在40岁老架构师 尼恩的读者交流群(50)中&#xff0c;最近有小伙伴拿到了一线互联网企业如得物、阿里、滴滴、极兔、有赞、希音、百度、网易、美团的面试资格&#xff0c;遇到很多很重要的面试题&#xff1a; 1.讲一下什么是负载均衡&#xff0c;什么是轮询策略、…

Vue/cli不同环境下打包后js文件没有添加hash值-会导致缓存问题-解决

环境变量 包文件判断是根据NODE_ENV=production,这时会对应打包加上hash值,所以在配置不同环境对应命令的时候,把NODE_ENV=production加上 全局的环境变量需要以VUE_APP_ 开头 process.env.VUE_APP_ENV 会读取不到值 .env 文件配置 NODE_ENV=production 才会按照hash模式去…

一、selenium自动化简介selenium工具集

文章目录 一、简介二、组成部分三、selenium工具集3.1 Selenium IDE3.2 Selenium WebDriver3.3 Selenium Grid3.4 Appium 一、简介 官方网站 Selenium 是支持 web 浏览器自动化的一系列工具和库的综合项目。 它提供了扩展来模拟用户与浏览器的交互&#xff0c;用于扩展浏览器分…

如何通过商品id商品链接来获取淘宝商品主图详情图等数据?

在电子商务领域&#xff0c;获取商品信息&#xff0c;尤其是商品的主图、详情图以及其他相关数据&#xff0c;对于商家进行竞品分析、价格监控、商品上架前的信息整合等场景至关重要。淘宝作为中国最大的电子商务平台之一&#xff0c;其商品信息的获取更是众多商家和开发者关注…