探索存内计算的未来,高能效内存计算实训专场有感~

写在前面,首先感谢活动方:存内计算开发者社区的邀请来参加本次探索存内计算的未来,高能效内存计算实训专场。下面我给大家分享一下本次的活动实操感受😀。

 活动议程

本次活动邀请存内技术专家李阳老师分享存内计算是什么?为什么需要进行存内计算?目前面临的挑战是什么?

有来自杭州电子科技大学的黄彬彬老师分享了分布式环境下深度学习任务的高效可靠执行研究。

还有来自浙江大学集成电路学院李骏康老师分享,IGZO在后道单片三维集成中的机遇与挑战。通过黄彬彬老师和李骏康老师的理论分享和硬件层面分享。进一步佐证了能将存内计算这项技术做的更好。

在专家老师们分享结束之后,由主办方:存内计算开发者社区进行进行分享实操,进一步现场体验了存内计算的的独特魅力~😆

为什么一定需要存内计算?

存内计算出现的背景?

随着视频创作、搜索广告优化、高效办公体验以及元宇宙游戏等新兴需求的不断涌现,AI技术的边界正被不断拓宽。这一趋势直接推动了大模型参数的飞跃性增长,从早期的数万参数级数字信号处理,跃升至现今的数万亿参数云端巨擘。这种变化不仅标志着技术能力的巨大飞跃,也预示着对AI模型能力的要求已悄然升级,从单一的语言多模态输入输出,逐步迈向通用人工智能的广阔天地。

然而,在这一令人振奋的转型过程中,目前也面临着前所未有的挑战。功耗的急剧攀升、训练成本的持续走高、海量数据对带宽的苛刻要求,以及端侧设备对大模型容量需求的激增,构成了四大亟待解决的难题。这些问题如同四道高墙,阻碍着AI技术向更高层次迈进的步伐。

面对这些挑战,不得不重新审视并优化现有的计算架构。传统的近存计算方案,虽已在一定程度上减少了数据移动带来的延迟与功耗,但在面对AI模型参数规模爆炸式增长的现状时,其局限性日益凸显。因此,目前亟需一种更为高效、更为前沿的解决方案——存内计算(In-Memory Computing)。

什么是存内计算?

存内计算(In-Memory Computing)是一种通过将数据处理操作直接在内存中执行的计算模式。与传统的计算方式相比,它不依赖将数据从内存传输到磁盘或其他存储设备进行处理,而是充分利用内存的高速度与低延迟特性,从而显著提升计算性能。

为什么需要存内计算?

存内计算的主要特点和优势包括:

1. 高速处理:由于数据不需要频繁从磁盘读取或写入,减少了I/O操作,存内计算可以极大提高数据处理的速度,特别适合大数据分析、实时数据处理等场景。
  
2. 低延迟:内存的访问速度比磁盘快得多,这使得存内计算能够在短时间内处理大量数据,满足对低延迟有较高要求的应用。

3. 高吞吐量:存内计算通过在内存中并行执行多个任务,可以大大提高系统的吞吐量。

4. 适用场景:存内计算广泛应用于金融交易、物联网、机器学习、推荐系统等需要快速处理海量数据的领域。

如何保证存内计算的稳定性和准确性?

软件层面:如何保证分布式环境下深度学习任务的高效可靠执行?

为了高效执行深度学习任务的分布式训练,提出了一种基于强化学习的流水线分布式训练调度方案(PG-MPSS)。该方案通过双网络架构实现模型的智能调度,并利用策略梯度法更新模型参数,同时通过精准的奖励函数来提升调度效果,从而构建了高效的模型调度机制。

此外,为了提高对分布式计算节点故障的预测能力,提出了一种基于连续时间动态图的故障预测方案(CTDG-NFP)。该方法通过融合邻居采样策略与长短路径学习,获取更具多样性的信息路径,并利用时间编码器深度学习故障路径数据,最终实现了精确的故障预测。

实验结果表明,PG-MPSS在调度性能方面表现优异,而CTDG-NFP在故障预测准确性上具备显著优势。这两种方案在分布式计算环境中展示了出色的应用潜力。

硬件层面:采用IGZO在后道单片三维集成

IGZO(铟镓锌氧化物)因其优异的特性,成为实现单片三维集成的最佳候选沟道材料。它具有高迁移率、低漏电以及较低的工艺温度,能够通过原子层沉积(ALD)技术实现三维集成,且与后道工艺高度兼容。

然而,当前IGZO器件面临的主要挑战包括高温稳定性不足、抗氢化能力弱以及正偏压温度不稳定性问题。这些问题的解决将有助于进一步提升IGZO的实际应用效果。

在存储阵列(如SRAM、DRAM等)中应用IGZO,可以显著提升芯片的密度与计算效率,这也是未来高性能计算芯片发展的重要方向。通过优化工艺与材料特性,IGZO有望推动芯片技术进入新的高度。

存内计算的现场零距离体验😍

实操的大致步骤

  • python 环境安装,参考文档 doc/python 环境安装 .txt ,本 demo
    推荐在 windows 环境下进行运行。
  • 进入代码目录 cd python ,执行后续代码,模型训练配置 config.py
  • 运行 train.py ,训练完毕后,模型权重为 models/net_type/bestModel.pth
  • 运行 infer_and_generate_onnx.py ,会将训练得到的 bestModel.pth 进行推理并
    构建 onnx 模型,即 models/net_type/bestModel_quant.onnx ,将 bestModel.onnx 复制
    mapper/input 下。  
  • 运行 create_quant_data.py ,在 mapper/input 中生成 test_data_cnn_0_100.npy
    mnist_data_cnn.h 文件,这俩文件是后面生成 map 和上板验证需要的输入文件。

执行过程中部分日志图展示 

最后也通过主办方:存内计算开发者社区提供的demo完整体验了内存计算的速度与魅力,确实让之前没有这方面体验的我感受到了存内计算的独特魅力。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/434870.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Subdominator:一款针对漏洞奖励计划的子域名安全枚举工具

关于Subdominator Subdominator是一款针对漏洞奖励计划的子域名安全枚举工具,可用于在漏洞搜寻和侦察过程中进行被动子域名枚举。它旨在通过高效枚举子域名和各种免费被动资源来帮助研究人员和网络安全专业人员发现潜在的安全漏洞。 Subdominator 与各种免费和付费…

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-24

计算机前沿技术-人工智能算法-大语言模型-最新研究进展-2024-09-24 1. Enriching Datasets with Demographics through Large Language Models: What’s in a Name? K AlNuaimi, G Marti, M Ravaut, A AlKetbi, A Henschel… - arXiv preprint arXiv …, 2024 通过大型语言…

python获取百度地图路径规划

自制语音助手想做一个查询交通路线的功能,于是就想到了百度地图。在百度地图的服务器端应用中,提供了“轻量级路线规划”API接口,正好可以满足需求。要用这个接口,需要注册百度地图账号并创建一个服务器端的应用。有关开通百度地图…

Docekrfile和docker compose编写指南及注意事项

Dockerfile 基础语法 我们通过编写dockerfile,将每一层要做的事情使用语法固定下来,之后运行指令就可以通过docker来制作自己的镜像了。 构建镜像的指令:docker build /path -t imageName:tag 注意,docker build后的path必须是dockerfile…

Selenium与数据库结合:数据爬取与存储的技术实践

目录 一、Selenium与数据库结合的基础概念 1.1 Selenium简介 1.2 数据库简介 1.3 Selenium与数据库结合的优势 二、Selenium爬取数据的基本步骤 2.1 环境准备 2.2 编写爬虫代码 2.3 数据提取 2.4 异常处理 三、数据存储到数据库 3.1 数据库连接 3.2 数据存储 3.3 …

网络编程(10)——json序列化

十、day10 今天学习如何使用jsoncpp将json数据解析为c对象,将c对象序列化为json数据。jsoncp经常在网络通信中使用,也就是服务器和客户端的通信一般使用json(可视化好);而protobuf一般在服务器之间的通信中使用 json…

【YashanDB知识库】yashandb执行包含带oracle dblink表的sql时性能差

本文内容来自YashanDB官网,具体内容请见https://www.yashandb.com/newsinfo/7396959.html?templateId1718516 问题现象 yashandb执行带oracle dblink表的sql性能差: 同样的语句,同样的数据,oracle通过dblink访问远端oracle执行…

可视化服务编排:jvs-logic API出参加密实战教程

在现代软件开发与系统集成的过程中,API(应用程序接口)非常重要,它能使不同系统之间连接,进行数据交换和功能调用。当然,数据交换的数据安全肯定是不可忽视的,为了确保数据在传输过程中的保密性和…

虫情测报灯的工作原理

TH-CQ3】果园、森林等区域病虫害的实时监测、预警和科学管理。病虫害监测系统通常由以下几个部分组成:包括图像传感器、声音传感器、气象传感器等,用于实时采集作物及其周围环境的数据,如叶片变化、虫鸣声、温度、湿度、光照等。对采集到的数…

基于RealSense D435相机实现手部姿态重定向

基于Intel RealSense D435相机和MediaPipe的手部姿态检测,进一步简单实现手部姿态与机器人末端的重定向,获取手部的6D坐标(包括位置和姿态)。 假设已经按照【基于 RealSenseD435i相机实现手部姿态检测】配置好所需的库和环境&…

海口网站建设的最佳实践

海口网站建设的最佳实践 随着互联网的迅猛发展,海口的企业和个人越来越重视网站建设。一个高质量的网站不仅能提升企业形象,还能有效促进品牌传播和业务发展。以下是海口网站建设的一些最佳实践,希望能为相关从业者提供帮助。 1. 明确目标和…

一文说清楚:如何学习好K8s、OpenStack、Docker、Linux?

大家好,我是你们熟悉的-CloudJourney。在这个信息爆炸的时代,我一直致力于通过博客、公众号等平台,与大家分享关于Linux、K8S、Docker、网络、服务器以及OpenStack等前沿技术的见解与心得。然而,随着交流的深入,我逐渐…

[论文精读]TorWard: Discovery, Blocking, and Traceback of Malicious Traffic Over Tor

期刊名称:IEEE Transactions on Information Forensics and Security 发布链接:TorWard: Discovery, Blocking, and Traceback of Malicious Traffic Over Tor | IEEE Journals & Magazine | IEEE Xplore 中文译名:TorWard:…

EDM平台大比拼 用户体验与营销效果双重测评

本文评测了ZohoCampaigns、Mailchimp、Sendinblue、AWeber四款EDM平台,分别适合中小企业、多平台集成、多功能集成、初学者等需求。建议企业根据自身规模、技术水平和功能需求选择最适合的平台。 一、Zoho Campaigns 功能概述 Zoho Campaigns是Zoho旗下的一款专注…

前端框架:选择的艺术

一、简介 在现代 web 开发中,前端框架扮演着至关重要的角色。 首先,它们极大地提升了开发效率。以 React、Vue 和 Angular 为例,这些框架采用组件化的开发模式,允许开发者将页面拆分成独立的、可复用的组件。例如,在一…

学校周赛(2)

A.Minimize! 题目 思路 本题只需要遍历c的取值&#xff0c;实时更新答案即可 代码 #include<iostream> #include<algorithm> using namespace std;void todo(){int a,b;cin>>a>>b;int ansINT_MAX;for(int ca;c<b;c){ansmin(ans,(c-a)(b-c));}co…

面试题:MySQL你用过WITH吗?领免费激活码

感谢Java面试教程的Java多线程文章&#xff0c;点击查看>原文 Java面试教程&#xff0c;发mmm116可获取IDEA-jihuoma 在MySQL中&#xff0c;WITH子句用于定义临时表或视图&#xff0c;也称为公共表表达式&#xff08;CTE&#xff09;。它允许你在一个查询中定义一个临时结果…

耳机检测系统源码分享

耳机检测检测系统源码分享 [一条龙教学YOLOV8标注好的数据集一键训练_70全套改进创新点发刊_Web前端展示] 1.研究背景与意义 项目参考AAAI Association for the Advancement of Artificial Intelligence 项目来源AACV Association for the Advancement of Computer Vision …

spring-boot 整合 mybatis

文章目录 Spring boot 整合Mybatis将数据返回到浏览器1、准备数据2. 创建一个 pojo 包&#xff0c;创建User实体类3. 创建一个mapper包&#xff0c;写一个UserMapper接口4. 创建一个service包&#xff0c;写一个UserService接口。5. 在 Service 包下创建一个子包&#xff0c;im…

CSS 的背景样式

1.1 背景颜色 1.2 背景图片 1.3 背景平铺 1.4 背景图片位置 1.4.1 方位名词 1.4.2 精确单位 1.4.3 混合单位 1.5 背景图像固定 1.6 背景复合写法 1.7 背景色半透明 1.8 总结