GOAT‘S AI早鸟报Part9

资讯

英伟达重磅发布5090,定价15000

老黄重磅发布5090,定价15000!22000元的世界最小AI超级计算机也来了

英伟达在CES发布了最新的GPU——RTX 5090,采用Blackwell架构,具备920亿个晶体管,4000 AI TOPS的AI性能,以及380 RT TFLOPS的光线追踪性能。RTX 5090的售价为1999美元(约14651元),而其他型号如RTX 5080和RTX 5070 Ti分别定价999美元和749美元。此次发布还推出了更新版的NVLink72互联技术,提供1.4 ExaFLOPS的计算能力和超高宽带。此外,英伟达还展示看全球最小的个人超级计算机——Project Digits,具备2000亿参数的大模型,能够在系统上运行并支持云部署,起售价为3000美元。

Project Digits搭载了基于Grace Blackwell架构的GB10超级芯片,结合高效能Grace CPU和最新的Blackwell GPU,为用户提供高性能的AI推理和开发环境。此外,英伟达宣布将开源可商用的世界基础模型——Cosmos,专为自动驾驶和机器人领域的训练而设计,提供了大量基于驾驶和机器人视频数据的训练模型。这些模型支持开发者在物理环境中合成数据,并进行微调。

在其他模型发布方面,英伟达推出了三类模型:Nano、Super和Ultra,适应不同的应用需求,涵盖从低延迟实施部署到高精度定制模型的广泛应用场景。英伟达还推出了NIM微服务和AI蓝图,支持多种开发需求,如数字人类和内容创作。

此次发布的技术和产品表明,英伟达正加速推动AI计算和模型训练的普及,并强调AI将成为各行各业的核心。英伟达股价在发布后创下新高,市值达到3.66万亿美元,稳居全球第二大上市企业,仅次于苹果。

推特

Google AI Studio发布为渐进式网络应用,现在支持在桌面、iOS和Android 设备上本地安装

https://x.com/OfficialLogank/status/1876378894036783614

我们刚刚将Google AI Studio 发布为渐进式网络应用(PWA),现在您可以在桌面、iOS和Android设备上本地安装它。

非常感激,现在我终于不用每天输入20次AI Studio的网址了~~

信号

Large Language Models for Video Surveillance Applications

原文链接:https://arxiv.org/abs/2501.02850v1

ResearchFlow: New Flow - ResearchFlow

视频内容制作的快速增长带来了巨大的数据量,给高效分析和资源管理带来了巨大的挑战。为解决这个问题,强大的视频分析工具必不可少。本文提出了一种创新的概念验证,使用视觉语言模型形式的生成式人工智能(GenAI)来增强下游视频分析过程。我们的工具根据用户自定义的查询生成定制的文本摘要,在广泛的视频数据集中提供有针对性的见解。与提供通用摘要或有限动作识别的传统方式不同,我们的方法利用视觉语言模型来提取相关信息,从而提高分析精度和效率。所提出的方法从大量的闭路电视录像中生成文本摘要,然后可以在与视频相比非常小的存储空间中无限期地存储这些摘要,使用户无需进行详尽的手动审查即可快速导航和验证重要事件。定性评估分别使管道的时间和空间质量以及一致性的准确度达到80%和70%。

产品

AnyParser Pro 功能强大的多语言解析工具

CambioML - AnyParser API: The first LLM for document parsing with accuracy and speed

AnyParser Pro是一款功能强大的多语言解析工具,专为满足现代企业需求而设计它能够高效处理各类文档和图像,包括PDF、Word、PPT和复杂的图片文件,精准提取文本、表格和图表等关键信息。借助先进的AI技术,AnyParser Pro提供卓越的解析精度,无论是复杂格式还是语言内容,都能轻松应对。产品在设计过程中始终将客户隐私置于首位,采用严格的数据保护措施,确保敏感信息的安全性。此外,AnyParser Pro支持无缝企业集成,兼容多种工作流和平台,为用户提供高效、便捷的文档处理体验,帮助企业显著提升工作效率和数据利用能力。

投融资

智平方宣布完成Pre-A轮融资

https://mp.weixin.qq.com/s/NGG2SjnMrKHql4Ps9a-3Tg

智平方近期在具身智能领域取得了重要突破。其国产具身大模型在通用空间感知和泛化操作方面超越了硅谷顶尖模型,推动了中国自主可控的物理世界大模型和机器人技术的发展。智平方的软件产品,如AI2R Brain和Alpha Bot机器人,已经获得了客户的积极认可。这一成绩的背后是强大的资本支持,智平方在2025年初完成了数亿元的Pre-A轮战略融资,由达晨财智和敦鸿资产领投基石资本跟投,标志着具身智能产业化的进一步加速。

智平方由国家级创新人才郭彦东博士创立,郭博士拥有深厚的AI学术背景和产业经验,曾在微软、小鹏汽车和OPPO担任重要职务,主导了多款智能终端的研发。团队成员来自微软、小鹏、OPPO、Momenta等国际知名企业和学术机构,如清华大学和加州伯克利大学,具备强大的技术创新能力和产业化经验。团队结合AI创新与智能终端领域的变革,构建了从原理研发到市场落地的完整闭环能力。

在技术方面,智平方率先突破了空间感知模型的瓶颈,其原创模型结构与增量技术节约了训练成本,并获得了国家级认证。智平方的端到端具身大模型,特别是在RoboMamba和Alpha Bot系列产品中取得了显著进展,尤其在未见任务的泛化能力上超越了国际顶尖企业如Google。智平方的产品如Alpha Bot 1S,在多任务场景中具备高度灵活性和超长续航,成功应用于柔性工业、物料搬运等领域,获得了大量商业订单,成为国内首批进行具身智能商业化的公司之一。

学习

GPU矩阵乘法的性能一致性与异常定位

https://zhuanlan.zhihu.com/p/15886327275

在GPU上,矩阵乘法(GEMM)的实际计算性能通常低于理论性能,这篇文章通过使用MFU(ModelFlops Utilization)来量化实际FLOPS与理论FLOPS的比值,并介绍了一套基于MFU的GEMM性能一致性规则。这些规则帮助自动检测出不同GPU和软件环境下的性能异常,尤其是在矩阵shape、量化策略和版本升级等因素的影响下。文章重点讨论了三种实际中的性能异常案例:RTX4090的float16计算性能下降、A800上某些矩阵shape的计算效率异常低下,以及Marlin量化策略在batch过大时性能不佳。

首先,文章探讨了MFU与矩阵shape的关系,认为在矩阵A的shape大于B时,A的MFU应该与B相当或更高。实验表明,在RTX4090上,部分batch的MFU显著低于预期,且这类异常batch占到总数的35%左右。通过将矩阵拆分为较小的子矩阵进行计算(splitwise GEMM),在某些情况下能显著提高性能。例如,在A800上,拆分矩阵后GEMM的计算时间显著减少。

接着,文章讨论了量化计算的MFU一致性,特别是在int8和int4量化方式下,GPU的性能表现有所不同。对于小batch的int8/int4量化,GPU的性能通常较好,但随着batch增大,性能受限于显存带宽,导致其计算时间与float16接近甚至增加。Marlin作为一种weight-only量化方法,其在小batch下的解码性能加速显著,但在大batch下则表现不如预期,甚至存在40%以上的性能损失。

本期AI产品合集:
AnyParser Pro 功能强大的多语言解析工具

AnyParser Pro是一款功能强大的多语言解析工具,专为满足现代企业需求而设计它能够高效处理各类文档和图像,包括PDF、Word、PPT和复杂的图片文件,精准提取文本、表格和图表等关键信息。借助先进的AI技术,AnyParser Pro提供卓越的解析精度,无论是复杂格式还是语言内容,都能轻松应对。产品在设计过程中始终将客户隐私置于首位,采用严格的数据保护措施,确保敏感信息的安全性。此外,AnyParser Pro支持无缝企业集成,兼容多种工作流和平台,为用户提供高效、便捷的文档处理体验,帮助企业显著提升工作效率和数据利用能力。

Sitelifter AI 驱动的工具 优化网页设计工具

Sitelifter 是一款由 AI驱动的工具,专注于帮助用户优化网站页面的设计、内容信息传递、用户流畅度以及转化率表现。通过深入分析目标受众需求,Sitelifter 提供定制化的可操作建议,帮助用户在网站开发和运营的早期阶段减少错误,避免反复试验所带来的浪费。同时,它通过精准的数据分析和优化方案,使网站性能得到显著提升帮助企业实现更高效的数字化运营,无需依赖经验或猜测即可获得专业结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/503606.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【STM32+CubeMX】 新建一个工程(STM32F407)

相关文章: 【HAL库】 STM32CubeMX 教程 1 --- 下载、安装 目录 第一部分、新建工程 第二部分、工程文件解释 第三部分、编译验证工程 友情约定:本系列的前五篇,为了方便新手玩家熟悉CubeMX、Keil的使用,会详细地截图每一步Cu…

HTML5实现喜庆的新年快乐网页源码

HTML5实现喜庆的新年快乐网页源码 前言一、设计来源1.1 主界面1.2 关于新年界面1.3 新年庆祝活动界面1.4 新年活动组织界面1.5 新年祝福订阅界面1.6 联系我们界面 二、效果和源码2.1 动态效果2.2 源代码 源码下载结束语 HTML5实现喜庆的新年快乐网页源码,春节新年网…

鸿蒙的APP真机调试以及发布

目录: 1、创建好鸿蒙项目2、创建AGC项目3、实现自动签名3.1、手动方式创建签名文件和密码 4、运行项目5、无线真机调试 1、创建好鸿蒙项目 2、创建AGC项目 (1)在File->Project Structure->Project->Signing Configs中进行登录。(未…

概率基本概念 --- 离散型随机变量实例

条件概率&独立事件 随机变量 - 离散型随机变量 - 非离散型随机变量 连续型随机变量奇异性型随机变量 概率表示 概率分布函数概率密度函数概率质量函数全概率公式贝叶斯公式 概率计算 数学期望方差协方差 计算实例 假设有两个离散型随机变量X和Y,它们代…

【Linux】Linux指令apt、systemctl、软链接、日期时区

一、apt命令 1.1 Linux系统的应用商店 操作系统安装软件有许多种方式,一般分为: 下载安装包自行安装 如win系统使用exe文件、msi文件等如mac系统使用dmg文件、pkg文件等 系统的应用商店内安装 如win系统有Microsoft Store商店如mac系统有AppStore商…

OSI模型的网络层中产生拥塞的主要原因?

( 1 )缓冲区容量有限;( 1.5 分) ( 2 )传输线路的带宽有限;( 1.5 分) ( 3 )网络结点的处理能力有限;( 1 分…

C++list

1. list的介绍及使用 1.1list的介绍 list的文档介绍 1.list是可以在常数范围内在任意位置进行插入和删除的序列式容器,并且该容器可以前后双相迭代 2.list的底层是双向链表结构,双向链表中每个元素存储在互不相关的独立节点中,在节点中通过…

Java 日期时间格式化标准

文章目录 Java日期时间格式化符号ISO 8601中的日期时间ISO 8601标准的定义ISO 8601日期时间格式 周数年份ISO 8601中的周数年份Java中的周数年份 Java跨年日期格式化BUG注意事项 Java日期时间格式化符号 JDK官网截图: 格式化符号梳理: 符号描述符号用…

【计算机视觉】单目深度估计模型-Depth Anything-V2

概述 本篇将简单介绍Depth Anything V2单目深度估计模型,该模型旨在解决现有的深度估计模型在处理复杂场景、透明或反射物体时的性能限制。与前一代模型相比,V2版本通过采用合成图像训练、增加教师模型容量,并利用大规模伪标签现实数据进行学…

如何在Windows上编译OpenCV4.7.0

前言 ​ 参考:Win10 下编译 OpenCV 4.7.0详细全过程,包含xfeatures2d 这里在其基础上还出现了一些问题,仅供参考。 正文 一、环境 1、win10 2、cmake-gui 3、opencv4.7.0 4、VS2019 二、编译过程 1、下载需要的文件: 通…

ros2-4.1 服务通信介绍

服务是ROS图中节点之间的另一种通信方法。服务分为客户端和服务端,客户端发送请求给服务端,服务端可以根据客户端的请求做一些处理,然后返回结果给客户端。也称为为请求-响应模型。 服务和话题的不同之处,话题是没有返回的&#…

代码随想录算法训练营第四十天 | 股票问题

LeetCode 121.买卖股票的最佳时机&#xff1a; 文章链接 题目链接&#xff1a;121.买卖股票的最佳时机 思路 方法1&#xff1a;暴力 看到题目最直接的想法是双层遍历求最大区间差 class Solution:def maxProfit(self, prices):if len(prices) < 1:return 0result 0for…

EyeSoothe: Your Ultimate Eye Health Companion

In today’s screen-dominated world, our eyes deserve extra care. EyeSoothe is the ultimate app for anyone looking to track their vision, rejuvenate tired eyes, and find the perfect eyewear—all powered by intelligent AI and packed into one seamless app. h…

AnaConda下载PyTorch慢的解决办法

使用Conda下载比较慢&#xff0c;改为pip下载 复制下载链接到迅雷下载 激活虚拟环境&#xff0c;安装whl&#xff0c;即可安装成功 pip install D:\openai.wiki\ChatGLM2-6B\torch-2.4.1cu121-cp38-cp38-win_amd64.whl

【python】matplotlib(radar chart)

文章目录 1、功能描述和原理介绍2、代码实现3、效果展示4、完整代码5、多个雷达图绘制在一张图上6、参考 1、功能描述和原理介绍 基于 matplotlib 实现雷达图的绘制 一、雷达图的基本概念 雷达图&#xff08;Radar Chart&#xff09;&#xff0c;也被称为蛛网图或星型图&…

鸿蒙APP之从开发到发布的一点心得

引言&#xff1a; 做鸿蒙开发大概有1年左右时间了&#xff0c;从最开始的看官方文档、看B站视频&#xff0c;到后来成功发布两款个人APP&#xff08;房贷计算极简版、时简时钟 轻喷&#xff0c;谢谢&#xff09;。简单描述一下里边遇到的坑以及一些经历吧。 学习鸿蒙开发 个…

Clisoft SOS与CAD系统集成

Clisoft SOS与CAD系统集成 以下内容大部分来自官方文档&#xff0c;目前只用到与Cadence Virtuoso集成&#xff0c;其他还未用到&#xff0c;如有问题或相关建议&#xff0c;可以留言。 与Keysight ADS集成 更新SOS客户端配置文件sos.cfg&#xff0c;以包含支持ADS的模板&am…

IP查询于访问控制保护你我安全

IP地址查询 查询方法&#xff1a; 命令行工具&#xff1a; ①在Windows系统中&#xff0c;我们可以使用命令提示符&#xff08;WINR&#xff09;查询IP地址&#xff0c;在弹窗中输入“ipconfig”命令查看本地网络适配器的IP地址等配置信息&#xff1b; ②在Linux系统中&…

人工智能训练师一级(高级技师)、二级(技师)考试指南

随着经济快速发展&#xff0c;人工智能技术在制造业、交通运输、农业、医疗健康、金融服务、物流配送以及城市服务等多个领域得到了广泛的应用。不仅带来产业的转型升级&#xff0c;更是对具备相应技能的人工智能训练师需求的激增。 根据教育部发布的《关于做好职业教育“…

ArmSoM RK3588/RK3576核心板,开发板网络设置

ArmSoM系列产品都搭配了以太网口或WIFI模块&#xff0c;PCIE转以太网模块、 USB转以太网模块等&#xff0c;这样我们的网络需求就不止是上网这么简单了&#xff0c;可以衍生出多种不同的玩法。 1. 网络连接​ 连接互联网或者组成局域网都需要满足一个前提–设备需要获取到ip&a…