Cyber Weekly #41

赛博·新闻

1、豆包大模型1.5Pro正式发布

1月22日,豆包大模型1.5Pro在模型能力、多模态能力、推理能力上进行了全面升级。该模型使用MoE架构,通过训练-推理一体化设计,在较小激活参数下达到一流超大稠密预训练模型的性能,并在多个评测基准上取得优异成绩。团队构建了高度自主的数据生产体系,确保数据来源的独立性和可靠性。Doubao-1.5-pro已在豆包APP灰度上线,并在火山引擎提供API调用。模型在视觉和语音多模态能力上进行了技术升级,提升了模型在视觉推理、文字文档识别等方面的能力,并提出了全新的Speech2Speech端到端框架,实现了语音对话中的语音理解生成端到端。

2、DeepSeek-R1发布,性能对标OpenAIo1正式版

1月20日,深度求索公司发布DeepSeek-R1模型,此是一个性能对标OpenAI o1正式版的AI模型,它在后训练阶段大规模使用了强化学习技术,在极少标注数据的情况下极大提升了模型推理能力。DeepSeek-R1遵循MITLicense,允许用户通过蒸馏技术训练其他模型,并已上线API,对用户开放思维链输出。此外,DeepSeek-R1训练技术全部公开,以促进技术社区的交流与协作。同时,DeepSeek-R1通过输出蒸馏了6个小模型开源给社区,其中32B和70B模型在多项能力上实现了对标OpenAIo1-mini的效果。DeepSeek-R1的API服务定价为每百万输入tokens1元(缓存命中)/4元(缓存未命中),每百万输出tokens16元。


 

3、k1.5新模型登场

同样在1月20日,就在DeepSeek-R1模型发布后不久,月之暗面发布了k1.5多模态思考模型,这是继k0-math数学模型和k1视觉思考模型之后的又一次升级。k1.5在short-CoT模式下大幅超越了全球范围内短思考SOTA模型的水平,在long-CoT模式下达到了OpenAI o1正式版的水平。Kimi技术团队还首次准备了详细的技术报告,分享了模型训练技术探索之路。k1.5模型在文本和视觉数据上联合训练,具有联合推理两种模态的能力,并提出了有效的long2short方法,利用Long-CoT技术来改进Short-CoT模型,在短链思维推理方面取得了SOTA成绩。k1.5多模态思考模型的预览版将陆续灰度上线Kimi.com网站和最新版本的Kimi智能助手app。

4、百川智能发布国内首个全场景深度思考模型

1月24日,百川智能推出了国内首个全场景深度思考模型Baichuan-M1-preview,该模型在语言推理、视觉推理和搜索推理三个维度上具备全面推理能力,并在多个领域的主流评测集上表现出众。Baichuan-M1-preview在数学基准测试和代码任务上超越了o1-preview等模型,在视觉推理能力评测中超越了GPT-4o等模型。该模型已在百小应App中上线,展现出在学术研究、软件开发、医疗健康方面的独特优势,特别是在医疗领域,能够进行深度思考,构建严谨的医学推理过程,并保证信息的准确性。百川智能自建了亿级条目的循证医学知识库,并运用医学知识和证据评估标准对证据进行多层分级,提升大模型进行医疗推理的可靠性。此外,百川智能开源了Baichuan-M1-14B模型,作为行业首个医疗增强开源模型,在多个权威医学知识和临床能力评测上表现优异。

5、阶跃星辰旗下跃问App推出「AI创意板」

1月24日,跃问App最新上线的「创意板」功能,允许用户通过简单的语音指令创建应用和游戏,无需任何编程知识。用户可以生成海报图片、趣味游戏、互动网页、可视化图表等,并且可以分享到任意平台。创意板是国内首个提供应用与游戏生成功能的平台,背后由阶跃星辰自研的多模态大模型提供技术支持。该功能不仅简化了应用开发过程,还极大地降低了技术门槛,使得创意和想象力得以在普通用户指尖轻松实现。


 

6、OpenAI发布智能体Operator

1月24日,OpenAI发布了名为Operator的智能体,这是一个研究预览版本的agent,能够访问互联网并为用户自动执行各种任务。Operator由名为“计算机使用智能体”(CUA)的新模型提供支持,结合了GPT-4o的视觉功能和通过强化学习获得的高级推理能力,能够与图形用户界面(GUI)进行交互。Operator可以查看和交互浏览器,无需自定义API集成即可在Web上采取行动,并具备自我纠正的推理能力。目前,Operator仅供美国Pro用户使用,并计划很快集成到ChatGPT中。

赛博·洞见

1、请回答2025:35位大模型创业者一致看好智能体爆发|甲子光年

甲子光年撰写,文章汇总了35位大模型创业者对2024年的回顾和2025年的预测。2024年被视为大模型市场变化的一年,而2025年被普遍看好为智能体爆发的一年。创业者们从AI Coding、AI视频生成、AI3D生成、AI写作与虚拟角色创作等多个细分领域分享了他们的见解。他们普遍认为AI将作为一种基础设施无处不在,并特别强调了多模态交互、智能体的广泛应用、AI技术的全民化以及AI在各行业的融合。文章中,每位创业者都分享了他们的“Magic Moment”以及对2025年最期待的AI应用或趋势,展现了AI技术快速发展和广泛应用的前景。

2、10天硅谷行,我看到了这些趋势

文章记录了作者在硅谷10天的观察和交流,发现硅谷依然是人才、资本和创新的聚集地,AI时代的到来让信息流动加速,创造了更多机会。AI创业门槛相对较高,从业者对学术研究的关注度可能是历史最高。尽管AI基础设施的完善降低了创业门槛,但AI与机器人结合的数据闭环尚未找到可靠路径。中国在机器人供应链方面具有明显优势。2025年的主要投资机会在AI应用领域,AI公司一旦找到产品市场契合点,收入增长会非常快。AI也让硬件和软件强行绑定,商业模式开始发生改变。

3、Decagon:用AIAgent解放客服团队,能否成为下一个独角兽?

Decagon是一家专注于AI for Customer Support领域的公司,旨在通过AIAgent彻底改变客户服务体验。公司由Jesse Zhang和Ashwin Sreenivas创立于2023年,通过打造能够理解客户需求并高效解决问题的AI Agent引擎,致力于解决企业复杂的客户支持问题。Decagon的客户包括多家中小型科技公司,公司在2024年10月完成了6500万美元的B轮融资。文章通过访谈Decagon创始人Jesse Zhang,深入探讨了AI如何重塑客户服务,包括AI Agent如何提升效率、降低成本,语音交互的技术挑战,多模态AI的未来趋势,以及数学竞赛背景对AI创业的影响。Decagon的差异化优势在于其AI Agent的高透明度和应用效果的可观测性,使其在客户评估中表现出色。Decagon的技术架构包括协调层和定制化模型,以及透明度工具和分析功能。Jesse认为,未来人类与AI Agent的协作模式将发生巨大变化,AI Agent将帮助企业提升效率和客户满意度。

4、DeepSeek-R1论文速读

DeepSeek-R1系列是DeepSeek团队最新开源的推理模型,其性能已比肩OpenAI-o1-1217,位于第一梯队。该系列不依赖传统的SFT(Supervised Fine-Tuning),而是通过大规模强化学习(RL)显著提升推理能力。DeepSeek-R1-Zero直接进行RL,而DeepSeek-R1则在RL前加入少量CoT数据进行SFT作为冷启动,以提高性能和输出的人类偏好符合度。实验结果显示,DeepSeek-R1在多个基准测试中表现优异,与OpenAI-o1-1217相当。此外,使用DeepSeek-R1的样本对小模型进行蒸馏也能取得惊人效果。

5、可灵视频生成可控性为什么这么好?快手又公开了四篇研究

快手公司的可灵团队在视频生成领域取得了显著的技术进步,通过四项研究提升了视频生成的可控性。这些研究包括三维空间控制的SynCam Master、运动轨迹控制的3DTraj Master、内容风格控制的Style Master和交互控制的Game Factory。这些技术通过更好地理解和整合多模态用户意图,降低了视频生成的“抽卡率”,使得AI视频创作更加精确、可控且易用。SynCam Master实现了高质量的多机位同步视频生成,3DTraj Master让创作者能在三维空间中直观地规划和精确地控制物体运动轨迹,Style Master确保了生成视频在保持时间连贯性的同时,能够统一呈现特定的艺术风格,而Game Factory使用少量MineCraft动作数据就能实现交互式游戏体验。这些研究成果展现了可灵在视频生成领域的系统性探索,推动着视频生成领域走向更远的未来。

6、AI眼镜爆火!中国六大门派围攻Meta,真正大BOSS还未进场

文章分析了AI眼镜市场的增长预测、技术挑战、市场潜力以及各大厂商的竞争态势。预计到2026年,AI眼镜出货量将突破1000万,成为消费电子产业的新热点。文章指出,尽管AI眼镜市场增长迅速,但面临诸多技术和体验上的挑战,如供应链方案难以满足及格标准、AI模型的实时性和准确性问题等。同时,文章强调了AI眼镜在数据收集和AI交互层面的潜力,以及手机厂商可能在这一领域的优势。最后,文章提出,尽管AI眼镜站在风口上,但其能否真正起飞还需时间验证。

7、跟硅谷的核心AI公司聊完后,得到了这60条关键洞察

文章通过与硅谷核心AI公司的交流,整理出60条关键洞察,覆盖了LLM的发展、视频模型的挑战、具身智能的局限、AI应用的趋势和AI Coding的技术进展。文章指出LLM的Pre-training阶段已接近瓶颈,未来机会在Post-training中。视频模型的Scaling Law尚未达到LLM级别,具身智能尚未迎来类似ChatGPT的关键时刻。硅谷VC认为2025年是AI应用投资大年,AI产品公司被视为新物种。AI Coding领域的重要趋势是推理增强技术,GitHub Copilot被视为主要竞争对手。

赛博·工具

1、uiset

共收集95个免费优质的UI资源,包括插图、图标、颜色、图案、头像、表情、美化等领域的项目。

2、BlogKeeper-文捕

在线博客文章解析下载工具,支持微信公众号/博客园/CSDN/掘金/简书/思否等平台,可以保存成多种格式。

赛博·资源

1、QuestMobile2024年AIGC应用发展年度报告

QuestMobile的年度报告指出,截至2024年12月,AI原生APP的月度活跃用户已超过1.2亿,同比增长232%,用户粘性增强,月人均使用时长达133.0分钟,使用次数为49.6次。AI原生APP赛道已形成“三强争霸”格局,豆包、Kimi、文小言月活跃用户规模分别为7523万、2101万、1224万。垂类AI原生APP赛道尚未出现千万级应用,但社交类“星野”、“猫箱”等位居前列。AI插件、智能手机内AI智能助手、智能硬件唤醒AI软件等全面开花,预计2025年将迎来更多爆点。962个传统APP备案了“深度合成算法”,教育学习、拍摄美化等行业位居前五。智能体数量已超过小程序,仅次于APP,预计2025年智能体数量将迎来爆发。AI技术的发展正推动传统APP的升级与重构,智能体产业链已形成,智能体的商业化落地主要分为直接收费及为其他品牌引流两种模式。

2、2025具身智能行业发展研究报告(关注公众号【产品老A】回复【2025具身智能行业发展研究报告】下载)

由甲子光年智库出品,全面分析了具身智能的发展背景、现状、应用场景和代表厂商、发展挑战与技术趋势。报告指出,具身智能作为新质生产力的关键内涵,是推动新质生产力建设的重要引擎,有望解决劳动力短缺、社会老龄化等问题,并推动全社会生产关系的改变与重塑。报告强调中国在具身智能领域已经走在国际前列,得益于市场需求、政策支持、产业集群效应、人才和创业生态等多方面因素。同时,报告也讨论了具身智能技术在工业、服务、特种应用等场景的应用潜力和挑战,以及未来发展趋势。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/8233.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

idea对jar包内容进行反编译

1.先安装一下这个插件java Bytecode Decompiler 2.找到这个插件的路径,在idea的plugins下面的lib文件夹内:java-decompiler.jar。下面是我自己本地的插件路径,以作参考: D:\dev\utils\idea\IntelliJ IDEA 2020.1.3\plugins\java-d…

LLM幻觉(Hallucination)缓解技术综述与展望

LLMs 中的幻觉问题(LLM 幻觉:现象剖析、影响与应对策略)对其可靠性与实用性构成了严重威胁。幻觉现象表现为模型生成的内容与事实严重不符,在医疗、金融、法律等对准确性要求极高的关键领域,可能引发误导性后果&#x…

苍穹外卖-day06

[!IMPORTANT] HttpClient 是什么?它的作用是什么?在微信登录流程中,code 是什么?它的作用是什么?微信登录的具体步骤有哪些?在微信登录流程中,token 的作用是什么?在微信登录中&…

Jetson Xavier NX (ARM) 使用 PyTorch 安装 Open3D-ML 指南

由于 Jetson 为 ARM64 (aarch64) 的系统架构,所以不能用 pip install 直接安装,需要通过源码编译。 升级系统 JetPack 由于 Open3D-ML 目前只支持 CUDA 10.0 以及 CUDA 11.*,并且 JetPack 的 CUDA 开发环境只有10.2、11.4以及12.2&#xff0…

Juc22_什么是中断、interrupt、isInterrupted、interrupted方法源码解析、如何使用中断标识停止线程

目录 ①. 什么是中断 ②. 源码解读(中断的相关API) ③. 如何使用中断标识停止线程 ①. 什么是中断 ①. 一个线程不应该由其他线程来强制中断或停止,而是应该由线程自己自行停止,所以,Thread.stop、Thread.suspend、Thread. resume都已经被废弃了 ②. 在Java中没有办法立即停止…

AI赋能医疗:智慧医疗系统源码与互联网医院APP的核心技术剖析

本篇文章,笔者将深入剖析智慧医疗系统的源码架构以及互联网医院APP背后的核心技术,探讨其在医疗行业中的应用价值。 一、智慧医疗系统的核心架构 智慧医疗系统是一个高度集成的信息化平台,主要涵盖数据采集、智能分析、决策支持、远程医疗等…

mongoDB常见指令

即使我们自己开发用不到mongoDB,但是接手别人项目的时候,别人如果用了,我们也要会简单调试一下 虽然mongoDB用的不是sql语句,但语句的逻辑都是相似的,比如查看数据库、数据表,增删改查这些 我们下面以doc…

K8S部署DevOps自动化运维平台

持续集成(CI) 持续集成强调开发人员提交了新代码之后,立刻自动的进行构建、(单元)测试。根据测试结果,我 们可以确定新代码和原有代码能否正确地集成在一起。持续集成过程中很重视自动化测试验证结果&#…

SpringCloud系列教程:微服务的未来(十七)监听Nacos配置变更、更新路由、实现动态路由

前言 在微服务架构中,API 网关是各个服务之间的入口点,承担着路由、负载均衡、安全认证等重要功能。为了实现动态的路由配置管理,通常需要通过中心化的配置管理系统来实现灵活的路由更新,而无需重启网关服务。Nacos 作为一个开源…

Lua 环境的安装

1.安装Lua运行环境 本人采用的是在windows系统中使用cmd指令方式进行安装,安装指令如下: winget install "lua for windows" 也曾使用可执行程序安装过,但由于电脑是加密电脑,最后都已失败告终。使用此方式安装可以安…

03-画P封装(制作2D+添加3D)

画P封装的方法2D制作3D添加 使用P封装自己画0603格式的电阻的P封装1. 看规格书,找参数2. 创建一个新的P封装3. 灯泡两侧放焊盘4.设置焊盘大小和形状5.根据坐标定义中间间隔: L/2原则6. 画最外层丝印(丝印层直接围住即可)7.在平面的P封装上,添加3D立体封装库 立创商城下载P封装向…

libOnvif通过组播不能发现相机

使用libOnvif库OnvifDiscoveryClient类, auto discovery new OnvifDiscoveryClient(QUrl(“soap.udp://239.255.255.250:3702”), cb.Build()); 会有错误: end of file or no input: message transfer interrupted or timed out(30 sec max recv delay)…

高德开放平台:红绿灯倒计时与车车协同安全预警,开启出行新时代

近期,有幸参加了“高德开放平台第二期开发者开放日”。这次活动不仅有机会近距离了解高德地图的前沿技术动态和最新产品,还看到了高德开放平台在各个行业中的广泛应用。高德展厅里,每一处展示都让人感到震撼,仿佛置身于一个充满无…

C语言------指针从入门到精通

第一部分: 前言: 本篇文章主要划分为两大部分: 第一部分适合零基础的同学,主要学习了解指针的概念,对指针大概有个概念。如果你已经有基础,即可跳过第一部分的内容。 第二部分主要是分解指针的实现逻辑,通过19个例子,再结合代码公式把不同类型的指针及指针的应用详细…

JavaScript赋能智能网页设计

构建AI驱动的实时风格迁移系统 案例概述 本案例将实现一个基于深度学习的实时图像风格迁移系统,通过浏览器端神经网络推理实现以下高级特性: WebAssembly加速的ONNX模型推理 WebGL Shader实现的风格混合算法 WebRTC实时视频流处理 基于Web Workers的…

‌Windows系统cmd命令行创建vue项目

Windows系统cmd命令行创建vue项目 首先确保node.js已安装(也就是JavaScript运行时环境已安装)找到我们要创建项目的文件夹 直接在路径上输入cmd 按Enter(回车键)后,弹出命令行窗口在命令行窗口输入npm init vuelatest,执行该命令,将会安装并执行Vue项目…

[C语言日寄]exit函数的使用及其拓展

【作者主页】siy2333 【专栏介绍】⌈c语言日寄⌋:这是一个专注于C语言刷题的专栏,精选题目,搭配详细题解、拓展算法。从基础语法到复杂算法,题目涉及的知识点全面覆盖,助力你系统提升。无论你是初学者,还是…

GestureDetector组件的功能与用法

文章目录 1 概念介绍2 使用方法3 示例代码 我们在上一章回中介绍了ListView响应事件的内容,本章回中将介绍GestureDetector Widget.闲话休提,让我们一起Talk Flutter吧。 1 概念介绍 我们在这里介绍的GestureDetector是一个事件响应Widget,它可以响应双击事件&…

Java Web-Cookie与Session

会话跟踪技术 会话跟踪技术是一种在 Web 应用程序中跟踪用户会话状态的机制,它允许服务器在多个请求之间识别和关联属于同一用户的请求,以便在整个会话过程中保持用户相关的信息。以下是几种常见的会话跟踪技术: Cookie 概念:Cook…

线性回归、协同过滤、基于内容过滤、主成分分析(PCA)

线性回归 使用item特征用户打分标签线性回归训练,最小化成本函数,得到每个用户的参数 协同过滤 协同过滤基于一个核心假设:相似的用户会有相似的兴趣,因此可以通过分析相似用户历史行为,来预测当前用户可能感兴趣的i…