微软Copilot+ PC:Phi-Silica

大模型技术论文不断,每个月总会新增上千篇。本专栏精选论文重点解读,主题还是围绕着行业实践和工程量产。若在某个环节出现卡点,可以回到大模型必备腔调重新阅读。而最新科技(Mamba,xLSTM,KAN)则提供了大模型领域最新技术跟踪。若对于如果构建生成级别的AI架构则可以关注AI架构设计专栏。技术宅麻烦死磕LLM背后的基础模型。

Phi-3-Silica

昨日微软宣布推出一种新的、更微型的小语言模型 (SLM) Phi-3-Silica,专为Copilot+ PC设计。Copilot+ PC本身配备强大神经处理单元 (NPU) 的个人计算机,能够应付AI计算。基于Windows的Phi-3-Silica仅仅拥有3B参数,是Phi-3系列中最小的。

Phi-3的特点显著:

  • 快速高效:以每秒 650 个令牌的速度处理信息,低功耗(1.5 瓦)。

  • 利用 NPU:Phi-3-Silica利用NPU执行特定任务,从而释放PC的其他计算资源。

  • 支持本地部署:Phi-3-Silica直接在Copilot+ PC上运行,无需依赖互联网连接,从而可能提高隐私性和响应能力。

  • 生态开放:三方开发人员可以利用 Phi-3-Silica为Windows生态系统创建新颖且用户友好的应用程序。

  • 增强体验:Phi-3-Silica和Copilot+ PC的动态组合有望彻底改变用户工作习惯与提升效率。

值得一提的是微软提供了有关Windows Copilot运行时的具体工作原理。该运行时包括一个 API 库,开发人员可以利用这些 API 来开发应用程序,并提供 AI 框架和工具链,供开发人员在 Windows 上发布自己的模型。

“Windows Copilot 库由随时可用的 AI API 组成,例如 Studio Effects、实时字幕翻译、OCR、Recall with User Activity 和 Phi Silica,这些 API 将于 6 月向开发人员提供,”Windows 和 Surface 主管 Pavan Davuluri 解释道。

开发人员将能够使用Windows Copilot库将Studio Effects、滤镜、肖像模糊和其他功能集成到他们的应用程序中。Meta正在将Windows Studio效果添加到WhatsApp中,这样您就可以在视频通话期间获得背景模糊和目光接触等功能。即使是实时字幕和新的人工智能翻译功能也可以被开发人员使用,几乎不需要任何代码。

微软昨天展示了其Recall AI 功能,允许 Copilot Plus PC记录和存储用户在 PC 上所做的一切,以便您可以回忆记忆并通过时间线进行搜索。这一切都由一个新的 Windows 语义索引提供支持,该索引于本地存储。

Davuluri 表示:“我们将为使用 Vector Embeddings API 的开发人员提供此功能,以便他们在自己的应用程序中以及应用程序数据中构建自己的矢量存储和 RAG。”

功能场景

Phi-Silica轻量且能够高效在设备上运行,基于其的应用可以提高PC的生产力、改善用户体验和隐私保护。

  • 功能有限的离线语音助手:在本地执行基本语音命令或回答简单问题,无需将数据发送到云端。

  • 设备上的情绪分析:在本地分析电子邮件或文档的语气,以在不损害隐私的情况下获得见解。

  • 安全语音搜索:使用完全在设备上处理的语音命令在本地文件或数据库中进行搜索。

  • 为视障用户提供文本到语音转换:Phi-Silica 可以大声朗读网页或文档上的文本,从而增强视障用户的可访问性。

  • 音频和视频实时字幕:无需访问互联网即可生成媒体文件字幕,从而提高聋哑或听力障碍用户的可访问性。

  • 个性化的语言学习工具:Phi-Silica 可以在学习应用程序中提供词汇建议或实时翻译等功能,为设备上的语言学习提供帮助。

  • 实时语言翻译:无需互联网连接即可即时翻译文档、标题或对话。

  • 离线理解:即使在没有网络的情况下也能保证正确书写或在本地总结长文档或文章,让用户快速掌握要点。

  • 智能听写和语音识别:Phi-Silica 可以为听写软件提供支持,该软件可以理解上下文并在本地纠正错误,从而提高准确性和速度。

后话

Phi Silica从Phi-3-mini(3.8B )、Phi-3-small(7B )、Phi-3-medium(14B )以及最近推出的宣布Phi-3-vision(4.2B)中脱颖而出,成为首个登录Windows最先进SLM,标志着将 AI 功能直接带给最终用户。

Phi Silica的推出紧随微软 Copilot+ PC发布之后,该发布承诺提供配备专用 AI 处理器的 Windows PC。首批 Copilot+ PC 将于 6 月中旬上市,将采用高通基于 Arm 的Snapdragon X Elite和Plus芯片。微软和主要 PC 制造商预计将在整个夏季推出这些支持 AI 的笔记本电脑。英特尔也在开发自身的Copilot+ PC 理器,代号为Lunar Lake,计划于 2024 年第三季度发布。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/334435.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

视创云展「VR直播」是什么?有哪些功能和应用场景?

视创云展「VR直播」通过“3D沉浸式展厅直播高互动感”的创新玩法,使企业随时随地举办一场低成本、高互动、能获客的元宇宙直播活动成为可能。「VR直播」能实现3D展厅内VR场景漫游,更结合音视频交互、同屏互动等新功能,为用户带来更沉浸的虚拟…

[nextjs]推荐几个很好看的模板网站

最近在做网站,折腾了 vue 框架,然后发现了 nextjs 框架,感觉这个做出来的网站配色很好看,然后又开始研究这个 网站配色好看是因为用的 tailwindcss,找网站过程中,发现了几个很好看的模板网站,在这里推荐下,或许你也能用得上 推荐第一个网站是: https://tailspark.co/ 有组件,也…

fastadmin 树状菜单展开,合并;简要文件管理系统界面设计与实现

一,菜单合并效果图 源文件参考:fastadmin 子级菜单展开合并、分类父级归纳 - FastAdmin问答社区 php服务端: public function _initialize() {parent::_initialize();$this->model new \app\admin\model\auth\Filetype;$this->admin…

【PROXYCHAINS】Kali Linux 上配置NAT PROXYCHAINS保姆级教程

kali linux配置agent 在博主配置kali 的时候遇到了一些小问题,主要就是连接一直报错超时。 方法一:优点:免费,但是agent很不稳定 搜索免费ip,在Google搜索free proxy list 检查可用ip 连接成功 cd /etcls |grep redsnano reds…

检索模型预训练方法:RetroMAE

论文title:https://arxiv.org/pdf/2205.12035RetroMAE: Pre-Training Retrieval-oriented Language Models Via Masked Auto-Encoder 论文链接:https://arxiv.org/pdf/2205.12035 摘要 1.一种新的MAE工作流,编码器和解器输入进行了不同的掩…

go语言初识别(五)

本博客内容涉及到:切片 切片 1. 切片的概念 首先先对数组进行一下回顾: 数组定义完,长度是固定的,例如: var num [5]int [5]int{1,2,3,4,5}定义的num数组长度是5,表示只能存储5个整形数字&#xff0c…

SCI一区 | Matlab实现PSO-TCN-LSTM-Attention粒子群算法优化时间卷积长短期记忆神经网络融合注意力机制多变量时间序列预测

SCI一区 | Matlab实现PSO-TCN-LSTM-Attention粒子群算法优化时间卷积长短期记忆神经网络融合注意力机制多变量时间序列预测 目录 SCI一区 | Matlab实现PSO-TCN-LSTM-Attention粒子群算法优化时间卷积长短期记忆神经网络融合注意力机制多变量时间序列预测预测效果基本介绍程序设…

Docker 常用命令大全!!

Docker 常用命令 一、启动类1. 启动 docker2. 关闭 docker3. 重新启动 docker4. docker 设置自启动5. 查看 docker 运行状态6. 查看 docker 版本号等信息7. docker 帮助 二、 镜像类1. 查看镜像2. 搜索镜像3. 拉取镜像4. 运行镜像5. 删除镜像6. 加载镜像7. 保存镜像 三、容器类…

【css3】02-css3新特性之选择器篇

目录 1 属性选择器 2 结构伪类选择器 3 其他选择器 :target和::selection ::first-line和::first-letter 4 伪类和伪元素的区别 伪类(Pseudo-classes) 伪元素(Pseudo-elements) 伪类和伪元素的区别 1 属性选择器 ☞ 属性选…

BIO/NIO学习

在传送文件的时候常常出现这么一个问题,就是当客户端的文件全部传送完了之后,服务器没有接收到客户端那边传过的停止信号,所以服务器也就跟着客户端停止运行了,我们可以使用 try {socket.shutdownOutput();} catch (IOException e…

OrangePi AIpro开发板,使用了310B,昇腾310B较于昇腾310有何性能提升?

OrangePi AIpro开发板 他们对应的模组分别是:Atlas 200 AI和Atlas 200I A2 310:基本规格 - Atlas 200 AI加速模块 用户指南 14 - 华为 (huawei.com) 310B:基本规格 - Atlas 200I A2 加速模块 用户指南 04 - 华为 (huawei.com)

栈的特性及代码实现(C语言)

目录 栈的定义 栈的结构选取 链式储存结构和顺序栈储存结构的差异 栈的代码实现 "stack.h" "stack.c" 总结 栈的定义 栈:栈是限定仅在表尾进行插入和删除操作的线性表。 我们把运行插入的和删除的一段叫做栈顶(TOP&#xff…

vmware hostd占用443端口解决方法

原因:VMware 准备弃用的虚拟机共享功能,目前仍然存在该进程启动,并且占用443端口! 解决: 1.临时解决 在任务管理器中结束名为“VMware hostd”进程 2.永久生效 打开VMware ,编辑——首选项——共享虚拟机—…

鸿蒙ArkUI-X跨平台开发:【资源分类与访问】

资源分类与访问 应用开发过程中,经常需要用到颜色、字体、间距、图片等资源,在不同的设备或配置中,这些资源的值可能不同。 应用资源:借助资源文件能力,开发者在应用中自定义资源,自行管理这些资源在不同…

【NumPy】全面解析NumPy的bitwise_xor函数:高效按位异或操作指南

🧑 博主简介:阿里巴巴嵌入式技术专家,深耕嵌入式人工智能领域,具备多年的嵌入式硬件产品研发管理经验。 📒 博客介绍:分享嵌入式开发领域的相关知识、经验、思考和感悟,欢迎关注。提供嵌入式方向…

【全开源】二手车置换平台系统小程序(FastAdmin+ThinkPHP+Uniapp)

二手车置换平台系统 特色功能: 车辆评估:系统提供车辆状况、性能和价值的评估功能,通过拍照、上传图片等方式自动识别车辆信息并给出估价建议,帮助买家和卖家更准确地了解车辆价值。 在线交易:平台提供在线购车、售车…

二十九、openlayers官网示例DeclutterGroup解析——避免矢量图层的文字重叠

官网demo地址: Declutter Group 这篇说的是如何设置矢量图层上多数据点文字不重叠。 主要是属性declutter ,用于处理矢量图层上重叠的标注和符号,为true时启用去重叠功能。所有矢量特征的标注和符号都会被处理以避免重叠。false则与之相反。…

【从零开始学习RabbitMQ | 第二篇】如何确保MQ的可靠性和消费者可靠性

目录 前言: MQ可靠性: 数据持久化: Lazy Queue: 消费者可靠性: 消费者确认机制: 消费失败处理: MQ保证幂等性: 方法一: 总结: 前言: …

【UE5.1 角色练习】06-角色发射火球-part2

目录 效果 步骤 一、火球生命周期 二、添加可被伤害的NPC 三、添加冲量 在上一篇(【UE5.1 角色练习】06-角色发射火球-part1)基础上继续实现角色发射火球相关功能 效果 步骤 一、火球生命周期 为了防止火球没有命中任何物体而一直移动下去&#…

揭秘Tensor Core黑科技:如何让AI计算速度飞跃

揭秘 Tensor Core 底层:如何让AI计算速度飞跃 Tensor Core,加速深度学习计算的利器,专用于高效执行深度神经网络中的矩阵乘法和卷积运算,提升计算效率。 Tensor Core凭借混合精度计算与张量核心操作,大幅加速深度学习…