一图看懂!生成式AI 算法现状

截至2023年8月,在算法备案系统登记的相关算法已经有151个,我们可以观察到All in AI的中国公司布局生成式AI算法的现状。在这151个算法中,33.8%的生成合成式算法都集中在文本生成领域,而图像、多媒体和音频方向也是各家的主攻方向之一。

图片

图片来源:澎湃《AI狂飙的这一年,我们的工作被取代了多少?》 https://www.thepaper.cn/newsDetail_forward_25440475

可以看到腾讯、阿里、百度、字节、抖音、网易、金山、商汤、华为、京东、快手、美图、科大讯飞等25家互联网知名大厂是算法申报成功的主力,总共有104个算法通过备案,占比高达68.8%,平均每家企业成功申报4个算法备案。而35家互联网小厂,总共仅有47个算法通过备案,仅占比31.2%,平均每家企业只成功申报1.3个算法。而根据各大机构公布的AIGC产业图谱中,市场上已公开发布的近百家大模型和数百个AIGC应用,绝大部分都还未成功拿到算法备案号,或者还并未进行算法备案申请,也就是说仍在业务“裸奔”状态。

毫无疑问的是,无论你的产品服务形态是网页、App、小程序,只要涉及深度合成技术服务(文本、图片、音频、视频、虚拟现实等)都需要进行算法备案,接受监管,否则将会让自己的业务和用户置身于极大的不确定性中。那么如何避坑,博特智能AIGC安全实验室根据辅导20+算法的备案过程中,总结出以下避坑指南

图片

首先,充分理解算法备案的要求。《生成式人工智能服务管理暂行办法》、《互联网信息服务深度合成管理规定》、《互联网信息服务算法推荐管理规定》是进行算法备案的基础法规依据,必须认真阅读,从法规的视角来审视,避免自说自话,确保算法符合三个法律法规的要求。

第二,提交的内容完整准确。申报官网上提供的相应模板里面已经提出了超过200个应答点。需要备案人针对每个应答点做一一的响应和准确回答。如果填写不完整或存在错误缺失,都会影响备案的通过。

第三,数据安全问题,由于对数据安全考虑得不周密,例如备案中涉及到了一些训练数据是海外不安全的数据;或者选择的机构模型无法溯源说明它原始训练的数据安全;另外可能会涉及到侵犯个人权益商业版权的事情,没有去做充分的清洗和脱敏,例如有些客户训练数据会用到了一些像法律判决书。医疗诊断报告等等,建议脱敏和授权以后再去使用,否则很难通过。

第四,算法。提供透明的算法解释。模型输入输出策略点每一步该如何设计,需要以最小的颗粒,足够透明去呈现给监管单位。

第五,干预策略和标签:干预策略需要对用户输入输出内容做审核过滤和有效干预,当最后给用户输出的时候发现本身是存在风险的,那它肯定是不安全的。另外,标识需要清晰、准确、确保可被实名追溯,以更好的保护用户的知情权。

特别注意点

IMPORTANT POINTS

✅ 同一种算法可能被用于不同应用产品时,只需要一项备案即可;同一款产品如果触及多类算法,应当申请多个算法备案。

✅ 若是深度合成类的,是使用他人API算法的,也是需要备案,在备案的身份里应选择"服务提供者",而不是“服务支持者”。

✅ 备案编号是分批次发放的。根据实际经验,往往只有驳回的意见会通知给你,通过并不会给你一个明确的回复。

✅ 做了大模型的项目,项目还是用到了生成式算法的企业,除了要进行算法备案,还需在网信那边做安全评估,安全评估主要流程是审核评估报告,监测项目包括业务,黑盒,算法漏洞测试等,进行这个流程需先进行算法备案。

✅ 主体认证期间,注意接听带有区号的网信办座机电话,以北京为例,未接听电话,会直接导致主体认证不通过,继而影响下一阶段算法备案填报进度。

✅ 主体认证期间,尽量避免进行大规模产品迭代,确保申报报告与产品的一一对齐,否则会影响备案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/215396.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

window系统,如何多开微信

window系统多开微信的方法其实有很多种,今天我们介绍一种超实用简单的方法多开微信。 方法: 用命令符打开多个微信的方法介绍 用命令符打开多个微信之前,需要先获取当前微信的安装目录地址。 右键微信图标,单击“属性”。 在目标文本框下可…

PDF控件Spire.PDF for .NET【转换】演示:将PDF彩色图像转换为灰度(黑白)

将包含彩色图像的 PDF 转换为灰度图像可以帮助您减小文件大小,并以更实惠的模式打印 PDF,而无需消耗彩色墨水。在本文中,您将了解如何使用Spire.PDF for .NET在 C# 和 VB.NET 中以编程方式实现转换。 Spire.Doc 是一款专门对 Word 文档进行操…

【数值计算方法(黄明游)】解线性代数方程组的迭代法(一):向量、矩阵范数与谱半径【理论到程序】

文章目录 一、向量、矩阵范数与谱半径1、向量范数a. 定义及性质补充解释范数差 b. 常见的向量范数 l 1 l_1 l1​、 l 2 l_2 l2​、 l ∞ l_\infty l∞​ 范数性质关系 2、矩阵范数a. 矩阵的范数b. 常见的矩阵范数相容范数算子范数 3、谱半径4、知识点总结1. 向量范数2. 矩阵范数…

数字图像处理(实践篇)二十二 使用opencv进行人脸、眼睛、嘴的检测

目录 1 xml文件 2 涉及的函数 3 实践 使用opencv进行人脸、眼睛、嘴的检测。 1 xml文件 方法① 下载 地址:https://github.com/opencv/opencv/tree/master/data/haarcascades 点击haarcascade_frontalface_default.xml文件 对着Raw右键,选择“链接…

和鲸科技携手深圳数据交易所,“数据+数据开发者生态”赋能人工智能产业发展

信息化时代,数据驱动决策的重要性日益凸显。通过利用数据可以深入了解市场需求、客户行为、竞争态势等关键信息,从而制定更为有效的战略和决策。围绕推动数据要素产业发展,近日,深圳数据交易所(以下简称“深数所”&…

ALTERNET STUDIO 9.1 Crack

ALTERNET STUDIO 9.1 发布 宣布 AlterNET Studio 9.1 版本今天上线。AlterNET Studio 9.0 是一个中期更新,重点是改进我们所有的组件库。 以下是 AlterNET Studio 9.1 的发布亮点: Roslyn C# 和 Visual Basic 解析器现在支持代码修复/代码重构。 代码修复…

JVM虚拟机系统性学习-对象存活判断算法、对象引用类型和垃圾清除算法

垃圾回收 在 JVM 中需要对没有被引用的对象,也就是垃圾对象进行垃圾回收 对象存活判断算法 判断对象存活有两种方式:引用计数法、可达性分析算法 引用计数法 引用计数法通过记录每个对象被引用的次数,例如对象 A 被引用 1 次&#xff0c…

docker mysql8 设置不区分大小写

docker安装Mysql8.0的坑之lower_case_table_names_docker mysql lower_case_table_names-CSDN博客https://blog.csdn.net/p793049488/article/details/108365929 docker run ‐di ‐‐nametensquare_mysql ‐p 33306:3306 ‐e MYSQL_ROOT_PASSWORD123456 mysql

广东佛山开房屋租赁发票

我是20223年12月办理的,给大家做个参考。 一、准备材料 (如果非房东本人办理,还需要房东签份授权书,多复印几份或者直接签多份,不然会被税务局收走) 废话不多说,直接上图。 二、线上预约 附个…

变量与方法面试题

char 型变量中能不能存储一个中文汉字,为什么? char 类型可以存储一个中文汉字,因为 Java 中使用的编码是 Unicode(不选择任何特定的编码,直接使用字符在字符集中的编号,这是统一的唯一方法)&a…

内存cache大量使用问题导致应用异常问题

概述 28s应用崩溃查看内存使用有大量cache。 分析 查看free 信息平时的确存在大量cache使用的情况查看dmes信息发现filesendserver崩溃 崩溃信息为系统调用 查看到page allocation failure:order 5 同时也看到系统内存使用情况 查看到系统实际还有部分内存为空闲内存&am…

如何部署自己的服务渲染页面为Pdf文档

前言 相信大家都觉得官方发布的文档生成模块https://docs.mendix.com/appstore/modules/document-generation/很有用,它能把Mendix页面像素级导出到Pdf文件中,这对于归档等业务非常有价值。但部署依赖公有云提供的渲染服务,而中国本土用户对…

<软考高项备考>《论文专题 - 4 论文题目和框架》

1 大数据分析论文的题目 2 论文写作的基础 2.1 10大知识域、49个过程、5大过程组 领域启动计划执行监控收尾整合管理1.制定项目章程2.制订项目管理计划3.指导与管理项目工作4.管理项目知识5.监控项目工作6.实施整体变更控制7.结束项目或阶段范围管理1.规划范围管理2.收集需求…

mysql数据库学习笔记(1)

今天开始学mysql数据库,为什么要学这个呢,因为数据库可结构化存储大量的数据信息,方便用户进行有效的检索和访问。数据库可有效地保持数据信息的一致性、完整性、降低数据冗余。数据库可满足应用的共享和安全方面的要求,把数据放在…

《Spring Cloud Alibaba 从入门到实战》分布式消息(事件)驱动

分布式消息(事件)驱动 1、简介 事件驱动架构(Event-driven 架构,简称 EDA)是软件设计领域内的一套程序设计模型。 这套模型的意义是所有的操作通过事件的发送/接收来完成。 传统软件设计 举个例子,比如一个订单的创建在传统软…

Vuex快速上手

一、Vuex 概述 目标:明确Vuex是什么,应用场景以及优势 1.是什么 Vuex 是一个 Vue 的 状态管理工具,状态就是数据。 大白话:Vuex 是一个插件,可以帮我们管理 Vue 通用的数据 (多组件共享的数据)。例如:购…

数字化手术麻醉临床信息系统源码,全方位实时数据调阅及采集,自动生成各种手术医疗文书

医院手术麻醉管理系统源码,自主版权,二次开发方便快捷 技术架构:PHP、 js 、mysql、laravel、vue2 手术麻醉临床信息管理系统是数字化手段应用于手术过程中的重要组成部分,用数字形式获取并存储手术相关信息,既便捷又…

【深度学习】注意力机制(二)

本文介绍一些注意力机制的实现,包括EA/MHSA/SK/DA/EPSA。 【深度学习】注意力机制(一) 【深度学习】注意力机制(三) 目录 一、EA(External Attention) 二、Multi Head Self Attention 三、…

使用wire重构商品微服务

一.wire简介 Wire 是一个轻巧的Golang依赖注入工具。它由Go Cloud团队开发,通过自动生成代码的方式在编译期完成依赖注入。 依赖注入是保持软件 “低耦合、易维护” 的重要设计准则之一。 此准则被广泛应用在各种开发平台之中,有很多与之相关的优秀工…

Vue3封装一个轮播图组件

先看效果 编写组件代码 CarouselChart.vue <template><div classimg-box><el-button clickpreviousImages v-ifprops.showBtn>←</el-button><div classimg><div styledisplay: flex;gap: 20px idmove><imgclassimg-item v-for(item…