【AIGC安全】CCF-CV企业交流会直播回顾:探寻AI安全治理,共筑可信AI未来

文章目录

  • 一、活动背景:AI技术快速发展与安全治理需求迫切
  • 二、论坛内容
    • 金耀辉:智能共生时代:平衡生成式AI的创新与风险
    • 何延哲:人工智能安全检测评估的逻辑和要点
    • 谢洪涛:面向特定人物深度伪造视频的主动防御与被动检测技术
    • 郭丰俊:视觉内容安全技术的前沿进展与应用
    • 赫然:生成式人工智能安全与治理
  • 三、回顾总结

在这里插入图片描述


一、活动背景:AI技术快速发展与安全治理需求迫切

随着人工智能(AI)技术的迅猛进步,尤其是以ChatGPT为代表的大型语言模型技术的兴起,AI技术已广泛渗透至各个领域。然而,AI技术的快速发展亦伴随着一系列安全隐患的出现,如数据安全、知识产权、算法偏见、有害内容生成以及深度伪造、AI诈骗等。这些问题不仅引起了公众的广泛关注和深切忧虑,也对AI技术的健康发展和社会的和谐稳定构成了潜在威胁。全国网络安全标准化技术委员会等机构亦发布了相关框架和指导原则,旨在规范AI技术的发展和应用,降低其潜在风险。同时,学术界和工业界也在积极探索AI安全治理的途径,从立法、监管、前沿研究、技术实践等多个层面出发,寻求有效的解决方案。

正是在此背景下,由中国计算机学会计算机视觉专委会主办,合合信息承办,中国运筹学会数学与智能分会协办的《打造大模型时代的可信AI》论坛应时而生。该论坛旨在汇聚来自高校、研究机构、企业的专家学者,共同探讨AI安全领域的最新进展和未来趋势,为AI技术的健康发展提供有益的思路和建议。


二、论坛内容

论坛伊始,在热烈的掌声中,中国计算机学会计算机视觉专委会副秘书长潘金山博士走上台前,发表了热情洋溢的致辞。潘金山博士首先对各位嘉宾和参会者的到来表示了热烈的欢迎和衷心的感谢。他提到,在这个大模型时代,AI技术正以前所未有的速度改变着我们的生活和工作方式。然而,随着AI技术的广泛应用,其安全性问题也日益凸显,成为制约AI技术进一步发展的重要因素。潘博士强调,AI安全治理不仅关乎技术的健康发展,更关乎社会的和谐稳定。因此,加强AI安全治理,推动AI技术向善发展,已成为我们共同的责任和使命。他希望通过此次论坛,能够汇聚来自高校、研究机构、企业的专家学者,共同探讨AI安全领域的最新进展和未来趋势,为AI技术的健康发展提供有益的思路和建议。在致辞的最后,潘金山博士预祝本次论坛圆满成功,并期待各位嘉宾和参会者能够收获满满,为AI安全治理事业贡献自己的力量。


金耀辉:智能共生时代:平衡生成式AI的创新与风险

上海交通大学人工智能研究院教授、总工程师金耀辉老师在分享中指出,大语言模型的内容安全风险多种多样,包括提示词注入、输出处理不安全、训练数据中毒、模型拒绝服务等。这些风险不仅影响模型的性能,还可能对社会造成负面影响。例如,三星员工违规使用ChatGPT导致机密资料外泄,新闻网站CNET使用LLMs生成文章却包含严重事实错误,这些案例都为我们敲响了警钟。

那么,如何保障LLMs的内容安全呢?金耀辉老师提出了几种安全保障手段。首先是训练对齐,通过算法和数据对模型进行微调,使其更加符合安全需求。这种方法可以增强模型的整体安全性能,减少算法偏见和有害内容的生成。此外,还有面向安全的提示引导和文本过滤等方法。提示引导利用特定流程和策略引导LLMs,进一步激活其固有的安全属性;而文本过滤则通过外接模块检测有害内容,并触发处理机制,防止有害内容的产生和传播。

金耀辉老师的分享为我们提供了宝贵的见解和思考。在享受生成式AI带来的便利和创新的同时,我们也需要时刻关注其带来的风险和挑战,积极寻求解决方案和保障手段。只有这样,我们才能真正实现生成式AI的创新与风险的平衡,推动人工智能技术的健康发展。

上海交通大学人工智能研究院教授、总工程师金耀辉进行《智能共生时代:平衡生成式AI的创新与风险》主题分享


何延哲:人工智能安全检测评估的逻辑和要点

然而,仅有技术手段是不够的,规范标准也是AI健康生长的外部力量。中国电子标准院网安中心测评实验室副主任何延哲就人工智能安全检测评估的核心逻辑与关键要点进行了精彩纷呈的分享。

何延哲老师首先强调了人工智能安全检测评估的背景与必要性。随着人工智能技术的迅猛发展,其带来的安全风险也日益凸显,涵盖网络信息安全、科技伦理安全、算力网络安全、数据安全与隐私保护等多个维度。这些风险不仅关乎个人权益,更可能对社会稳定与经济发展产生深远影响。

针对这些风险,何延哲老师深入剖析了当前人工智能安全检测评估的方法与思路。他提到,我国已出台多项相关法律法规、政策文件及标准规范,为人工智能安全检测评估提供了坚实的制度保障。同时,他还介绍了人工智能安全模块的拆分与检测评估的基本思路,包括算力网络安全、个人信息保护、数据安全等关键领域。

在分享中,何延哲老师特别强调了基于人工智能相关标准规范的安全检测评估机制的重要性。他详细解读了《信息安全技术 机器学习算法安全评估规范》、《基于个人信息的自动化决策安全要求》等标准规范,并指出这些规范为人工智能安全检测评估提供了明确的指导与依据。此外,何延哲老师还强调了加强个人信息处理全生命周期保护、定期开展合规审计、采取加密等措施保障个人信息安全的重要性。

电子标准院网安中心测评实验室副主任、CCIA数安委常务副主任何延哲进行《人工智能安全检测评估的逻辑和要点》主题分享


谢洪涛:面向特定人物深度伪造视频的主动防御与被动检测技术

在下一环节,中国科学技术大学教授谢洪涛,为与会者带来了一场关于面向特定人物深度伪造视频的主动防御与被动检测技术的深度解析。

谢洪涛教授首先介绍了深度伪造技术的背景及其发展现状。他指出,随着深度学习技术的飞速发展,深度伪造技术已经能够在人脸图像、语音等领域实现高度逼真的伪造效果,这无疑给个人隐私、国家安全等方面带来了前所未有的挑战。随后,谢教授详细阐述了主动防御与被动检测技术的核心原理。主动防御技术主要是在内容发布前添加一定程度的干扰信号,以防止伪造或即便伪造也能够顺利溯源。而被动检测技术则是在人脸素材被恶意伪造后,利用伪造视频自身获取线索或提取特征进行检测。

在主动防御方面,谢教授介绍了通过添加对抗攻击噪声、嵌入特定信息等方式,实现对特定人物视频图像的主动干扰和主动取证。这些技术能够有效防止伪造者利用深度伪造技术对视频进行篡改,从而保护个人隐私和国家安全;在被动检测方面,谢教授则重点介绍了基于多模态先验知识的一致性检测、基于多层级纹理不一致性学习的深度伪造人脸检测等技术。这些技术能够通过对伪造视频进行精细化的分析,准确识别出伪造痕迹,从而实现对深度伪造视频的有效检测。

此外,谢洪涛教授还分享了其研究团队在主动防御与被动检测技术方面所取得的最新研究成果。他们提出了一系列创新性的算法和方法,如基于扩散模型的反演能力搜索对抗人脸、基于互相关序列嵌入水印等,这些成果在学术界和工业界都产生了广泛的影响。

中国科学技术大学教授、国家杰出青年基金获得者谢洪涛教授进行《面向特定人物深度伪造视频的主动防御与被动检测技术》主题分享


郭丰俊:视觉内容安全技术的前沿进展与应用

随后,合合信息图像算法研发总监郭丰俊的分享让我看到了AI技术在图像篡改检测方面的最新成果。在开篇部分,郭丰俊老师不仅指出了当前视觉内容安全需求日益增多的原因,还强调了这一领域的重要性。他提到,随着AI技术的不断发展,伪造技术也在不断进步,这使得伪造内容变得更加难以识别。同时,黑灰产利用这些技术进行非法活动,给社会带来了极大的危害。因此,企业、政府等对于视觉内容安全的需求变得越来越迫切。

郭丰俊老师介绍合合信息的通用篡改检测目前已经落地证券、保险、银行、零售等行业,同时支持证照、证书、票据、截图、扫描文档等通用类的篡改模型。另外一个人脸鉴伪检测产品也已经落地,支持换脸、生成式人脸检测等。
在这里插入图片描述


在这里插入图片描述

另外,郭老师介绍,合合信息文档图像篡改检测近年来受关注程度也越来越高,从2022年以来,相关方向的比赛多次收获了第一名的好成绩。
在这里插入图片描述

在谈到视觉内容安全技术的挑战时,郭丰俊老师不仅列举了当前技术面临的主要问题,还深入分析了这些问题的根源和解决方案。他提到,跨域泛化能力是当前技术面临的一大挑战,因为不同领域的数据分布和特征差异很大,导致模型在不同领域上的表现差异也很大。为了解决这个问题,学术界和工业界都在探索新的方法和算法,以提高模型的泛化能力。此外,他还提到了截图或PDF等纯色背景图篡改检测、质量退化导致的篡改痕迹损失以及检出精度与误检率的矛盾等问题,并给出了相应的解决方案和建议。

他提到,随着深度学习技术的不断发展,越来越多的研究者开始探索基于深度学习的篡改检测方法,这些方法在检测精度和效率上都有了很大的提升。此外,他还介绍了基于区块链的内容追溯技术、基于多模态信息融合的篡改检测方法等前沿研究方向,这些方向都具有很大的潜力和应用前景。

在总结部分,郭丰俊老师不仅强调了视觉内容安全技术的重要性,还呼吁业界同仁共同努力,推动这一领域的发展。他提到,制定相关标准和规范是促进内容安全系统更好落地的重要举措之一,因为标准和规范可以为行业提供明确的指导和方向。同时,他也对大模型等新技术的应用表示了期待和关注,认为这些新技术将为视觉内容安全技术带来新的突破和发展机遇。郭丰俊老师的分享内容丰富、见解独到,为我们提供了一个全面了解视觉内容安全技术的机会。
合合信息图像算法研发总监郭丰俊进行《视觉内容安全技术的前沿进展与应用》主题分享


赫然:生成式人工智能安全与治理

中国科学院自动化研究所研究员、IEEE/IAPR Fellow赫然博士的分享则让我对人工智能鉴别与合成技术之间的博弈有了更深入的认识。赫然博士首先介绍了生成式人工智能的基本概念和发展历程。他强调,生成式人工智能作为人工智能的一个重要分支,已经取得了显著的进步,并在各个领域展现出巨大的潜力。然而,随着其应用的日益广泛,安全和治理问题也日益凸显。
赫然博士指出,生成式人工智能面临的主要安全风险包括数据泄露、隐私侵犯、内容造假等。这些风险不仅可能对个人造成危害,还可能对国家安全和社会稳定构成威胁。因此,加强生成式人工智能的安全与治理显得尤为重要。
为了应对这些挑战,赫然博士提出了一系列建议。他强调,应建立健全的生成式人工智能监管机制,明确责任主体和监管标准。同时,加强技术研发和创新,提高生成式人工智能的安全性和可控性。此外,还应加强国际合作与交流,共同应对生成式人工智能带来的全球性挑战。
中国科学院自动化研究所研究员、IEEE/IAPR Fellow赫然进行《生成式人工智能安全与治理》主题分享


三、回顾总结

整场直播下来,我深感收获颇丰。我不仅学到了最新的AI技术知识,更对AI安全治理有了更深入的认识。我意识到,AI技术的快速发展带来了前所未有的机遇和挑战,而加强AI安全治理、推动AI向善发展是我们每个人的责任。同时,我也看到了专家学者们在AI安全治理方面所做出的努力和取得的成果,这让我对AI技术的未来发展充满了信心和期待。

回顾这场盛会,我感受到了专家学者们对AI安全治理的深刻洞察和坚定信念。我相信,在他们的共同努力下,AI技术一定会更加安全、可信、可靠地服务于人类社会。而我,也将继续关注AI技术的发展动态,为AI技术的健康发展贡献自己的一份力量。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/492558.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024年12月英语六级CET6写作与翻译笔记

目录 1 写作 1.1 大学为学生提供了探索各种可能性 1.2 自律在个人成长中的重要性 1.3 切实可行的目标 2 翻译 2.1 洋山港(Yangshan Port) 2.2 中国航天事业 2.3 北斗卫星导航系统 1 写作 1.1 大学为学生提供了探索各种可能性 1.2 自律在个人成长中的重要性 1.3 切实可…

解决“SVN无法上传或下载*.so、*.a等二进制文件“问题

今天,在使用Subversion提交代码到服务器时,发现无法提交*.a、*.so等二进制文件,右击这些文件,发现其属性为ignores。     问题原因:SVN的配置文件里,屏蔽了*.a、*.so文件的上传与下载,并把这些…

linux-18 关于shell(十七)file命令

在linux里面是不以后缀名来区分文件类型的,它跟windows不一样,windows里面都会以后缀名来区分文件类型,比如说,.mp3,windows就会把它视为音乐文件,.txt就会视为纯文本文档,.png就会视为图片文档…

品牌控价:守护价值,引领渠道健康发展

在当今竞争激烈且多元化的商业环境中,品牌的发展之路犹如一场充满挑战与机遇的漫长征程。随着品牌影响力的逐步扩大,其销售渠道也日益丰富多样,尤其是电商平台的蓬勃兴起,使得品牌产品的销售链接如繁星般繁多。然而,这…

OpenEuler Linux上怎么测试Nvidia显卡安装情况

当安装好显卡驱动后怎么样知道驱动程序安装好了,这里以T400 OpenEuler 正常情况下,我们只要看一下nvidia-smi 状态就可以确定他已经正常了 如图: 这里就已经确定是可以正常使用了,这里只是没有运行对应的程序,那接来下我们就写一个测试程序来测试一下:以下代码通过AI给出然后…

shell5

字符串运算符 首先我们在终端利用vim打开u.sh str1"hello" str2"hello" if [ "$str1" "$str2" ]; thenecho True elseecho false fi我们把hello改为Hello,看一下大小写是否敏感 str1"Hello" str2"hello…

Linux-ubuntu之主频和时钟配置

Linux-ubuntu之主频和时钟配置 一,主频二,其它时钟配置1.PLL2和PLL3的PFD0-3设置2.AHB_CLK_ROOT3.IPG 和 PERCLK时钟 三,总结 一,主频 24MHz 晶振为内核和其它外设提供时钟源,经电路后到PLL1变为996MHZ,再…

深入浅出Flink CEP丨如何通过Flink SQL作业动态更新Flink CEP作业

复杂事件处理(CEP)是一种对事件流进行分析的技术,它能够识别出数据流中的事件序列是否符合特定的模式,并允许用户对这些模式进行处理。Flink CEP 是 CEP 在 Apache Flink 中的具体实现,是 Apache Flink 的一个库&#…

华为数通最新题库 H12-821 HCIP稳定过人中

以下是成绩单和考试人员 HCIP H12-831 HCIP H12-725 安全中级

Facebook 与数字社交的未来走向

随着数字技术的飞速发展,社交平台的角色和形式也在不断演变。作为全球最大社交平台之一,Facebook(现Meta)在推动数字社交的进程中扮演了至关重要的角色。然而,随着互联网的去中心化趋势和新技术的崛起,Face…

STM32中ADC模数转换器

一、ADC简介 ADC模拟-数字转换器 ADC可以将引脚连续变化的模拟电压转换为内存中存储的数字变量,建立模拟电路到数字电路的桥梁 12位逐次逼近型ADC,1us转换时间 输入电压范围: 0~3.3V,转换结果范围:0~4095 18个输入…

fpga系列 HDL:Quartus II PLL (Phase-Locked Loop) IP核 (Quartus II 18.0)

在 Quartus II 中使用 PLL (Phase-Locked Loop) 模块来将输入时钟分频或倍频,并生成多个相位偏移或频率不同的时钟信号: 1. 生成 PLL 模块 在 Quartus II 中: 打开 IP Components。 file:///C:/intelFPGA_lite/18.0/quartus/common/help/w…

Springboot3.x配置类(Configuration)和单元测试

配置类在Spring Boot框架中扮演着关键角色,它使开发者能够利用Java代码定义Bean、设定属性及调整其他Spring相关设置,取代了早期版本中依赖的XML配置文件。 集中化管理:借助Configuration注解,Spring Boot让用户能在一个或几个配…

【游戏中orika完成一个Entity的复制及其Entity异步落地的实现】 1.ctrl+shift+a是飞书下的截图 2.落地实现

一、orika工具使用 1)工具类 package com.xinyue.game.utils;import ma.glasnost.orika.MapperFactory; import ma.glasnost.orika.impl.DefaultMapperFactory;/*** author 王广帅* since 2022/2/8 22:37*/ public class XyBeanCopyUtil {private static MapperFactory mappe…

Unity 组件学习记录:Aspect Ratio Fitter

概述 Aspect Ratio Fitter是 Unity 中的一个组件,用于控制 UI 元素(如Image、RawImage等)的宽高比。它在处理不同屏幕分辨率和尺寸时非常有用,可以确保 UI 元素按照预期的比例进行显示。当添加到一个 UI 对象上时,Aspe…

uni-app开发AI康复锻炼小程序,帮助肢体受伤患者康复!

**提要:**近段时间我们收到多个康复机构用户,咨询AI运动识别插件是否可以应用于肢力运动受限患者的康复锻炼中来,插件是可以应用到AI康复锻炼中的,今天小编就为您介绍一下AI运动识别插件在康腹锻炼中的应用场景。 一、康复机构的应…

Elasticsearch:什么是信息检索?

信息检索定义 信息检索 (IR) 是一种有助于从大量非结构化或半结构化数据中有效、高效地检索相关信息的过程。信息(IR)检索系统有助于搜索、定位和呈现与用户的搜索查询或信息需求相匹配的信息。 作为信息访问的主要形式,信息检索是每天使用…

Pytest-Bdd vs Behave:选择最适合的 Python BDD 框架

Pytest-Bdd vs Behave:选择最适合的 Python BDD 框架 Pytest BDD vs Behave:选择最适合的 Python BDD 框架BDD 介绍Python BDD 框架列表Python BehavePytest BDDPytest BDD vs Behave:关键区别Pytest BDD vs Behave:最佳应用场景结…

【数据集】5种常见人类行为检测数据集3379张YOLO+VOC格式

数据集格式:VOC格式YOLO格式 压缩包内含:3个文件夹,分别存储图片、xml、txt文件 JPEGImages文件夹中jpg图片总计:3379 Annotations文件夹中xml文件总计:3379 labels文件夹中txt文件总计:3379 标签种类数&am…

唯品会Android面试题及参考答案

HTTP 和 HTTPS 的区别是什么?你的项目使用的是 HTTP 还是 HTTPS? HTTP 和 HTTPS 主要有以下区别。 首先是安全性。HTTP 是超文本传输协议,数据传输是明文的,这意味着在数据传输过程中,信息很容易被窃取或者篡改。比如,在一个不安全的网络环境下,黑客可以通过网络嗅探工具…