如何利用 Smarter Balanced 塑造教育领域的 AI 治理

目录

定义挑战

以人为本的设计引领

融入多样性

探索以学生为中心的价值观

探索效果的层次和不同的影响


部位于加利福尼亚州的Smarter Balanced Assessment Consortium 是一个由会员主导的公共组织,为 K-12 和高等教育领域的教育工作者提供评估系统。该组织成立于 2010 年,与州教育机构合作开发创新的、符合标准的考试评估系统。Smarter Balanced 为教育工作者提供工具、课程和资源,包括形成性、中期和总结性评估,帮助教育工作者发现学习机会并加强学生的学习。

Smarter Balanced 致力于在不断变化的教育环境中不断发展和创新。通过与IBM Consulting® 的合作,该公司旨在探索在教育评估中使用人工智能 (AI) 的原则性方法。该合作于 2024 年初宣布,目前仍在进行中。

定义挑战

传统的针对 K-12 学生的技能评估,包括标准化考试和结构化测验,因与公平性相关的各种原因而受到批评。如果负责任地实施,人工智能具有变革性的潜力,可以提供个性化的学习和评估体验,以提高包括边缘群体在内的学生群体的评估公平性。因此,核心挑战是定义在学校环境中负责任地实施和治理人工智能是什么样子。

作为第一步,Smarter Balanced 和 IBM Consulting 成立了一个多学科咨询小组,其中包括教育测量、人工智能、人工智能伦理和政策以及教育工作者方面的专家。该小组的目标是制定指导原则,将准确性和公平性融入到人工智能用于教育测量和学习资源的过程中。下面概述了咨询小组的一些考虑因素。

以人为本的设计引领

使用设计思维框架可帮助组织制定以人为本的技术实施方法。三项以人为本的原则指导设计思维:关注用户成果、不断创新和赋予多元化团队权力。该框架有助于确保利益相关者在战略上保持一致,并响应功能性和非功能性组织治理要求。设计思维使开发人员和利益相关者能够深入了解用户需求、构思创新解决方案并迭代原型。

这种方法对于在开发过程的早期识别和评估风险以及促进创建值得信赖且有效的 AI 模型具有重要意义。通过不断与不同领域的专家和其他利益相关者社区进行接触并采纳他们的反馈,设计思维有助于构建技术可靠、对社会负责且以人为本的 AI 解决方案。

融入多样性

对于 Smarter Balanced 项目,联合团队成立了一个智囊团,其中包括各领域的专家和思想领袖。这个小组由教育评估和法律、神经多样性人群、学生、有无障碍障碍的人和其他领域的专家组成。

智库成员、马克库班基金会人工智能训练营项目架构师夏洛特·邓根 (Charlotte Dungan) 表示:“Smarter Balanced AI 智库致力于确保人工智能值得信赖且负责任,并确保我们的人工智能能够增强学生的学习体验。”

该智库的目标不是简单地将其成员的专业知识、观点和生活经验以“一次性”的方式纳入治理框架,而是不断迭代。这种方法反映了 IBM 人工智能伦理的一个关键原则:人工智能的目的是增强人类智能,而不是取代它。包含来自不同利益相关者的持续投入、评估和审查的系统可以更好地培养信任并促进公平的结果,最终创造一个更具包容性和有效性的教育环境。

这些系统对于在小学环境中创建公平有效的教育评估至关重要。多元化的团队带来了广泛的观点、经验和文化见解,这对于开发代表所有学生的 AI 模型至关重要。这种包容性有助于最大限度地减少偏见,并构建不会无意中延续不平等或忽视不同人口群体独特需求的 AI 系统。这反映了 IBM AI 伦理的另一个关键原则:  AI 多样性的重要性不在于观点,而在于数学。

探索以学生为中心的价值观

Smarter Balanced 和 IBM Consulting 作为一个团队开展的首批工作之一是确定我们希望在 AI 模型中看到的人类价值观。这不是一个新的道德问题,因此我们确定了一组与 IBM 的AI 支柱(或可信赖 AI 的基本属性)相对应的价值观和定义:

  • 可解释性:具有可以非技术性解释的功能和结果
  • 公平:平等对待他人
  • 稳健性:安全可靠,抵抗对抗性攻击
  • 透明度:披露人工智能的使用情况、功能和数据使用情况
  • 数据隐私:披露和维护用户的隐私和数据权利

在任何组织中实施这些价值观都是一项挑战。在评估学生技能的组织中,标准甚至更高。但人工智能的潜在优势使这项工作值得:“借助生成式人工智能,我们有机会更好地吸引学生,通过及时和可操作的反馈准确评估他们,并培养通过人工智能工具积极增强的 21 世纪技能,包括创造力、批判性思维、沟通策略、社交情感学习和成长心态,”Dungan 说。下一步是探索和定义将指导使用人工智能评估儿童和年轻学习者的价值观,目前正在进行中。

团队正在努力解决的问题包括:

  • 为了负责任地培养这些技能,需要哪些价值观驱动的护栏?
  • 它们将如何运作和管理,谁应该负责?
  • 我们给构建这些模型的从业者什么指导?
  • 哪些功能性和非功能性要求是必要的,以及强度级别是多少?

探索效果的层次和不同的影响

在本次练习中,我们采用了一种名为“效果层”的设计思维框架,这是IBM® Design for AI向开源社区Design Ethically捐赠的几个框架 之一。效果层框架要求利益相关者考虑其产品或体验的主要、次要和第三级影响。

  • 主要效果描述的是产品(在本例中为 AI 模型)的预期已知效果。例如,社交媒体平台的主要效果可能是将兴趣相投的用户联系起来。
  • 次要影响不是刻意为之,但很快就会引起利益相关者的关注。继续以社交媒体为例,次要影响可能是平台对广告商的价值。
  • 第三效应是随着时间的推移而变得明显的非预期或未预见到的效应,例如社交媒体平台倾向于奖励那些具有更高浏览量的令人愤怒的帖子或虚假信息。

对于这种用例,人工智能增强测试评估系统的主要(期望)效果是成为一种更公平、更具代表性和更有效的工具,从而改善整个教育系统的学习成果。

次要影响可能包括提高效率和收集相关数据,以帮助在最需要的地方更好地分配资源。

第三效应可能是已知的,也可能是非预期的。利益相关者必须探索潜在的非预期危害可能是什么样子。

研究小组确定了五类潜在的高级别危害:

  • 有害偏见考虑没有考虑或支持来自弱势群体的学生,这些学生可能需要额外的资源和观点来满足他们的不同需求。
  • 学校系统中缺乏针对其设备和网络的适当程序,存在与网络安全和个人身份信息 (PII) 相关的问题。
  • 缺乏治理和护栏来确保人工智能模型继续按照预期的方式运行。
  • 缺乏与家长、学生、教师和管理人员就学校中人工智能系统的预期用途进行适当沟通。这些沟通应该描述防止不当使用的保护措施和机构,例如如何选择退出。
  • 校外连接有限可能会减少技术的获取以及随后的人工智能的使用,尤其是在农村地区。

差异影响评估最初应用于法律案件,可帮助组织识别潜在偏见。这些评估探索看似中立的政策和做法如何对受保护群体产生不成比例的影响,例如那些容易受到基于种族、宗教、性别和其他特征的歧视的人。事实证明,此类评估在制定与招聘、贷款和医疗保健相关的政策方面非常有效。在我们的教育用例中,我们试图考虑那些可能因其情况而遭受不公平评估结果的学生群体。

被确定最容易受到潜在伤害的群体包括:

  • 那些有心理健康问题的人
  • 来自不同社会经济背景的人,包括没有住房的人
  • 主要语言不是英语的人
  • 有其他非语言文化考虑的人
  • 患有神经多样性疾病或有行动障碍的人

作为一个集体,我们的下一组练习是使用更多的设计思维框架(例如道德黑客)来探索如何减轻这些危害。我们还将详细说明寻求在学生评估中使用人工智能的组织的最低要求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/422564.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

初学者指南:MyBatis 入门教程

主要介绍了Mybatis的基本使用、JDBC、数据库连接池、lombok注解! 文章目录 前言 什么是Mybatis? 快速入门 使用Mybatis查询所有的用户信息 配置SQL提示 JDBC介绍 Mybatis 数据库连接池 lombok 总结 前言 主要介绍了Mybatis的基本使用、JDBC、数据库连接…

基于stm32单片机使用 RT-Thread 系统的 ADC 外设

一、ADC 介绍 来源:RT-Thread 文档中心   ADC(Analog-to-Digital Converter) 指模数转换器。是指将连续变化的模拟信号转换为离散的数字信号的器件。真实世界的模拟信号,例如温度、压力、声音或者图像等,需要转换成更容易储存、处理和发射…

【Linux】:信号与信号产生

朋友们、伙计们,我们又见面了,本期来给大家带来信号和信号的产生相关代码和知识点,如果看完之后对你有一定的启发,那么请留下你的三连,祝大家心想事成! C 语 言 专 栏:C语言:从入门到…

YOLOv10优改系列一:YOLOv10融合C2f_Ghost网络,让YoloV10实现性能的均衡

💥 💥💥 💥💥 💥💥 💥💥神经网络专栏改进完整目录:点击 💗 只需订阅一个专栏即可享用所有网络改进内容,每周定时更新 文章内容&#x…

微信自动通过好友和自动拉人进群,微加机器人这个功能太好用了

又发现一个好用的功能,之前就想找一个这种工具,现在发现可以利用微加机器人的两个功能来实现,分别是加好友和关键词拉群 首先 微加机器人的专业版 > 功能 > 加好友设置 可以设置一个关键词通过,这样别人加好友的时候只需要输入制定内…

实战案例(5)防火墙通过跨三层MAC识别功能控制三层核心下面的终端

如果网关是在核心设备上面,还能用MAC地址进行控制吗? 办公区域的网段都在三层上面,防火墙还能基于MAC来控制吗? 采用正常配置模式的步骤与思路 (1)配置思路与上面一样 (2)与上面区…

通信工程学习:什么是PDF策略决策功能

PDF策略决策功能 PDF策略决策功能(Policy Decision Function, PDF)在通信网络中,特别是在IP多媒体子系统(IMS)中,扮演着至关重要的角色。以下是对PDF策略决策功能的详细解释: 一、定义与功能概…

CentOS Stream 8中安装和使用 Docker

docker安装包-CSDN博客 〇、常用的docker命令 docker的作用: 快速进行软件的安装,便于软件环境的维护 docker的镜像: 压缩了指定软件的安装包的文件。使用镜像文件创建容器 docker的容器: 容器可以理解为就是一台小电脑。安装的linux系统&am…

【F的领地】项目拆解:小学教辅资料

项目介绍 虚拟资料项目的赛道其实一直可以做,实际上就是一个信息差项目。 知识付费是常青树,人天生有为知识付费的倾向。 而且虚拟资料通常一份 19~99 的资料有这方面需求很容易就能付款。 主要是产附属的流量再提问题。 我有个同乡,18年…

CircleProgressView 鸿蒙ArkTS自定义View实现圆形进度条

上篇的截图中除了一个上下的箭头,还有一个圆形进度条,今天我们来讲讲这个如何进行实现 我们看这个图形的构造,其实很简单:一个圆形图形,以及一个文本来显示进度 所以我们用一个层叠布局 绘制一个带颜色的圆形&#xff…

Java设计模式—面向对象设计原则(一) ----->开闭原则OCP(完整详解,附有代码+案例)

3.1开闭原则 对扩展开放,对修改关闭。在程序需要进行拓展的时候,不能去修改原有的代码,实现一个热插拔的效果。简言之,是为了使程序的扩展性好,易于维护和升级。想要达到这样的效果,我们需要使用接口和抽象…

怎么选择靠谱AI论文生成工具?看完我的试用都会明白!

2024年上半年开始AI论文写作工具开始火了,层出不穷!作为一个经常需要写论文的懒人,我非常好奇这些AI工具的实际效果到底怎么样?为了测试不同工具的实力,我对他们都进行了试用,发现了一些意想不到的结果....…

路由器的固定ip地址是啥意思?固定ip地址有什么好处

‌在当今数字化时代,‌路由器作为连接互联网的重要设备,‌扮演着举足轻重的角色。‌其中,‌路由器的固定IP地址是一个常被提及但可能让人困惑的概念。‌下面跟着虎观代理小二一起将深入探讨路由器的固定IP地址的含义,‌揭示其背后…

QML入门之创建可重用的组件(一)

我们在日常开发中都会封装一些组件以便于项目内重复利用。QML创建可重用组件一般有两种方法。 自定义Item使用Component创建自定义组件 自定义Item 以一个自定义按钮举例: import QtQuick 2.12Rectangle {id: root// 自定义属性property string btnDis: qsTr(&qu…

51单片机+proteus仿真+基本实验学习1(跑马灯、独立按键和数码管)

目录 1.实验一跑马灯 1.1代码的生成 1.1.151单片机的延时函数的生成 1.1.251单片机的流水灯代码编写 1.2仿真框图 2.实验二I/O独立按键 2.1基本概念 2.1.1按键所需的基本知识 2.2代码的生成 2.2.1头文件定义的代码 2.2.2 执行代码 2.3仿真图 ​3实验三数码管 3.1基…

基于Verilog HDL的FPGA设计基础

第一章 Verilog数字集成电路设计方法概述 HDL(Hardware Description Language)----硬件描述语言 EDA(Electronic Design Automation)----电子设计自动化 VLSI(Very Large Scale Integrated)----超大规模集成电路 ASIC(Application Specific Integrated Circuit)----专用集成电路…

Unity射击游戏开发教程:(35)轰炸敌人

现在敌人和飞机已经慢慢地越来越有各自地地行为了,在本文中,我们将介绍如何创建一个具有以下行为的敌人: 飞机会来回弹跳。飞机将有 4 架无人机轰炸机围绕飞机旋转。无人机轰炸机会偶尔投下沿着屏幕传播的炸弹。如果炸弹击中玩家或在随机时间后就会爆炸。如果炸弹没有击中玩…

macOS上谷歌浏览器的十大隐藏功能

谷歌浏览器(Google Chrome)在macOS上拥有一系列强大而隐蔽的特性,这些功能能显著提高您的浏览体验。从多设备同步到提升安全性和效率,这些被低估的功能等待着被发掘。我们将逐步探索这些功能,帮助您最大化利用谷歌浏览…

数据分析-螺旋环状气泡图

1 原理 采用阿基米德螺线原理,即以一个点匀速离开一个固定点的同时又以固定的角速度绕该固定点转动而产生的轨迹。具体原理见:阿基米德螺线。坐标轴公式为: 其中x为横坐标,y为纵坐标,r为离中心点的半径,为坐…

CSS之我不会

非常推荐html-css学习视频&#xff1a;尚硅谷html-css 一、选择器 作用&#xff1a;选择页面上的某一个后者某一类元素 基本选择器 1.标签选择器 格式&#xff1a;标签{} <h1>666</h1><style>h1{css语法} </style>2.类选择器 格式&#xff1a;.类…