随着人工智能成为我们技术领域中重要组成部分,每一种新的工具和技术都需要一个基准。目前位置,最广为人知的AI基准测试工具就是图灵测试。
自1950年图灵测试提出来以后,人工智能领域已经取得了长足的发展。但,越来越清楚的是,图灵测试无法评估出今天出现或者未来可能会出现的全部人工智能能力了。
图灵测试是以简单的通过/不通过的原则,重点关注聊天/语言能力,但这只是人工智能的一方面。这种对语言维度的测试,忽略了智力的许多其他关键维度,例如解决问题、创造力和社会价值。此外,图灵测试假定了一种类似于人类的智能水平,这种水平可能与评估AI无关或者是没用。
框架
为了解决这些局限性,迫切需要开发一个更加细致和全面的框架来评估跨多个只能维度的AI能力。
这一洞察力促使@克里斯·萨德开发了“AI分类框架”。ACF是一种基于多重智能理论的评估人工智能力的新方法。
多重智能理论最早由心理学家霍华德·加德纳在1983年提出。加德纳认为智力不是一个单一的、统一的实体,而是一组不同的能力,这些能力可以以多种方式表现出来。加德纳确定了八种不同的智力类型:根据加德纳的说法,个人可能在其中一种或多种领域表现出色,而每种智力类型都是独立的。这种理论挑战了智力作为单一、固定实体的传统观念,为探索人类认知的多样性开辟了新的途径。虽然多重智能理论多年来一直受到一些批评和争议,但它对心理学和教育领域产生了重大影响,尤其是在开发替代教学和学习方法方面。
根据该理论,该框架支持跨多个智能维度评估 AI 工具,包括语言、逻辑-数学、音乐、空间、身体-运动、人际关系和自我反思智能。
对于智力的每个维度,该框架提供了一个从 1 到 5 的等级,其中 1 表示“没有能力”或相当于人类婴儿,5 表示“自我代理”或可能被认为是“超级智能”的能力——超越人类能力。
该框架可以用于评估现有的AI技术和工具,以及为未来的AI发展提供一个更全面的评估方法。它可以帮助我们更好地理解不同AI技术的优缺点,确定适合不同任务的最佳AI解决方案,并推动AI创新的发展。此外,该框架还可以帮助消除关于AI的误解和恐惧,促进更广泛的AI采用和合作。
例子
改框架本身是一个详细描述表,作者还创建了简单的可视化,便于我们参考。
https://docsend.com/view/et7755yasfpj3iy6
——以下是响应 ChatGPT 和 DALL-E 2 功能的片段的两个简单示例。