kaggle新赛:谷歌AI模型运行时间预测赛题解析【数据挖掘】

赛题名称:Google - Fast or Slow? Predict AI Model Runtime

赛题链接:https://www.kaggle.com/competitions/predict-ai-model-runtime

赛题背景

Alice 是一名 AI 模型开发人员,但她的团队开发的一些模型运行速度非常慢。她最近发现了编译器的配置,这些配置改变了编译器编译和优化模型的方式,从而使模型运行得更快(或更慢)。参赛者的任务是帮助 Alice 找到每个模型的最佳配置。

赛题方向

数据挖掘

赛题任务

根据训练数据集中提供给参赛者的运行时数据训练机器学习模型,并进一步预测测试数据集中图形和配置的运行时。

数据描述

我们的数据集称为TpuGraphs,这是在XLA HLO图上运行在张量处理单元(TPUs) v3上的性能预测数据集。

总共有5个数据集集合:layout:xla:randomlayout:xla:defaultlayout:nlp:randomlayout:nlp:defaulttile:xla

最终得分将是所有数据集的平均值。要下载整个数据集并查看更多信息,参赛者可以导航到数据选项卡。

基准模型

我们在https://github.com/google-research-datasets/tpu_graphs上提供了基准模型和训练设置。请参阅我们的数据集论文(https://arxiv.org/abs/2308.13490),了解基准模型的详细信息。

评价指标

根据实际需求,我们使用两种评估指标,并对其取平均。

具体来说,对于数据集“tile:xla”,我们使用top-K预测产生的“(1-slowdown)”来反映模型预测的top-K配置相对于实际最快配置的速度降低情况,计算如下:

其中 K 是top-K预测,A 是数据集中给定图的所有配置,y 是测量的执行时间。

对于 layout:* 数据集,我们使用肯德尔秩相关系数(一种排名评估指标:模型预测的配置排序与运行时间排序的实际对应程度)。

提交文件

参赛者的提交文件必须是一个带有标题ID、TopConfigscsv文件。每个npz/**/test/*.npz文件(请参阅数据)在csv文件中必须有一行。

  • ID是{collection}:{test_filename_without_extension},其中collection是tile:xla、layout:xla:random、layout:xla:default、layout:nlp:random和layout:nlp:default之一。

  • TopConfigs应该根据参赛者的模型预测,按照从最快(运行时间最短)到最慢(运行时间最长)的顺序,用“;”分隔列出配置的索引。

    • 对于集合tile:xla,只有前5个条目将被考虑,其余的将被忽略。

    • 对于layout:*集合,所有条目将被考虑

  • 有关样本提交文件,请从数据选项卡下载sample_submission.csv。

时间安排

  • 2023年8月29日 - 开始日期。

  • 2023年11月10日 - 报名截止日期。

  • 2023年11月17日 - 最终提交截止日期。

赛题奖金

  • 第一名 - 15,000美元

  • 第二名 - 10,000美元

  • 第三名 - 8,000美元

  • 第四名 - 7,000美元

  • 第五名 - 5,000美元

  • 第六名 - 5,000美元

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.rhkb.cn/news/114981.html

如若内容造成侵权/违法违规/事实不符,请联系长河编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

软件测试技术分享丨使用Postman搞定各种接口token实战

现在许多项目都使用jwt来实现用户登录和数据权限,校验过用户的用户名和密码后,会向用户响应一段经过加密的token,在这段token中可能储存了数据权限等,在后期的访问中,需要携带这段token,后台解析这段token才…

git 忽略已经提交的文件或文件夹 (修改.gitignore文件无效)

场景描述:项目开发到一半,追加了模块,提交的时候未注意将不需要提交的文件或者目录提交到.gitignore,然后提交后发现再修改git配置文件已无法阻拦更新,查阅官方资料: 核心点:.gitignore 之前&a…

【LeetCode-中等题】142. 环形链表 II

文章目录 题目方法一:哈希表set去重方法二:快慢指针 题目 方法一:哈希表set去重 思路:我们遍历链表中的每个节点,并将它记录下来;一旦遇到了此前遍历过的节点,就可以判定链表中存在环。借助哈希…

前端加springboot实现Web Socket连接通讯以及测试流程(包括后端实现心跳检测)

【2023】前端加springboot实现Web Socket连接通讯(包括后端实现心跳检测) 前言一、Web Socket 简绍1 为什么用 websocket? 二、代码实现1、前端(html)1.1、无前端向后端发送消息1.2、有前端向后端发送消息 2、后端具体…

微服务容错 Resilience4j 接口服务-容错原理

微服务容错 Resilience4j 容错原理 4.1 微服务容错简介 在⾼并发访问下,⽐如天猫双11,流量持续不断的涌⼊,服务之间的相互调⽤频率突然增加,引发系统负载过⾼,这时系统所依赖的服务的稳定性对系统的影响⾮常⼤&#…

vscode使用anaconda自带的python环境在终端运行时报错

目录 具体报错内容官方翻译报错讲人话解决方法 具体报错内容 CommandNotFoundError: Your shell has not been properly configured to use conda activate. If your shell is Bash or a Bourne variant, enable conda for the current user with$ echo ". E:\Anaconda/e…

【飞书ChatGPT机器人】飞书接入ChatGPT,打造智能问答助手

文章目录 前言环境列表1.飞书设置2.克隆feishu-chatgpt项目3.配置config.yaml文件4.运行feishu-chatgpt项目5.安装cpolar内网穿透6.固定公网地址7.机器人权限配置8.创建版本9.创建测试企业10. 机器人测试 前言 在飞书中创建chatGPT机器人并且对话,在下面操作步骤中…

ES是一个分布式全文检索框架,隐藏了复杂的处理机制,核心数据分片机制、集群发现、分片负载均衡请求路由

ES是一个分布式框架,隐藏了复杂的处理机制,核心数据分片机制、集群发现、分片负载均衡请求路由。 ES的高可用架构,总体如下图: 说明:本文会以pdf格式持续更新,更多最新尼恩3高pdf笔记,请从下面…

字节跳动推出AI对话工具“豆包”:免费用

我是卢松松,点点上面的头像,欢迎关注我哦! 听说松松客服的小马爆料了一个消息:字节跳动推出了一个新的AI大模型对话工具,叫做“豆包”。竟然一查发现,早在8月18号就已经上线了呢。原来这个“豆包”其实是之…

ssm+vue“魅力”繁峙宣传网站源码和论文

ssmvue“魅力”繁峙宣传网站源码和论文102 开发工具:idea 数据库mysql5.7 数据库链接工具:navcat,小海豚等 技术:ssm 摘 要 随着科学技术的飞速发展,各行各业都在努力与现代先进技术接轨,通过科技手段提高自身…

No message found under code ‘-1‘ for locale ‘zh_CN‘.

导出中的报错:No message found under code -1 for locale zh_CN. 报错原因:页面中展示的数据和后端excel中的数据不一致导致 具体原因:

Sharding-JDBC分库分表四种分片算法

1. 精确分片算法 精确分片算法(PreciseShardingAlgorithm)精确分片算法(与IN语句),用于处理使用单一键作为分片键的与IN进行分片的场景。需要配合StandardShardingStrategy使用 2. 范围分片算法 范围分片算法&#…

Vue基础1:生命周期汇总(vue2)

Description 生命周期图: 可以理解vue生命周期就是指vue实例从创建到销毁的过程,在vue中分为9个阶段:创建前/后,载入前/后,更新前/后,销毁前/后,其他;常用的有:created&…

随记-多租户数据隔离

数据隔离 DataBase 隔离 ( 独立数据库 )Schema 隔离 ( 共享数据库,但隔离数据架构 )Table 隔离 ( 共享数据库,共享数据架构 ) DB 隔离 即一个租户一个数据库,这种方案的用户数据隔离级别最高,安全性最好,但成本较高 …

arm版Linux下安装es集群

背景:由于生产上网络没通,没办法,只能自己安装一个es集群的测试环境了,我的电脑是Mac M2,安装的Linux是centos7,也是arm版的。 第一步:查看自己Linux系统的版本 命令:uname -a 例如…

C语言圣经KR笔记 1.10外部变量和作用域

1.10外部变量和作用域 上一节main中的变量,如line、longest等等,对main来说是私有的或者说是局部的。因为它们是在main中定义的,其他函数不能直接访问它们。其他函数中的变量也是如此,例如,getline中的变量 i 与copy中…

睿趣科技:抖音开网店卖玩具怎么样

近年来,随着社交媒体平台的飞速发展,抖音作为一款短视频分享应用也迅速崭露头角。而在这个充满创业机遇的时代背景下,许多人开始探索在抖音平台上开设网店,尤其是卖玩具类商品,那么抖音开网店卖玩具究竟怎么样呢? 首先…

傅里叶变换(FFT)笔记存档

参考博客:https://www.luogu.com.cn/blog/command-block/fft-xue-xi-bi-ji 目录: FFT引入复数相关知识单位根及其相关性质DFT过程(难点)DFT结论(重要)IDFT结论(重要)IDFT结论证明&…

巨人互动|游戏出海游戏出海需要考虑哪些方面?

游戏出海是指将游戏产品推向国外市场,以扩大用户群体和增加盈利空间,那么要成功地进行游戏出海,需要考虑哪些方面呢?本文小编对此来讲讲吧! 1、目标市场选择 选择适合游戏产品的目标市场是出海的首要考虑因素&#xf…

word中标题及公式自动编号

word中公式自动编号 1. 实现目标2. 详细步骤2.1 添加自动编号功能2.2 输入标题并编号2.3 新建公式2.3.1 编辑公式2.3.4 公式编号的交叉引用2.3.5 公式位置变动以及更新正文中的编号 在word中自动编号公式一直是一个老大难问题,现在通过总结网友们提供的方法&#xf…