Kimi 上下文缓存功能开启公测！降低使用费用，加快模型相应速度

Kimi 上下文缓存功能开启公测！降低使用费用，加快模型相应速度

news/2024/12/20 2:23:55/文章来源:https://blog.csdn.net/lihuiyun184291/article/details/140117824

　　7月2日，系统之家发布消息，月之暗面科技有限公司旗下的Kimi开放平台正式推出上下文缓存功能，并已开放公测。这项功能专为处理频繁请求和大量重复引用初始上下文的场景设计，能有效降低使用长文本模型的成本，并显著提升处理效率。据官方数据显示，上下文缓存功能可以将费用降低至最高90%，同时将首次Token的延迟时间缩短83%，从而加快模型的响应速度。

月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景

　　系统之家附 Kimi 开放平台上下文缓存功能公测详情如下：

技术简介

　　据介绍，上下文缓存是一种数据管理技术，允许系统预先存储会被频繁请求的大量数据或信息。当用户请求相同信息时，系统可以直接从缓存中提供，无需重新计算或从原始数据源中检索。

月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景

适用场景

　　适用业务场景如下：

　　提供大量预设内容的 QA Bot，例如 Kimi API 小助手

　　针对固定的文档集合的频繁查询，例如上市公司信息披露问答工具

　　对静态代码库或知识库的周期性分析，例如各类 Copilot Agent

　　瞬时流量巨大的爆款 AI 应用，例如哄哄模拟器，LLM Riddles

　　交互规则复杂的 Agent 类应用等

月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景

月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景

　　计费说明

　　上下文缓存收费模式主要分为以下三个部分：

　　Cache 创建费用

　　调用 Cache 创建接口，成功创建 Cache 后，按照 Cache 中 Tokens 按实际量计费。24 元 / M token

　　Cache 存储费用

　　Cache 存活时间内，按分钟收取 Cache 存储费用。10 元 / M token / 分钟

　　Cache 调用费用

　　Cache 调用增量 token 的收费：按模型原价收费

　　Cache 调用次数收费：Cache 存活时间内，用户通过 chat 接口请求已创建成功的 Cache，若 chat message 内容与存活中的 Cache 匹配成功，将按调用次数收取 Cache 调用费用。0.02 元 / 次

月之暗面 Kimi 开放平台“上下文缓存”开启公测：首 Token 延迟降低 83%、适用于文本重复引用场景

公测时间和资格说明

　　公测时间：功能上线后，公测 3 个月，公测期价格可能随时调整。

　　公测资格：公测期间 Context Caching 功能优先开放给 Tier5 等级用户，其他用户范围放开时间待定。

　　以上是系统之家提供的最新资讯，感谢您的阅读，更多精彩内容请关注系统之家官网。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.rhkb.cn/news/366219.html

如若内容造成侵权/违法违规/事实不符，请联系长河编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

React小记（五）_Hooks入门到进阶

React 16.8 版本类组件和函数组件两种组件共存，到目前 React 18 版本，官方已经不在推荐使用类组件，在函数组件中 hooks 是必不可少的，它允许我们函数组件像类组件一样可以使用组件的状态，并模拟组件的生命周期等一…

阅读更多...

ChatGPT-4o医学应用、论文撰写、数据分析与可视化、机器学习建模、病例自动化处理、病情分析与诊断支持

ChatGPT-4o医学应用、论文撰写、数据分析与可视化、机器学习建模、病例自动化处理、病情分析与诊断支持

2022年11月30日，可能将成为一个改变人类历史的日子——美国人工智能开发机构OpenAI推出了聊天机器人ChatGPT-3.5，将人工智能的发展推向了一个新的高度。2023年11月7日，OpenAI首届开发者大会被称为“科技界的春晚”，吸引了全球广大…

阅读更多...

Cesium大屏-vue3注册全局组件

Cesium大屏-vue3注册全局组件

1.需求说明：产品经理要求开发人员在地图大屏上面随意放置组件，并且需要通过数据库更改其组件大小，位置等；适用于大屏组件中场站视角、任意位置标题等。 2.实现 2.1GlobalComponents.vue 说明：containerList可以通…

阅读更多...

力扣热100 哈希

力扣热100 哈希

哈希 1. 两数之和49.字母异位词分组128.最长连续序列 1. 两数之和题目：给定一个整数数组 nums 和一个整数目标值 target，请你在该数组中找出和为目标值 target 的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案。…

阅读更多...

蜜雪冰城小程序逆向

蜜雪冰城小程序逆向

app和小程序算法一样小程序是wasm

阅读更多...

SpringMVC的视图

SpringMVC的视图

文章目录 1、ThymeleafView2、转发视图3、重定向视图4、视图控制器view-controller SpringMVC 中的视图是 View 接口，视图的作用渲染数据，将模型 Model 中的数据展示给用户SpringMVC视图的种类很多，默认有转发视图和重定向视图当工程引入jstl…

阅读更多...

楼层分户项目分析

楼层分户项目分析

文章目录 1. 区域绘制2. 户型切分3. 楼房分层4. 编辑房户信息5. 查看房户信息6. 数据库6.1. 楼栋数据库6.2. 单位数据库 7. 房户数据库 1. 区域绘制点击绘制图形，激活画笔，右键结束绘制。输入框可以更换地址前缀。分户坐标是由绘制的多个点组成的&…

阅读更多...

在宿主机上个修改虚拟机的用户密

在宿主机上个修改虚拟机的用户密

1、远程修改虚拟机密码 1.1在虚拟机上安装Qemu Guest Agent yum -y install qemu-guest-agent --enablerepoC7.4* systemctl enable qemu-guest-agent systemctl start qemu-guest-agent vim /etc/sysconfig/qemu-ga #注释此行 systemctl restart qemu-guest-agent.servic…

阅读更多...

LabVIEW电压电流实时监测系统

LabVIEW电压电流实时监测系统

开发了一种基于LabVIEW和研华（Advantech）数据采集卡的电压电流实时监测系统，通过高效的数据采集和处理，为工业和科研用户提供高精度、实时的电压电流监测解决方案。系统采用研华USB-4711A数据采集卡，结合LabVIEW编程环…

阅读更多...

SAP 接口-银行账号主数据维护接口【MDM-＞SAP】开发说明书（包括测试样例、程序代码仅作参考，不保证一定可以运行)

SAP 接口-银行账号主数据维护接口【MDM-＞SAP】开发说明书（包括测试样例、程序代码仅作参考，不保证一定可以运行)

接口映射字段开发通用说明根据MDM传输字段调用BAPI生成银行账号及开户行。开户行维护BAPI【BAPI_BANK_CREATE】银行账号维护BAPI【BAPI_FCLM_BAM_AMD_BNKANT】接口字段【ZZZH 主账户标识】=1时字段【DTAAI】DME标识赋值：常用；接口字段【ZZZH 主账户标识】=0时字段…

阅读更多...

[C++][设计模式][迭代器模式]详细讲解

[C++][设计模式][迭代器模式]详细讲解

目录 1.动机2.模式定义3.要点总结4.代码感受 1.动机在软件构建过程中，集合对象内部结构常常变化各异。但对于这些集合对象，我们希望不暴露其内部结构的同时，可以让外部客户代码透明地访问其中包含的元素； 同时这种”透明遍历“也…

阅读更多...

Optional类方法

Optional类方法

Optional类简介方法empty()方法of(T value)ofNullable(T value)filter(Predicate<? super T> predicate)get()ifPresent(Consumer<? super T> consumer)isPresent()map(Function<? super T,? extends U> mapper)orElse(T other)orElseGet(Supplier<?…

阅读更多...

Linux运维：mysql高级查询语句(2)

Linux运维：mysql高级查询语句(2)

目录一、创建数据库： 二、创建表结构：DDL 2.1 学生表s： 2.2 成绩表sc： 2.3 课程表c： 三、录入数据：DML 3.1 对学生表s的数据录入： 3.2 对成绩表sc的数据录入： 3.3 对课…

阅读更多...

【MySQL】数据库——备份与恢复，日志管理1

【MySQL】数据库——备份与恢复，日志管理1

一、数据备份的重要性 1.备份的主要目的是灾难恢复在生产环境中，数据的安全性至关重要任何数据的丢失都可能产生严重的后果造成数据丢失的原因： 程序错误人为,操作错误运算错误磁盘故障灾难（如火灾、地震）和盗窃 2.数据库备份…

阅读更多...

【云原生】服务网格（Istio）如何简化微服务通信

【云原生】服务网格（Istio）如何简化微服务通信

🐇明明跟你说过：个人主页 🏅个人专栏：《未来已来：云原生之旅》🏅 🔖行路有良友，便是天堂🔖 目录一、引言 1、微服务架构的兴起 2、Istio：服务网格的佼…

阅读更多...

AI绘画Stable Diffusion 超强一键去除图片中的物体，免费使用！

AI绘画Stable Diffusion 超强一键去除图片中的物体，免费使用！

大家好，我是设计师阿威在生成图像时总有一些不完美的小瑕疵，比如多余的物体或碍眼的水印，它们破坏了图片的美感。但别担心，今天我们将介绍一款神奇的工具——sd-webui-cleaner，它可以帮助我们使用Stable Diffusion轻…

阅读更多...

音乐：触动心灵的艺术语言

音乐：触动心灵的艺术语言

Enjoy your music 音乐作为一种跨越时空和文化的艺术形式，拥有着无穷的魅力和力量。它不仅能够带给我们愉悦的听觉享受，还对我们的身心健康、认知发展和社会交往产生着深远的影响。一、音乐的基本元素音乐由多个基本元素构成，包括…

阅读更多...

python-逻辑语句

python-逻辑语句

if else语句不同于C：else if range语句： continue continue的作用是： 中断所在循环的当次执行，直接进入下一次 continue在嵌套循环中的应用 break 直接结束所在的循环 break在嵌套循环中的应用 continue和break，在…

阅读更多...

SAP AFAB 资产过账如何查看配置的对应的会计科目

SAP AFAB 资产过账如何查看配置的对应的会计科目

首先查看资产AS03 科目定位码 T004 然后去找对应的科目 AO93

阅读更多...

绘唐3一键追爆款文刻创作聚星文社

绘唐3一键追爆款文刻创作聚星文社

聚星文社是一个中国的文学社交平台，提供了一个让作家和读者相互交流和分享作品的平台。在聚星文社，作家可以在平台上发布自己的作品，获得读者的阅读和评论，同时也可以与其他作家进行交流与学习。点击下载即可读者可以在平台上…

阅读更多...

最新文章

推荐文章