當前位置：首頁 > 科技 > 知識百科

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復引用場景

來源：責編：時間：2024-07-02 08:15:28 1202觀看

導讀 7 月 1 日消息，月之暗面今日官宣 Kimi 開放平臺上下文緩存（Context Caching）功能開啟公測。官方表示，該技術在 API 價格不變的前提下，可為開發者降低最高 90% 的長文本旗艦大模型使用成本，并提升模型響應速度。附Ki

7 月 1 日消息，月之暗面今日官宣 Kimi 開放平臺上下文緩存（Context Caching）功能開啟公測。官方表示，該技術在 API 價格不變的前提下，可為開發者降低最高 90% 的長文本旗艦大模型使用成本，并提升模型響應速度。

附Kimi 開放平臺上下文緩存功能公測詳情如下：

技術簡介

據介紹，上下文緩存是一種數據管理技術，允許系統預先存儲會被頻繁請求的大量數據或信息。當用戶請求相同信息時，系統可以直接從緩存中提供，無需重新計算或從原始數據源中檢索。

適用場景

上下文緩存適用于頻繁請求，重復引用大量初始上下文場景，可降低長文本模型費用，提高效率。官方表示費用最高降低 90 %，首 Token 延遲降低 83%。適用業務場景如下：

提供大量預設內容的 QA Bot，例如 Kimi API 小助手

針對固定的文檔集合的頻繁查詢，例如上市公司信息披露問答工具

對靜態代碼庫或知識庫的周期性分析，例如各類 Copilot Agent

瞬時流量巨大的爆款 AI 應用，例如哄哄模擬器，LLM Riddles

交互規則復雜的 Agent 類應用等

計費說明

上下文緩存收費模式主要分為以下三個部分：

Cache 創建費用

調用 Cache 創建接口，成功創建 Cache 后，按照 Cache 中 Tokens 按實際量計費。24 元 / M token

Cache 存儲費用

Cache 存活時間內，按分鐘收取 Cache 存儲費用。10 元 / M token / 分鐘

Cache 調用費用

Cache 調用增量 token 的收費：按模型原價收費

Cache 調用次數收費：Cache 存活時間內，用戶通過 chat 接口請求已創建成功的 Cache，若 chat message 內容與存活中的 Cache 匹配成功，將按調用次數收取 Cache 調用費用。0.02 元 / 次

公測時間和資格說明

公測時間：功能上線后，公測 3 個月，公測期價格可能隨時調整。

公測資格：公測期間 Context Caching 功能優先開放給 Tier5 等級用戶，其他用戶范圍放開時間待定。

相關閱讀：

《月之暗面 Kimi 開放平臺將啟動 Context Caching 內測：提供預設內容 QA Bot、固定文檔集合查詢》

本文鏈接：http://www.www897cc.com/showinfo-119-97922-0.html月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復引用場景

聲明：本網頁內容旨在傳播知識，若有侵權等問題請及時與本網聯系，我們將在第一時間刪除處理。郵件：2376512515@qq.com

上一篇：微軟宣布 Microsoft 365 現已支持開放文檔格式 ODF 1.4

下一篇： 6 月桌面瀏覽器格局穩固：谷歌 Chrome 仍居首位，微軟 Edge 份額創新高

標簽：

熱門焦點

盧偉冰長文解析K60至尊版對Redmi有著里程碑式的意義

在今天的Redmi后性能時代戰略發布會結束之后，Redmi總經理盧偉冰又帶來了一篇長文，詳解了為什么 Redmi 要開啟后性能時代？為什么選擇和 MediaTek、Pixelworks 深度合作？以及后性
5月安卓手機好評榜：魅族20 Pro奪冠

性能榜和性價比榜之后，我們來看最后的安卓手機好評榜，數據來源安兔兔評測，收集時間2023年5月1日至5月31日，僅限國內市場。第一名：魅族20 Pro好評率：97.50%不得不感慨魅族老品牌還
一加首款折疊屏！一加Open渲染圖出爐：罕見單手可握小尺寸

8月5日消息，此前就有爆料稱，一加首款折疊屏手機將會在第三季度上市，如今隨著時間臨近，新機的各種消息也開始浮出水面。據悉，這款新機將會被命名為“On
Rust中的高吞吐量流處理

作者 | Noz編譯 | 王瑞平本篇文章主要介紹了Rust中流處理的概念、方法和優化。作者不僅介紹了流處理的基本概念以及Rust中常用的流處理庫，還使用這些庫實現了一個流處理程序
JavaScript學習 -AES加密算法

引言在當今數字化時代，前端應用程序扮演著重要角色，用戶的敏感數據經常在前端進行加密和解密操作。然而，這樣的操作在網絡傳輸和存儲中可能會受到惡意攻擊的威脅。為了確保數據
國行版三星Galaxy Z Fold5/Z Flip5發布售價7499元起

2023年8月3日，三星電子舉行Galaxy新品中國發布會，正式在國內推出了新一代折疊屏智能手機三星Galaxy Z Fold5與Galaxy Z Flip5，以及三星Galaxy Tab S9
AI芯片初創公司Tenstorrent獲三星和現代1億美元投資

Tenstorrent是一家由芯片行業資深人士Jim Keller領導的加拿大初創公司，專注于開發人工智能芯片，該公司周三表示，已經從現代汽車集團和三星投資基金等
OPPO K11采用全方位護眼屏：三大護眼能力減輕視覺疲勞

日前OPPO官方宣布，全新的OPPO K11將于7月25日正式發布，將主打旗艦影像，和同檔位競品相比，其最大的賣點就是將配備索尼IMX890主攝，堪稱是2000檔位影像表
榮耀Magic4 至臻版首創智慧隱私通話強勁影音系統

2022年第一季度臨近尾聲，在該季度內，許多品牌陸續發布自己的最新產品，讓大家從全新的角度來了解當今的手機技術。手機是電子設備中，更新迭代十分迅速的一款產品，基

日韩成人免费在线_国产成人一二_精品国产免费人成电影在线观..._日本一区二区三区久久久久久久久不

月之暗面 Kimi 開放平臺“上下文緩存”開啟公測：首 Token 延遲降低 83%、適用于文本重復引用場景

盧偉冰長文解析K60至尊版對Redmi有著里程碑式的意義

5月安卓手機好評榜：魅族20 Pro奪冠

一加首款折疊屏！一加Open渲染圖出爐：罕見單手可握小尺寸

Rust中的高吞吐量流處理

JavaScript學習 -AES加密算法

國行版三星Galaxy Z Fold5/Z Flip5發布售價7499元起

AI芯片初創公司Tenstorrent獲三星和現代1億美元投資

OPPO K11采用全方位護眼屏：三大護眼能力減輕視覺疲勞

榮耀Magic4 至臻版首創智慧隱私通話強勁影音系統

最新推薦

猜你喜歡

熱門推薦

相關資訊