长程编码
文本 + 图像 + 视频
Thinking + 工具调用
正式发布 · Moonshot AI

Lumen AI:免费体验 Kimi K2.6

Lumen AI 是访问 Kimi K2.6 的第三方界面——月之暗面最新编程 Agent,支持 1T 参数 MoE、256K 上下文、原生多模态和 thinking 模式。

Lumen AI — Kimi K2.6

256K 上下文 · 多模态 · thinking · Agent Swarm

你好,我是 Lumen AI(由 Kimi K2.6 驱动)。可以让我处理长程编码、图像或视频理解,以及带工具调用的 Agent 任务。
Ctrl/Cmd + Enter 发送/chat
试试这些问题

上手实测

大家怎么评价 Kimi K2.6

这里整理的是 Kimi K2.6 正式发布后较新的 YouTube 实测、首发反应和对比视频。

Kimi K2.6 Is HERE – Is This the BEST Open Source Model Yet?

Bijan Bowen 在 K2.6 正式发布后再次上手,重点判断它是否已经成了当前最强的开源编码模型。

Bijan Bowen

Meet Kimi K2.6: Advancing Open-Source Coding

Kimi AI 官方频道发布的超短上线视频,主打 K2.6 对开源编码能力的推进。

Kimi AI

First Look at Kimi K2.6: An Open Source SOTA Model that Really Beat Opus?

Onchain AI Garage 关注 K2.6 的早期基准和开源 SOTA 说法,重点看它是否真的能压过 Opus 级别模型。

Onchain AI Garage

Kimi K2.6: NEW Open Source Model BEATS Claude & GPT-5.4!

Universe of AI 把 K2.6 放到 Claude 和 GPT-5.4 的对比语境里,讨论它作为开源编码模型挑战者的定位。

Universe of AI

Kimi 2.6 + Kimi Code CLI Just Dropped and It Rivals Claude Code

Income stream surfers 关注更新后的 Kimi 2.6 + Kimi Code CLI 工作流,并直接拿它和 Claude Code 做体验对比。

Income stream surfers

Kimi K2 6 Isn’t AI… It’s a Full Time Engineer Now 🔥

Codedigipt 把 Kimi K2.6 形容成更像“全职工程师”而不只是编码助手,重点看它在真实开发中的执行感。

Codedigipt

Kimi K2.6 核心能力

长程编码

原生文本、图像、视频

Thinking 模式与工具调用

更强的 Agent Swarm

Moonshot AI 为 Kimi K2.6 重点强调的四件事

长程编码
长程编码

连续执行 12 小时以上

Moonshot 官方数据:Kimi K2.6 在优化 Zig 推理引擎的任务里连续执行 12 小时、调用 4,000+ 次工具,最终跑出 ~193 tokens/秒(比 LM Studio 快 20%);在 exchange-core 金融引擎上跑 13 小时,实现中位吞吐 +185% 的提升。

  • SWE-Bench Pro 58.6%
  • Terminal-Bench 2.0 66.7%
  • 指令遵循与自我纠错同步增强
  • 合作伙伴实测:Vercel Next.js 基准提升 >50%
技术架构

Kimi K2.6 Mixture of Experts

Kimi K2.6 是稀疏 Mixture-of-Experts:1T 总参数、每 token 激活 32B;384 个 routed + 1 个共享 expert,每 token 路由 8 个;61 层,采用 MLA 注意力、SwiGLU 激活、160K 词表,搭配 400M MoonViT 视觉编码器。API 兼容 OpenAI(api.moonshot.ai/v1),开源权重发布在 HuggingFace。

K2.6
聊天
OpenAI SDK
图像
视频
Thinking
Tools
1T
总参数
32B
每 token 激活
256K
上下文
384 + 1
专家数

moonshotai/Kimi-K2.6 以 Modified MIT 协议在 HuggingFace 开源,内置 INT4 原生量化,并官方支持 vLLM、SGLang、KTransformers 部署(Transformers >= 4.57.1)。

Benchmark 结果

Kimi K2.6 Benchmarks

官方数据来源:Moonshot AI Kimi K2.6 官方博客,对比 GPT-5.4 与 Claude Opus 4.6。

SWE-Bench Pro

真实软件工程任务

编码
Kimi K2.60%
GPT-5.457.7%
Claude Opus 4.653.4%

Terminal-Bench 2.0

Shell / 终端任务完成度

编码
Kimi K2.60%
GPT-5.465.4%
Claude Opus 4.665.4%

AIME 2026

竞赛级数学

数学
Kimi K2.60%
GPT-5.499.2%
Claude Opus 4.696.7%

GPQA-Diamond

研究生级科学推理

推理
Kimi K2.60%
GPT-5.492.8%
Claude Opus 4.691.3%

BrowseComp

长程网页浏览 Agent

Agent
Kimi K2.60%
GPT-5.482.7%
Claude Opus 4.683.7%

HLE-Full w/ tools

Humanity's Last Exam,带工具

Agent
Kimi K2.60%
GPT-5.452.1%
Claude Opus 4.653%

核心成绩

58.6%
SWE-Bench Pro
真实编码任务
96.4%
AIME 2026
竞赛级数学
54.0%
HLE-Full w/ tools
Agent 推理
300
Agent Swarm
单次子智能体数
FAQ

关于 Kimi K2.6 的快速解答

Kimi K2.6 正式发布、API、开源权重以及与 Kimi K2.5 对比的常见问题。