LUMEN

长程编码

文本 + 图像 + 视频

Thinking + 工具调用

正式发布 · Moonshot AI

Lumen AI：免费体验 Kimi K2.6

Lumen AI 是访问 Kimi K2.6 的第三方界面——月之暗面最新编程 Agent，支持 1T 参数 MoE、256K 上下文、原生多模态和 thinking 模式。

Lumen AI — Kimi K2.6

256K 上下文 · 多模态 · thinking · Agent Swarm

Online

你好，我是 Lumen AI（由 Kimi K2.6 驱动）。可以让我处理长程编码、图像或视频理解，以及带工具调用的 Agent 任务。

试试这些问题

体验 Lumen AI 看看有什么新东西

上手实测

大家怎么评价 Kimi K2.6

这里整理的是 Kimi K2.6 正式发布后较新的 YouTube 实测、首发反应和对比视频。

Kimi K2.6 Is HERE – Is This the BEST Open Source Model Yet?

Bijan Bowen 在 K2.6 正式发布后再次上手，重点判断它是否已经成了当前最强的开源编码模型。

Bijan Bowen

Meet Kimi K2.6: Advancing Open-Source Coding

Kimi AI 官方频道发布的超短上线视频，主打 K2.6 对开源编码能力的推进。

Kimi AI

First Look at Kimi K2.6: An Open Source SOTA Model that Really Beat Opus?

Onchain AI Garage 关注 K2.6 的早期基准和开源 SOTA 说法，重点看它是否真的能压过 Opus 级别模型。

Onchain AI Garage

Kimi K2.6: NEW Open Source Model BEATS Claude & GPT-5.4!

Universe of AI 把 K2.6 放到 Claude 和 GPT-5.4 的对比语境里，讨论它作为开源编码模型挑战者的定位。

Universe of AI

Kimi 2.6 + Kimi Code CLI Just Dropped and It Rivals Claude Code

Income stream surfers 关注更新后的 Kimi 2.6 + Kimi Code CLI 工作流，并直接拿它和 Claude Code 做体验对比。

Income stream surfers

Kimi K2 6 Isn’t AI… It’s a Full Time Engineer Now 🔥

Codedigipt 把 Kimi K2.6 形容成更像“全职工程师”而不只是编码助手，重点看它在真实开发中的执行感。

Codedigipt

Kimi K2.6 核心能力

Moonshot AI 为 Kimi K2.6 重点强调的四件事

长程编码

连续执行 12 小时以上

Moonshot 官方数据：Kimi K2.6 在优化 Zig 推理引擎的任务里连续执行 12 小时、调用 4,000+ 次工具，最终跑出 ~193 tokens/秒（比 LM Studio 快 20%）；在 exchange-core 金融引擎上跑 13 小时，实现中位吞吐 +185% 的提升。

SWE-Bench Pro 58.6%
Terminal-Bench 2.0 66.7%
指令遵循与自我纠错同步增强
合作伙伴实测：Vercel Next.js 基准提升 >50%

技术架构

Kimi K2.6 Mixture of Experts

Kimi K2.6 是稀疏 Mixture-of-Experts：1T 总参数、每 token 激活 32B；384 个 routed + 1 个共享 expert，每 token 路由 8 个；61 层，采用 MLA 注意力、SwiGLU 激活、160K 词表，搭配 400M MoonViT 视觉编码器。API 兼容 OpenAI（api.moonshot.ai/v1），开源权重发布在 HuggingFace。

K2.6

聊天

OpenAI SDK

图像

视频

Thinking

Tools

总参数

32B

每 token 激活

256K

上下文

384 + 1

专家数

moonshotai/Kimi-K2.6 以 Modified MIT 协议在 HuggingFace 开源，内置 INT4 原生量化，并官方支持 vLLM、SGLang、KTransformers 部署（Transformers >= 4.57.1）。

Benchmark 结果

Kimi K2.6 Benchmarks

官方数据来源：Moonshot AI Kimi K2.6 官方博客，对比 GPT-5.4 与 Claude Opus 4.6。

SWE-Bench Pro

真实软件工程任务

编码

Kimi K2.60%

GPT-5.457.7%

Claude Opus 4.653.4%

Terminal-Bench 2.0

Shell / 终端任务完成度

编码

Kimi K2.60%

GPT-5.465.4%

Claude Opus 4.665.4%

AIME 2026

竞赛级数学

数学

Kimi K2.60%

GPT-5.499.2%

Claude Opus 4.696.7%

GPQA-Diamond

研究生级科学推理

推理

Kimi K2.60%

GPT-5.492.8%

Claude Opus 4.691.3%

BrowseComp

长程网页浏览 Agent

Agent

Kimi K2.60%

GPT-5.482.7%

Claude Opus 4.683.7%

HLE-Full w/ tools

Humanity's Last Exam，带工具

Agent

Kimi K2.60%

GPT-5.452.1%

Claude Opus 4.653%

核心成绩

58.6%

SWE-Bench Pro

真实编码任务

96.4%

AIME 2026

竞赛级数学

54.0%

HLE-Full w/ tools

Agent 推理

300

Agent Swarm

单次子智能体数

FAQ

关于 Kimi K2.6 的快速解答

Kimi K2.6 正式发布、API、开源权重以及与 Kimi K2.5 对比的常见问题。

Lumen AI：免费体验 Kimi K2.6

大家怎么评价 Kimi K2.6

Kimi K2.6 Is HERE – Is This the BEST Open Source Model Yet?

Meet Kimi K2.6: Advancing Open-Source Coding

First Look at Kimi K2.6: An Open Source SOTA Model that Really Beat Opus?

Kimi K2.6: NEW Open Source Model BEATS Claude & GPT-5.4!

Kimi 2.6 + Kimi Code CLI Just Dropped and It Rivals Claude Code

Kimi K2 6 Isn’t AI… It’s a Full Time Engineer Now 🔥

Kimi K2.6 核心能力

长程编码

原生文本、图像、视频

Thinking 模式与工具调用

更强的 Agent Swarm

Kimi K2.6 Mixture of Experts

Kimi K2.6 Benchmarks

SWE-Bench Pro

Terminal-Bench 2.0

AIME 2026

GPQA-Diamond

BrowseComp

HLE-Full w/ tools

核心成绩

关于 Kimi K2.6 的快速解答