明日周刊 · 第 9 期 - Kimi K2

Kimi K2

月之暗面在 7 月 11 日发布了开源模型 K2，下面是它的自我介绍：

🧠 Kimi K2 是什么？

Kimi K2 是我们最新推出的混合专家模型（MoE），拥有 1 万亿总参数 和 320 亿激活参数，在知识、数学和编程任务上达到当前非思考模型的顶尖水平。

但它不止于此——我们特别为 Agentic 任务进行了优化，让它不仅能回答问题，更能主动行动、调用工具、完成复杂任务。

🚀 亮点速览

特性	说明
开源版本	同时开源了 `Kimi-K2-Base`（基础模型）和 `Kimi-K2-Instruct`（指令微调版）
代码能力	能生成 3D 场景、粒子银河、期货交易系统等复杂前端项目
Agent 能力	支持多轮工具调用，可自动拆解任务、生成图表、写报告、发邮件
训练稳定	使用全新 MuonClip 优化器，在 15.5T tokens 上训练无 loss spike
上下文长度	支持最长 128K tokens 上下文

可以看到月之暗面的这款模型的侧重点在于 Agent 能力，目前应该还是 preview 版本，支持网页版对话和 API 调用。

Kimi 模型我记得在去年（2024 年）有过几次大的宣传，但我每次试用的结果都不太理想，就没怎么关注过。没想到这次直接憋了一个大活出来，我在 X 上看了几个评测，从感觉上来说提升比较大，尤其是代码方面。本来我也想试用，但是 API 有分级制度，我问了几个问题就被限速了，遂放弃。

技术速递

xAI 发布 Grok 4

有钱就是好啊。官方介绍，亮点如下：

Grok 4 利用 20 万块 GPU 集群进行强化学习训练。计算效率提升 6 倍，显著优化了模型的推理能力
256k 上下文支持
支持原生工具调用，多工具协同
多模态：支持文本、文档、网页、X 平台、视觉、语音

总的来说，xAI 认为 Grok 4 就是目前闭源模型中的“全能选手”。

Qwen 桌面客户端

Qwen 发布桌面客户端

阿里巴巴 Qwen 团队发布了 Qwen 桌面客户端，支持运行 MCP，内置官方 MCPs，也可以自己手动添加，但是手动添加的时候需要注意，如果是 stdio 模式，仅支持使用 uvx 和 npx 这两个命令。

我体验了一下，优点是运行速度比较快，支持并行调用。缺点也很明显，偶尔断联，开关方式并不方便，没有单独的开关。希望 Qwen 能早点完善，毕竟本地 MCP 不仅这两种运行方式。

对了目前仅支持 macOS。

Manus 跑路了吗

7 月 9 号，我在 X 刷到 Manus 裁员，迁移总部到新加坡的新闻，我其实挺意外的。之前 Manus 也算火过，现在融资也融了，直接把国内的 2/3 的员工给砍了，还清空了国内社交媒体记录。我估计也是暂时放弃国内的业务，因为海外是一个更有利于融资和落地的地方，国内对这种产品的付费意愿不是弱，而是几乎没有。也许这就是 Manus 深思熟虑之后的选择吧，如果他们以后想回来，会以什么方式回来呢？

本周阅读

《最后的问题》——艾萨克·阿西莫夫

最近又看起了科幻小说，《最后的问题》这本书让我联想到之前看过的《银河帝国》系列。我非常喜欢阿西莫夫的写作风格，开头略显无聊，中间剧情跌宕起伏，结局通常意想不到，不像科幻小说，更像一篇悬疑解谜类的小说，这就是他典型的写作风格。而且这本书里很多的所谓“设定”，其实在《银河帝国》中也会反复出现，比如“AI”、“读书机”、“心灵感应”、“心理史学”、“地球毁灭”等等，我想这不仅是阿西莫夫的设定，也是所有科幻小说都会存在的设定。

另一方面，我惊叹于阿西莫夫的想象力，不仅 AI 正沿着他的想象在发展，人类和 AI 的关系也如同他想象的那样在发展。阿西莫夫不愧是“科幻三巨头”之一。

本周市场

A 股站上 3500 点，如果这周能站住 3 天，我会选择看多。反倒是港股，一直在阴跌，让人食之无味，弃之可惜。

结语

最近各家厂商发的模型都提到了 Agent 能力，一款模型是否具备 Agent 能力将在未来很重要，也就是说模型即 Agent。那今年刚发展出来的 MCP 会不会又成为炮灰呢？下期我们聊聊 MCP 和 Agent 吧！

Bye！