第 9 期

第 9 期 - Kimi K2

最后的问题——“数据不足,无法得出有意义的结论”

第 9 期 - Kimi K2

Kimi K2

月之暗面在 7 月 11 日发布了 开源模型 K2,下面是它的自我介绍:

🧠 Kimi K2 是什么?

Kimi K2 是我们最新推出的混合专家模型(MoE),拥有 1 万亿总参数320 亿激活参数,在知识、数学和编程任务上达到当前非思考模型的顶尖水平。

但它不止于此——我们特别为 Agentic 任务进行了优化,让它不仅能回答问题,更能主动行动、调用工具、完成复杂任务。

🚀 亮点速览

特性说明
开源版本同时开源了 Kimi-K2-Base(基础模型)和 Kimi-K2-Instruct(指令微调版)
代码能力能生成 3D 场景、粒子银河、期货交易系统等复杂前端项目
Agent 能力支持多轮工具调用,可自动拆解任务、生成图表、写报告、发邮件
训练稳定使用全新 MuonClip 优化器,在 15.5T tokens 上训练无 loss spike
上下文长度支持最长 128K tokens 上下文

可以看到月之暗面的这款模型的侧重点在于 Agent 能力,目前应该还是 preview 版本,支持网页版对话和 API 调用。

Kimi 模型我记得在去年(2024 年)有过几次大的宣传,但我每次试用的结果都不太理想,就没怎么关注过。没想到这次直接憋了一个大活出来,我在 X 上看了几个评测,从感觉上来说提升比较大,尤其是代码方面。本来我也想试用,但是 API 有分级制度,我问了几个问题就被限速了,遂放弃。

技术速递

xAI 发布 Grok 4

有钱就是好啊。官方介绍,亮点如下:

  1. Grok 4 利用 20 万块 GPU 集群进行强化学习训练。计算效率提升 6 倍,显著优化了模型的推理能力
  2. 256k 上下文支持
  3. 支持原生工具调用,多工具协同
  4. 多模态:支持文本、文档、网页、X 平台、视觉、语音

总的来说,xAI 认为 Grok 4 就是目前闭源模型中的“全能选手”。


Qwen 桌面客户端

Qwen 发布桌面客户端

阿里巴巴 Qwen 团队发布了 Qwen 桌面客户端,支持运行 MCP,内置官方 MCPs,也可以自己手动添加,但是手动添加的时候需要注意,如果是 stdio 模式,仅支持使用 uvxnpx 这两个命令。

我体验了一下,优点是运行速度比较快,支持并行调用。缺点也很明显,偶尔断联,开关方式并不方便,没有单独的开关。希望 Qwen 能早点完善,毕竟本地 MCP 不仅这两种运行方式。

对了目前仅支持 macOS。


Manus 跑路了吗

7 月 9 号,我在 X 刷到 Manus 裁员,迁移总部到新加坡的新闻,我其实挺意外的。之前 Manus 也算火过,现在融资也融了,直接把国内的 2/3 的员工给砍了,还清空了国内社交媒体记录。我估计也是暂时放弃国内的业务,因为海外是一个更有利于融资和落地的地方,国内对这种产品的付费意愿不是弱,而是几乎没有。也许这就是 Manus 深思熟虑之后的选择吧,如果他们以后想回来,会以什么方式回来呢?

本周阅读

《最后的问题》——艾萨克·阿西莫夫

最近又看起了科幻小说,《最后的问题》这本书让我联想到之前看过的《银河帝国》系列。我非常喜欢阿西莫夫的写作风格,开头略显无聊,中间剧情跌宕起伏,结局通常意想不到,不像科幻小说,更像一篇悬疑解谜类的小说,这就是他典型的写作风格。而且这本书里很多的所谓“设定”,其实在《银河帝国》中也会反复出现,比如“AI”、“读书机”、“心灵感应”、“心理史学”、“地球毁灭”等等,我想这不仅是阿西莫夫的设定,也是所有科幻小说都会存在的设定。

另一方面,我惊叹于阿西莫夫的想象力,不仅 AI 正沿着他的想象在发展,人类和 AI 的关系也如同他想象的那样在发展。阿西莫夫不愧是“科幻三巨头”之一。

本周市场

A 股站上 3500 点,如果这周能站住 3 天,我会选择看多。反倒是港股,一直在阴跌,让人食之无味,弃之可惜。

结语

最近各家厂商发的模型都提到了 Agent 能力,一款模型是否具备 Agent 能力将在未来很重要,也就是说模型即 Agent。那今年刚发展出来的 MCP 会不会又成为炮灰呢?下期我们聊聊 MCP 和 Agent 吧!

Bye!