Kimi K2
月之暗面在 7 月 11 日发布了 开源模型 K2,下面是它的自我介绍:
🧠 Kimi K2 是什么?
Kimi K2 是我们最新推出的混合专家模型(MoE),拥有 1 万亿总参数 和 320 亿激活参数,在知识、数学和编程任务上达到当前非思考模型的顶尖水平。
但它不止于此——我们特别为 Agentic 任务进行了优化,让它不仅能回答问题,更能主动行动、调用工具、完成复杂任务。
🚀 亮点速览
特性 | 说明 |
---|---|
开源版本 | 同时开源了 Kimi-K2-Base (基础模型)和 Kimi-K2-Instruct (指令微调版) |
代码能力 | 能生成 3D 场景、粒子银河、期货交易系统等复杂前端项目 |
Agent 能力 | 支持多轮工具调用,可自动拆解任务、生成图表、写报告、发邮件 |
训练稳定 | 使用全新 MuonClip 优化器,在 15.5T tokens 上训练无 loss spike |
上下文长度 | 支持最长 128K tokens 上下文 |
可以看到月之暗面的这款模型的侧重点在于 Agent 能力,目前应该还是 preview 版本,支持网页版对话和 API 调用。
Kimi 模型我记得在去年(2024 年)有过几次大的宣传,但我每次试用的结果都不太理想,就没怎么关注过。没想到这次直接憋了一个大活出来,我在 X 上看了几个评测,从感觉上来说提升比较大,尤其是代码方面。本来我也想试用,但是 API 有分级制度,我问了几个问题就被限速了,遂放弃。
技术速递
有钱就是好啊。官方介绍,亮点如下:
- Grok 4 利用 20 万块 GPU 集群进行强化学习训练。计算效率提升 6 倍,显著优化了模型的推理能力
- 256k 上下文支持
- 支持原生工具调用,多工具协同
- 多模态:支持文本、文档、网页、X 平台、视觉、语音
总的来说,xAI 认为 Grok 4 就是目前闭源模型中的“全能选手”。
阿里巴巴 Qwen 团队发布了 Qwen 桌面客户端,支持运行 MCP,内置官方 MCPs,也可以自己手动添加,但是手动添加的时候需要注意,如果是 stdio 模式,仅支持使用 uvx
和 npx
这两个命令。
我体验了一下,优点是运行速度比较快,支持并行调用。缺点也很明显,偶尔断联,开关方式并不方便,没有单独的开关。希望 Qwen 能早点完善,毕竟本地 MCP 不仅这两种运行方式。
对了目前仅支持 macOS。
7 月 9 号,我在 X 刷到 Manus 裁员,迁移总部到新加坡的新闻,我其实挺意外的。之前 Manus 也算火过,现在融资也融了,直接把国内的 2/3 的员工给砍了,还清空了国内社交媒体记录。我估计也是暂时放弃国内的业务,因为海外是一个更有利于融资和落地的地方,国内对这种产品的付费意愿不是弱,而是几乎没有。也许这就是 Manus 深思熟虑之后的选择吧,如果他们以后想回来,会以什么方式回来呢?
本周阅读
《最后的问题》——艾萨克·阿西莫夫
最近又看起了科幻小说,《最后的问题》这本书让我联想到之前看过的《银河帝国》系列。我非常喜欢阿西莫夫的写作风格,开头略显无聊,中间剧情跌宕起伏,结局通常意想不到,不像科幻小说,更像一篇悬疑解谜类的小说,这就是他典型的写作风格。而且这本书里很多的所谓“设定”,其实在《银河帝国》中也会反复出现,比如“AI”、“读书机”、“心灵感应”、“心理史学”、“地球毁灭”等等,我想这不仅是阿西莫夫的设定,也是所有科幻小说都会存在的设定。
另一方面,我惊叹于阿西莫夫的想象力,不仅 AI 正沿着他的想象在发展,人类和 AI 的关系也如同他想象的那样在发展。阿西莫夫不愧是“科幻三巨头”之一。
本周市场
A 股站上 3500 点,如果这周能站住 3 天,我会选择看多。反倒是港股,一直在阴跌,让人食之无味,弃之可惜。
结语
最近各家厂商发的模型都提到了 Agent 能力,一款模型是否具备 Agent 能力将在未来很重要,也就是说模型即 Agent。那今年刚发展出来的 MCP 会不会又成为炮灰呢?下期我们聊聊 MCP 和 Agent 吧!
Bye!