Kimi K2 发布并开源,实测效果确实很强!
上周五,月之暗面正式发布 Kimi K2 模型,并同步开源。
Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。
在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。
今天我们来测评一下,最新的 Kimi K2 有多强。使用 Kimi K2 模型最直接的方式就是官网:
官网地址:
https://www.kimi.com
我们先来个简单的,生成一个知识卡片
Prompt:生成一个关于马斯克的知识卡片
<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<title>埃隆·马斯克知识卡片</title>
<style>
body {
font-family: "Helvetica Neue", Arial, sans-serif;
background:#f5f7fa;
display:flex;
justify-content:center;
align-items:center;
height:100vh;
margin:0;
}
.card {
width:400px;
border-radius:16px;
background:#ffffff;
box-shadow:0 10px 25px rgba(0,0,0,.1);
overflow:hidden;
}
.header {
background:#0d1117;
color:#ffffff;
padding:24px 28px;
}
.header h1 {
margin:0;
font-size:24px;
font-weight:600;
}
.header p {
margin:4px 0 0;
font-size:14px;
color:#c9d1d9;
}
.avatar {
float:right;
width:80px;
height:80px;
border-radius:50%;
object-fit:cover;
margin-left:12px;
}
.body {
padding:24px 28px;
}
.section {
margin-bottom:20px;
}
.section h2 {
margin:0 0 8px;
font-size:16px;
color:#24292f;
border-bottom:1px solid #e1e4e8;
padding-bottom:4px;
}
.section ul {
margin:0;
padding-left:18px;
font-size:14px;
line-height:1.6;
color:#586069;
}
.tag {
display:inline-block;
background:#f3f4f6;
color:#24292f;
margin:4px 6px 4px 0;
padding:4px 10px;
border-radius:12px;
font-size:13px;
}
</style>
</head>
<body>
<div class="card">
<div class="header">
<img class="avatar" src="https://upload.wikimedia.org/wikipedia/commons/3/34/Elon_Musk_Royal_Society_%28crop2%29.jpg" alt="Elon Musk">
<h1>埃隆·马斯克</h1>
<p>Elon Reeve Musk</p>
<p>1971-06-28 / 南非比勒陀利亚</p>
</div>
<div class="body">
<div class="section">
<h2>身份标签</h2>
<span class="tag">连续创业者</span>
<span class="tag">工程师</span>
<span class="tag">工业设计师</span>
<span class="tag">亿万富翁</span>
</div>
<div class="section">
<h2>主要企业</h2>
<ul>
<li><strong>Tesla, Inc.</strong> CEO / 产品架构师</li>
<li><strong>SpaceX</strong> CEO / CTO</li>
<li><strong>X Corp.</strong> (原Twitter) 所有者</li>
<li><strong>Neuralink</strong> 联合创始人</li>
<li><strong>The Boring Company</strong> 创始人</li>
</ul>
</div>
<div class="section">
<h2>里程碑</h2>
<ul>
<li>1995 Zip2 出售 3.07 亿美元</li>
<li>2002 PayPal 出售 15 亿美元</li>
<li>2020 成为全球首富</li>
<li>2025-07 实时身价 ≈ 2,450 亿美元</li>
</ul>
</div>
</div>
</div>
</body>
</html>
可以看到效果还不错,综合审美在线。接下来上一下难度。
Prompt:创建一个 3D HTML 城市,包含高楼道路等。
确实很强,那么除了在官网使用,我们也可以把 Kimi K2 接入到 Claude Code 中。
首先需要申请 Kimi 的 API Key,默认情况下新用户会有 15 元的额度。
申请地址: https://platform.moonshot.cn
新建 API Key #
安装 Claude Code #
注意,安装 Claude Code 之前需要安装 node.js。
安装 claude-code
npm install -g @anthropic-ai/claude-code
设置 ANTHROPIC_BASE_URL 和 ANTHROPIC_API_KEY。
export ANTHROPIC_BASE_URL=https://api.moonshot.cn/anthropic/
export ANTHROPIC_API_KEY=你申请的 API Key
以上为 macOS 配置方法,设置后在终端当前会话中生效,若需长期有效需配置系统环境变量。
在终端输入 claude
命令
如果你也出现以上提示,可以通过把用户目录下的 .claude.json
中的 hasCompletedOnboarding
配置成 "hasCompletedOnboarding": true
。
确认自定义 API:
信任文件目录:
简单 html 页面 #
在当前页面下生成一个天气预报的 html 页面
完整前端工程 #
Prompt:使用 next.js 和 shadcn/ui 在当前目录下创建一个待办清单应用
执行过程中会频繁出现下面错误:
API Error: 429 {"error":{"message":"Your account
org-86889a9ab4274be8902c3607ac7e82ae<ak-f3sa4terjxpi11c9x9zi> request
reached organization max RPM: 3, please try again after 1
seconds","type":"rate_limit_reached_error"}}
这是因为我们是 Free 等级的用户 RPM 为 3 即:
- RPM: request per minute 指一分钟内您最多向我们发起的请求数
下面表示是详细的速率限制表:
用户等级 | 累计充值金额 | 并发 | RPM | TPM | TPD |
---|---|---|---|---|---|
Free | ¥ 0 | 1 | 3 | 32,000 | 1,500,000 |
Tier1 | ¥ 50 | 50 | 200 | 128,000 | 10,000,000 |
Tier2 | ¥ 100 | 100 | 500 | 128,000 | 20,000,000 |
Tier3 | ¥ 500 | 200 | 5,000 | 384,000 | Unlimited |
Tier4 | ¥ 5,000 | 400 | 5,000 | 768,000 | Unlimited |
Tier5 | ¥ 20,000 | 1,000 | 10,000 | 2,000,000 | Unlimited |
为了保证速度,我充值了50,将 RPM 提升至 200,这次速度快了很多,Claude Code 会自动规划任务,并逐步执行 Todos 如下:
⏺ Update Todos
⎿ ☒ Initialize Next.js project with TypeScript
☒ Install and configure shadcn/ui
☐ Create todo list components with shadcn/ui
☐ Implement todo state management
☐ Add CRUD operations for todos
☐ Style the application with shadcn/ui components
如果不想每次都确认,可以选择 dont’t ask again this session ,这样就可以自动确认,我们执行耐心等待即可。
开发完成:
实际效果:
我没有做任何修改即生成完成,效果也很不错。
另外在 Kimi API 后台也可以看 token 的消耗情况:
总结 #
本次测评通过官网和 API 接入 Claude Code 两种方式验证了其强大:从简单的知识卡片生成到复杂的 Next.js 全栈应用开发,Kimi K2 均能高效完成任务,且生成代码质量优秀。也希望国产大模型越来越强,给我们带来更多惊喜!