Kimi K2 发布并开源,实测效果确实很强!

·467 字·3 分钟
AI

上周五,月之暗面正式发布 Kimi K2 模型,并同步开源。

Kimi K2 是一款具备更强代码能力、更擅长通用 Agent 任务的 MoE 架构基础模型,总参数 1T,激活参数 32B。

在 SWE Bench Verified、Tau2、AceBench 等基准性能测试中,Kimi K2 均取得开源模型中的 SOTA 成绩,展现出在代码、Agent、数学推理任务上的领先能力。

今天我们来测评一下,最新的 Kimi K2 有多强。使用 Kimi K2 模型最直接的方式就是官网:

官网地址: https://www.kimi.com
我们先来个简单的,生成一个知识卡片

Prompt:生成一个关于马斯克的知识卡片

<!DOCTYPE html>
<html lang="zh-CN">
<head>
<meta charset="UTF-8">
<title>埃隆·马斯克知识卡片</title>
<style>
    body {
        font-family: "Helvetica Neue", Arial, sans-serif;
        background:#f5f7fa;
        display:flex;
        justify-content:center;
        align-items:center;
        height:100vh;
        margin:0;
    }
    .card {
        width:400px;
        border-radius:16px;
        background:#ffffff;
        box-shadow:0 10px 25px rgba(0,0,0,.1);
        overflow:hidden;
    }
    .header {
        background:#0d1117;
        color:#ffffff;
        padding:24px 28px;
    }
    .header h1 {
        margin:0;
        font-size:24px;
        font-weight:600;
    }
    .header p {
        margin:4px 0 0;
        font-size:14px;
        color:#c9d1d9;
    }
    .avatar {
        float:right;
        width:80px;
        height:80px;
        border-radius:50%;
        object-fit:cover;
        margin-left:12px;
    }
    .body {
        padding:24px 28px;
    }
    .section {
        margin-bottom:20px;
    }
    .section h2 {
        margin:0 0 8px;
        font-size:16px;
        color:#24292f;
        border-bottom:1px solid #e1e4e8;
        padding-bottom:4px;
    }
    .section ul {
        margin:0;
        padding-left:18px;
        font-size:14px;
        line-height:1.6;
        color:#586069;
    }
    .tag {
        display:inline-block;
        background:#f3f4f6;
        color:#24292f;
        margin:4px 6px 4px 0;
        padding:4px 10px;
        border-radius:12px;
        font-size:13px;
    }
</style>
</head>
<body>

<div class="card">
    <div class="header">
        <img class="avatar" src="https://upload.wikimedia.org/wikipedia/commons/3/34/Elon_Musk_Royal_Society_%28crop2%29.jpg" alt="Elon Musk">
        <h1>埃隆·马斯克</h1>
        <p>Elon Reeve Musk</p>
        <p>1971-06-28 / 南非比勒陀利亚</p>
    </div>

    <div class="body">
        <div class="section">
            <h2>身份标签</h2>
            <span class="tag">连续创业者</span>
            <span class="tag">工程师</span>
            <span class="tag">工业设计师</span>
            <span class="tag">亿万富翁</span>
        </div>

        <div class="section">
            <h2>主要企业</h2>
            <ul>
                <li><strong>Tesla, Inc.</strong> CEO / 产品架构师</li>
                <li><strong>SpaceX</strong> CEO / CTO</li>
                <li><strong>X Corp.</strong> (原Twitter) 所有者</li>
                <li><strong>Neuralink</strong> 联合创始人</li>
                <li><strong>The Boring Company</strong> 创始人</li>
            </ul>
        </div>

        <div class="section">
            <h2>里程碑</h2>
            <ul>
                <li>1995 Zip2 出售 3.07 亿美元</li>
                <li>2002 PayPal 出售 15 亿美元</li>
                <li>2020 成为全球首富</li>
                <li>2025-07 实时身价 ≈ 2,450 亿美元</li>
            </ul>
        </div>
    </div>
</div>

</body>
</html>

可以看到效果还不错,综合审美在线。接下来上一下难度。

Prompt:创建一个 3D HTML 城市,包含高楼道路等。

确实很强,那么除了在官网使用,我们也可以把 Kimi K2 接入到 Claude Code 中。

首先需要申请 Kimi 的 API Key,默认情况下新用户会有 15 元的额度。

申请地址: https://platform.moonshot.cn

新建 API Key #

安装 Claude Code #

注意,安装 Claude Code 之前需要安装 node.js。

安装 claude-code

npm install -g @anthropic-ai/claude-code

设置 ANTHROPIC_BASE_URL 和 ANTHROPIC_API_KEY。

export ANTHROPIC_BASE_URL=https://api.moonshot.cn/anthropic/
export ANTHROPIC_API_KEY=你申请的 API Key

以上为 macOS 配置方法,设置后在终端当前会话中生效,若需长期有效需配置系统环境变量。

在终端输入 claude 命令

如果你也出现以上提示,可以通过把用户目录下的 .claude.json 中的 hasCompletedOnboarding 配置成 "hasCompletedOnboarding": true

https://ainativedev.io/news/configuring-claude-code

确认自定义 API:

信任文件目录:

简单 html 页面 #

在当前页面下生成一个天气预报的 html 页面

完整前端工程 #

Prompt:使用 next.js 和 shadcn/ui 在当前目录下创建一个待办清单应用

执行过程中会频繁出现下面错误:

API Error: 429 {"error":{"message":"Your account
     org-86889a9ab4274be8902c3607ac7e82ae<ak-f3sa4terjxpi11c9x9zi> request
     reached organization max RPM: 3, please try again after 1
     seconds","type":"rate_limit_reached_error"}}

这是因为我们是 Free 等级的用户 RPM 为 3 即:

  • RPM: request per minute 指一分钟内您最多向我们发起的请求数

下面表示是详细的速率限制表:

用户等级 累计充值金额 并发 RPM TPM TPD
Free ¥ 0 1 3 32,000 1,500,000
Tier1 ¥ 50 50 200 128,000 10,000,000
Tier2 ¥ 100 100 500 128,000 20,000,000
Tier3 ¥ 500 200 5,000 384,000 Unlimited
Tier4 ¥ 5,000 400 5,000 768,000 Unlimited
Tier5 ¥ 20,000 1,000 10,000 2,000,000 Unlimited

为了保证速度,我充值了50,将 RPM 提升至 200,这次速度快了很多,Claude Code 会自动规划任务,并逐步执行 Todos 如下:

⏺ Update Todos
  ⎿  ☒ Initialize Next.js project with TypeScript
     ☒ Install and configure shadcn/ui
     ☐ Create todo list components with shadcn/ui
     ☐ Implement todo state management
     ☐ Add CRUD operations for todos
     ☐ Style the application with shadcn/ui components

如果不想每次都确认,可以选择 dont’t ask again this session ,这样就可以自动确认,我们执行耐心等待即可。

开发完成:

实际效果:

我没有做任何修改即生成完成,效果也很不错。

另外在 Kimi API 后台也可以看 token 的消耗情况:

总结 #

本次测评通过官网和 API 接入 Claude Code 两种方式验证了其强大:从简单的知识卡片生成到复杂的 Next.js 全栈应用开发,Kimi K2 均能高效完成任务,且生成代码质量优秀。也希望国产大模型越来越强,给我们带来更多惊喜!