月之暗面(Moonshot AI)正式發佈了新一代編程專用模型Kimi K2.7 Code,將AI編程工具的成本門檻再次大幅拉低。該模型以開源權重形式在Hugging Face上提供,專為複雜編程任務和智能體工作流設計,是此前K2.6版本的直接迭代。

從技術架構看,K2.7 Code採用混合專家(MoE)設計,總參數量高達1萬億,但每個token僅激活其中320億參數。模型包含384個專家,每token選取8個,上下文窗口為25.6萬token。它還能處理圖像和視頻輸入,搭載自研的MoonViT視覺編碼器(4億參數)。與K2.6相比,K2.7 Code在推理效率上做出關鍵改進——思考token消耗減少約30%,並強制啟用思考模式和“保留思考”功能,在多輪對話中維持完整推理鏈,以提升智能體編程場景的表現。

在月之暗面內部的Kimi Code Bench v2上,K2.7 Code得分從K2.6的50.9躍升至62.0;在Program Bench上從48.3升至53.6;在MLS Bench Lite上從26.7升至35.1。智能體基準測試方面,MCP Atlas得分從69.4升至76.0,MCPMark Verified從72.8升至81.1

但與西方頂尖模型的正面對比中,K2.7 Code在純編程基準上仍處下風。GPT-5.5在Program Bench上得分69.1,Claude Opus 4.8和K2.7 Code則分別為53.6和53.6;在Kimi Code Bench v2上,GPT-5.5為69.0,K2.7 Code為62.0。Program Bench是一項特別嚴苛的測試,要求智能體僅憑編譯後的二進制文件和文檔復現程序行為,不能訪問源代碼、反編譯或聯網。

不過,在MCPMark Verified這一測試AI智能體在Notion、GitHub、文件系統、Postgres數據庫和瀏覽器自動化等真實軟件環境中表現的基準上,K2.7 Code以81.1分反超Claude Opus 4.8的76.4分,但仍遠低於GPT-5.5的92.9分。這種基準測試與實際表現之間的差異,恰恰說明了評估模型不能只看單一維度。

真正讓市場側目的是其定價策略。K2.7 Code的API價格為輸入每百萬token 0.95美元、輸出每百萬token 4.00美元,緩存命中時輸入價格進一步降至0.19美元。相比之下,GPT-5.5的定價為輸入5美元、輸出30美元;Claude Opus 4.8為輸入5美元、輸出25美元;Anthropic目前暫停上線的頂級模型Claude Fable 5更是高達輸入10美元、輸出50美元。單看輸出價格,Fable 5是K2.7 Code的12.5倍

這意味著,在相同的預算下,開發者可以用K2.7 Code運行更多次推理、嘗試更多方案、覆蓋更大規模的代碼庫。文章提出的核心問題並非“它是不是最好的模型”,而是“同等預算下多出來的運行次數能否彌補質量差距”。這個問題的答案高度依賴具體任務,需要開發者用自己的基準測試來評估。但在token經濟日益成形的當下,每token成本正成為與模型原始能力同等重要的競爭維度。

模型採用修改後的MIT許可證,允許自由使用、修改和再分發,但附加條款要求:任何月活超1億或月收入超2000萬美元的商業產品若使用K2.7 Code或其衍生版本,須在用戶界面顯著標註“Kimi K2.7 Code”。月之暗面還預告即將推出“6倍高速模式”,並已支持通過Kimi API、Kimi Code CLI以及vLLM和SGLang等推理引擎訪問,同時提供原生INT4量化版本以降低硬件門檻。

從產業格局看,月之暗面此舉延續了中國AI公司在開源模型和成本控制上的激進路線。當西方頭部模型仍在追求基準分數的絕對領先時,K2.7 Code選擇在“夠用就好”和“極致性價比”之間尋找突破口。這種策略對中小開發團隊和預算敏感的企業級應用具有明顯吸引力,也可能倒逼西方廠商重新審視自己的定價體系。在AI編程助手市場競爭白熱化的當下,Cursor等工具已在轉售Kimi模型的修改版本,生態綁定效應值得持續關注。