月之暗面發佈Kimi K2.7 Code：編程模型價格僅為GPT-5.5的十二分之一

月之暗面發佈萬億參數開源編程模型Kimi K2.7 Code，每token價格比GPT-5.5和Claude低至12倍。

月之暗面（Moonshot AI）正式發佈了新一代編程專用模型Kimi K2.7 Code，將AI編程工具的成本門檻再次大幅拉低。該模型以開源權重形式在Hugging Face上提供，專為複雜編程任務和智能體工作流設計，是此前K2.6版本的直接迭代。

從技術架構看，K2.7 Code採用混合專家（MoE）設計，總參數量高達1萬億，但每個token僅激活其中320億參數。模型包含384個專家，每token選取8個，上下文窗口為25.6萬token。它還能處理圖像和視頻輸入，搭載自研的MoonViT視覺編碼器（4億參數）。與K2.6相比，K2.7 Code在推理效率上做出關鍵改進——思考token消耗減少約30%，並強制啟用思考模式和“保留思考”功能，在多輪對話中維持完整推理鏈，以提升智能體編程場景的表現。

在月之暗面內部的Kimi Code Bench v2上，K2.7 Code得分從K2.6的50.9躍升至62.0；在Program Bench上從48.3升至53.6；在MLS Bench Lite上從26.7升至35.1。智能體基準測試方面，MCP Atlas得分從69.4升至76.0，MCPMark Verified從72.8升至81.1。

但與西方頂尖模型的正面對比中，K2.7 Code在純編程基準上仍處下風。GPT-5.5在Program Bench上得分69.1，Claude Opus 4.8和K2.7 Code則分別為53.6和53.6；在Kimi Code Bench v2上，GPT-5.5為69.0，K2.7 Code為62.0。Program Bench是一項特別嚴苛的測試，要求智能體僅憑編譯後的二進制文件和文檔復現程序行為，不能訪問源代碼、反編譯或聯網。

不過，在MCPMark Verified這一測試AI智能體在Notion、GitHub、文件系統、Postgres數據庫和瀏覽器自動化等真實軟件環境中表現的基準上，K2.7 Code以81.1分反超Claude Opus 4.8的76.4分，但仍遠低於GPT-5.5的92.9分。這種基準測試與實際表現之間的差異，恰恰說明了評估模型不能只看單一維度。

真正讓市場側目的是其定價策略。K2.7 Code的API價格為輸入每百萬token 0.95美元、輸出每百萬token 4.00美元，緩存命中時輸入價格進一步降至0.19美元。相比之下，GPT-5.5的定價為輸入5美元、輸出30美元；Claude Opus 4.8為輸入5美元、輸出25美元；Anthropic目前暫停上線的頂級模型Claude Fable 5更是高達輸入10美元、輸出50美元。單看輸出價格，Fable 5是K2.7 Code的12.5倍。

這意味著，在相同的預算下，開發者可以用K2.7 Code運行更多次推理、嘗試更多方案、覆蓋更大規模的代碼庫。文章提出的核心問題並非“它是不是最好的模型”，而是“同等預算下多出來的運行次數能否彌補質量差距”。這個問題的答案高度依賴具體任務，需要開發者用自己的基準測試來評估。但在token經濟日益成形的當下，每token成本正成為與模型原始能力同等重要的競爭維度。

模型採用修改後的MIT許可證，允許自由使用、修改和再分發，但附加條款要求：任何月活超1億或月收入超2000萬美元的商業產品若使用K2.7 Code或其衍生版本，須在用戶界面顯著標註“Kimi K2.7 Code”。月之暗面還預告即將推出“6倍高速模式”，並已支持通過Kimi API、Kimi Code CLI以及vLLM和SGLang等推理引擎訪問，同時提供原生INT4量化版本以降低硬件門檻。

從產業格局看，月之暗面此舉延續了中國AI公司在開源模型和成本控制上的激進路線。當西方頭部模型仍在追求基準分數的絕對領先時，K2.7 Code選擇在“夠用就好”和“極致性價比”之間尋找突破口。這種策略對中小開發團隊和預算敏感的企業級應用具有明顯吸引力，也可能倒逼西方廠商重新審視自己的定價體系。在AI編程助手市場競爭白熱化的當下，Cursor等工具已在轉售Kimi模型的修改版本，生態綁定效應值得持續關注。

月之暗面發佈Kimi K2.7 Code：編程模型價格僅為GPT-5.5的十二分之一

延伸閱讀

相關深度報道

相關每日新聞