先簡單科普一下,Claude 家族有三個不同參數(shù)量級的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。
這次更新最大的看點是,小杯 Claude Haiku 4.5 在模型性能保持高水準(zhǔn)的同時,速度更快、價格更便宜了。
五個月前,Claude Sonnet 4 還是最先進(jìn)的模型之一?,F(xiàn)在新出的 Haiku 4.5 在編碼性能上幾乎和它打平手,但價格只要三分之一,速度還翻了兩倍多。
具體來說,在用于衡量 AI 編碼能力的測試集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成績,什么概念?直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平線上。
在某些任務(wù)比如操控電腦方面,Haiku 4.5 甚至反殺了老大哥 Sonnet 4。
對于需要 AI 處理實時、低延遲任務(wù)的場景——比如聊天助手、客服代理或結(jié)對編程助手,Haiku 4.5 兼具高智能和出色速度,能帶來更好的體驗。
使用 Claude Code 的開發(fā)者也會發(fā)現(xiàn),Haiku 4.5 讓整個編程過程——從多智能體協(xié)作到快速原型開發(fā)——都變得更靈敏高效。
當(dāng)然,兩周前發(fā)的 Sonnet 4.5 依然是 Anthropic 的旗艦?zāi)P?,歸屬全球編程模型第一檔次。但 Haiku 4.5 提供了另一個選項:性能接近頂配,價格卻親民得多。
而且模型玩法更野了,Sonnet 4.5 可以把復(fù)雜問題拆成 N 個小任務(wù),然后指揮一堆 Haiku 4.5 并行開工,這配合相當(dāng)默契。
Anthropic 對 Haiku 4.5 進(jìn)行了詳細(xì)的安全性和對齊性測試。
結(jié)果顯示,該模型的不良行為發(fā)生率較低,且比前代 Haiku 3.5 的對齊性顯著提高。在自動化對齊評估中,Haiku 4.5 的總體偏離行為比 Sonnet 4.5 和 Opus 4.1 都更少。
也就是說,它目前是 Anthropic 家最安全的模型。
至于價格嘛 ...Haiku 4.5 的定價為:每百萬輸入 token 1 美元,每百萬輸出 token 5 美元。
對比來看,GPT-5 mini 約為每百萬輸入 0.25 美元、輸出 2.5 美元,Google 的 Gemini 2.5 Flash 價格差不多。也就是說,Haiku 4.5 的價格大約是 GPT-5 mini 或 Flash 的 4 倍。
不過跟 Sonnet 4.5 比,它便宜了約三倍,性能卻幾乎沒差,這對開發(fā)者來說算是降本增效了。
但有一說一,數(shù)學(xué)不是它的強(qiáng)項。
知名博主 Dan Shipper 試用后發(fā)現(xiàn),Haiku 在算術(shù)上有點 ... 迷糊。
比如在測試 Uber 賬單的例子里,Haiku 雖然完美找出了所有相關(guān)郵件,但算總額時直接翻車。更尷尬的是,指出錯誤后它承認(rèn)了——然后轉(zhuǎn)頭又犯了同樣的錯
Dan Shipper 給出的中肯評價是:
如果你是開發(fā)者或創(chuàng)業(yè)者,正在用 Sonnet 4.5 構(gòu)建復(fù)雜的智能代理應(yīng)用,現(xiàn)在可以考慮切換到 Haiku。你能節(jié)省大量成本,而性能損失幾乎可以忽略。
如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建議試試 Haiku。雖然價格更高一些,但在需要調(diào)用工具和保持自主性的場景中,它的表現(xiàn)更好。
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked
目前,Claude Haiku 4.5 現(xiàn)已在 Claude Code 和各類應(yīng)用中上線了。
開發(fā)者可以通過 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且價格是 Anthropic 最香的那檔。
在下文這個經(jīng)典的推理計算題, Claude 4.5 Haiku 響應(yīng)速度優(yōu)勢就更明顯了,當(dāng)然,這也正是輕量級模型在實際應(yīng)用中的核心競爭力所在。
另有消息稱,Anthropic 也可能通過收購開發(fā)面向特定行業(yè)的產(chǎn)品,例如金融服務(wù)、醫(yī)療保健或網(wǎng)絡(luò)安全,不過他們更傾向于交易金額在 5 億美元以下的小型收購項目。
目前看起來,在提升模型能力的同時,Anthropic 也在積極布局生態(tài)。AI 圈的你追我趕,最終受益的還是開發(fā)者和用戶——更強(qiáng)的模型、更低的價格、更多的選擇。
作者:莫崇宇