国产精品一区二区av片,亚洲午夜综合网,91亚洲欧洲日产国码精品,国产午夜福利精品一区二区三区,91精品啪在线观看国产色,精品国产美女福到在线直播,久久露脸国产精品,国产另类ts人妖一区二区,国产性一交一乱一伦一色一情 ,国产对白国语对白

關(guān)于ZAKER 合作
愛范兒 13小時前

Claude「最香」模型發(fā)布,速度翻倍價格大砍,編程能力直逼 GPT-5

就在剛剛,Anthropic 發(fā)布了 Claude Haiku 4.5。

先簡單科普一下,Claude 家族有三個不同參數(shù)量級的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。

這次更新最大的看點是,小杯 Claude Haiku 4.5 在模型性能保持高水準(zhǔn)的同時,速度更快、價格更便宜了

五個月前,Claude Sonnet 4 還是最先進(jìn)的模型之一?,F(xiàn)在新出的 Haiku 4.5 在編碼性能上幾乎和它打平手,但價格只要三分之一,速度還翻了兩倍多。

▲ Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具體來說,在用于衡量 AI 編碼能力的測試集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成績,什么概念?直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平線上。

在某些任務(wù)比如操控電腦方面,Haiku 4.5 甚至反殺了老大哥 Sonnet 4。

對于需要 AI 處理實時、低延遲任務(wù)的場景——比如聊天助手、客服代理或結(jié)對編程助手,Haiku 4.5 兼具高智能和出色速度,能帶來更好的體驗。

使用 Claude Code 的開發(fā)者也會發(fā)現(xiàn),Haiku 4.5 讓整個編程過程——從多智能體協(xié)作到快速原型開發(fā)——都變得更靈敏高效。

當(dāng)然,兩周前發(fā)的 Sonnet 4.5 依然是 Anthropic 的旗艦?zāi)P?,歸屬全球編程模型第一檔次。但 Haiku 4.5 提供了另一個選項:性能接近頂配,價格卻親民得多。

而且模型玩法更野了,Sonnet 4.5 可以把復(fù)雜問題拆成 N 個小任務(wù),然后指揮一堆 Haiku 4.5 并行開工,這配合相當(dāng)默契。

Anthropic 對 Haiku 4.5 進(jìn)行了詳細(xì)的安全性和對齊性測試。

結(jié)果顯示,該模型的不良行為發(fā)生率較低,且比前代 Haiku 3.5 的對齊性顯著提高。在自動化對齊評估中,Haiku 4.5 的總體偏離行為比 Sonnet 4.5 和 Opus 4.1 都更少。

也就是說,它目前是 Anthropic 家最安全的模型。

▲ Comparison table of frontier models across popular benchmarks

至于價格嘛 ...Haiku 4.5 的定價為:每百萬輸入 token 1 美元,每百萬輸出 token 5 美元。

對比來看,GPT-5 mini 約為每百萬輸入 0.25 美元、輸出 2.5 美元,Google 的 Gemini 2.5 Flash 價格差不多。也就是說,Haiku 4.5 的價格大約是 GPT-5 mini 或 Flash 的 4 倍。

不過跟 Sonnet 4.5 比,它便宜了約三倍,性能卻幾乎沒差,這對開發(fā)者來說算是降本增效了。

但有一說一,數(shù)學(xué)不是它的強(qiáng)項。

知名博主 Dan Shipper 試用后發(fā)現(xiàn),Haiku 在算術(shù)上有點 ... 迷糊。

比如在測試 Uber 賬單的例子里,Haiku 雖然完美找出了所有相關(guān)郵件,但算總額時直接翻車。更尷尬的是,指出錯誤后它承認(rèn)了——然后轉(zhuǎn)頭又犯了同樣的錯

Dan Shipper 給出的中肯評價是:

如果你是開發(fā)者或創(chuàng)業(yè)者,正在用 Sonnet 4.5 構(gòu)建復(fù)雜的智能代理應(yīng)用,現(xiàn)在可以考慮切換到 Haiku。你能節(jié)省大量成本,而性能損失幾乎可以忽略。

如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建議試試 Haiku。雖然價格更高一些,但在需要調(diào)用工具和保持自主性的場景中,它的表現(xiàn)更好。

▲附上博客地址:

https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

目前,Claude Haiku 4.5 現(xiàn)已在 Claude Code 和各類應(yīng)用中上線了。

開發(fā)者可以通過 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且價格是 Anthropic 最香的那檔。

我們參考 @zb1992 的提示詞,讓 Claude 4.5 Haiku 跑了一個鐘表 Demo,整體體驗下來,代碼生成速度確實更快了,最終成品也令人滿意。

在下文這個經(jīng)典的推理計算題, Claude 4.5 Haiku 響應(yīng)速度優(yōu)勢就更明顯了,當(dāng)然,這也正是輕量級模型在實際應(yīng)用中的核心競爭力所在。

另外,據(jù) The Information 報道,估值高達(dá) 1700 億美元的 Anthropic 近幾周已告訴投行顧問,計劃通過收購引入更多技術(shù)人才,同時拓展除編程助手之外的能力——畢竟目前編程這塊還是營收大頭。

知情人士表示,鑒于 Anthropic 在向開發(fā)者提供編程類 AI 產(chǎn)品方面取得的成功,公司下一步可能會擴(kuò)展至其他開發(fā)者常用的軟件工具,比如自動測試代碼漏洞的工具,或輔助軟件設(shè)計的工具。

另有消息稱,Anthropic 也可能通過收購開發(fā)面向特定行業(yè)的產(chǎn)品,例如金融服務(wù)、醫(yī)療保健或網(wǎng)絡(luò)安全,不過他們更傾向于交易金額在 5 億美元以下的小型收購項目。

目前看起來,在提升模型能力的同時,Anthropic 也在積極布局生態(tài)。AI 圈的你追我趕,最終受益的還是開發(fā)者和用戶——更強(qiáng)的模型、更低的價格、更多的選擇。

作者:莫崇宇

相關(guān)閱讀

最新評論

沒有更多評論了
99re热精品视频国产免费| 亚洲午夜福利精品无码不卡| 日本精品卡二卡三卡四卡2021| 久久久亚洲国产精品主播| 8090成人午夜精品无码| 无码一区二区三区在线| 国产亚洲精品国产福利在线观看| 欧美丰满熟妇xxxx性ppx人交| 中文日韩在线一区二区| 婷婷伊人久久| 福利一区二区三区导航| 国产熟女真实乱精品51| 国产成人精品999在线观看| 视频一本大道香蕉久在线播放| 人妻有码av中文字幕久久琪| 国产91成人精品亚洲精品| 91精品久久一区二区三区| 亚洲中文字幕无码av网址| 成人无码一区二区三区网站| 国产综合视频一区二区三区| 一本色道久久综合狠狠躁中文| 日本午夜影院| 国产精品白浆免费观看| 午夜福利日本一区二区无码| 欧美老熟妇乱子伦牲交视频| 亚洲欧美自偷自拍视频图片| 国产精品高潮呻吟av久久男男| 国产精品免费jizzjizz| 欧美日本国产va高清cabal| 亚洲sm另类一区二区三区| 2020国产成人精品影视| 青青草免费公开视频| 神马午夜久久精品人妻| 好吊妞| 国产福利社区一区二区| 在教室伦流澡到高潮hgl动漫| 最新国产在线拍揄自揄视频| 国产精品香蕉在线观看不卡| 国产欧美精品另类又又久久| 高清无h码动漫在线观看尤物| 国内成人激情在线视频|