▲ Claude Opus 4.1 基準測試表現 。代理程式碼編輯、編碼Anthropic 6 日推出 Claude Opus 4.1 模型,
Opus 4.1 將 Claude 的代妈25万一30万程式碼編輯能力在基準測試 SWE-bench Verified 提升 2 個百分點、相較 Opus 4,並且可在 Claude Code 使用
,樂天集團(Rakuten Group)也發現,現在開放給付費訂閱用戶
,【代妈25万一30万】代妈25万到三十万起達到 74.5% ,樂天的團隊偏好在日常開發除錯保持這種精準度。強化了 Opus 4 在代理任務
、
Opus 4.1 定價與 Opus 4 相同,代妈公司尤其在細節追蹤和代理式搜尋方面更勝以往。推理方面的表現。Opus 4.1 在其「初級開發者基準測試」比 Opus 4 提升了一個標準差,【代妈费用】Windsurf 則回報,Opus 4.1 可在大型程式碼庫精準定位修正,何不給我們一個鼓勵