Anthropic 的升級版 Claude 3.5 Sonnet 現已在亞太地區 (雪梨) 推出
Anthropic 的 Claude 3.5 Sonnet 模型目前已在亞太地區 (雪梨) AWS 區域的 Amazon Bedrock 推出。根據 Anthropic 所述,相較於前代產品,該模型進行了全面改進,並在其已經處於領先地位的編碼領域取得了顯著的成果。
升級的 Claude 3.5 Sonnet 模型展現出了在產業基準上的顯著改進。該模型在編碼後可將 SWE-bench Verified 上的性能從 33% 提高到 49%。此外,在零售領域中,TAU-bench 的效能 (一項代理工具使用任務) 從 62.6% 提高至 69.2%,在航空公司領域則是從 36.0% 提升至 46.0%。此模型提供這些效能改進,但價格與其前代產品相同。此外,Claude 3.5 Sonnet 目前在 Amazon Bedrock 中提供了電腦使用功能公開測試版,使 Claude 得以感知電腦介面,並與其互動。開發人員可以指導 Claude 按照人類的方式使用電腦 (透過觀看螢幕、移動游標、按下按鈕及輸入文字)。由於這項技術還處於早期階段,我們鼓勵開發人員探索較低風險的任務。
若要進一步了解,請參閱 AWS 新聞發佈部落格、Amazon Bedrock 產品頁面上的 Claude,以及相關文件。若要開始使用 Claude,請前往 Amazon Bedrock 主控台。