您現在可在 Amazon Bedrock 中使用 Anthropic 經過升級的 Claude 3.5 Sonnet 模型和電腦

張貼日期: 2024年10月22日

Anthropic 的 Claude 3.5 Sonnet 模型目前已在 Amazon Bedrock 上推出。根據 Anthropic 所述,相較於前代產品,該模型進行了全面改進,並在其已經處於領先地位的編碼領域取得了顯著的成果。

升級的 Claude 3.5 Sonnet 模型展現出了在產業基準上的顯著改進。根據 Anthropic 所述,該模型在編碼時可將 SWE-bench Verified 上的性能從 33% 提高到 49%,得分高於所有公用模型。此外,在零售領域中,TAU-bench 的效能 (一項代理工具使用任務) 從 62.6% 提高至 69.2%,在航空公司領域則是從 36.0% 提升至 46.0%。全新 Claude 3.5 Sonnet 透過與前代產品相同的價格提供了這些改進效能。此外,Claude 3.5 Sonnet 目前在 Amazon Bedrock 中提供了電腦使用功能公開測試版,使 Claude 得以感知電腦介面,並與其互動。開發人員可以指導 Claude 按照人類的方式使用電腦 (透過觀看螢幕、移動游標、按下按鈕及輸入文字)。由於這項技術還處於早期階段,我們鼓勵開發人員探索較低風險的任務。

升級的 Claude 3.5 Sonnet 模型現已在美國西部 (奧勒岡) 區域的 Amazon Bedrock 上提供。 現已提供電腦公開 Beta 版。若要進一步了解,請參閱 AWS 新聞發佈部落格Amazon Bedrock 產品頁面上的 Claude,以及相關文件。若要開始使用 Claude,請前往 Amazon Bedrock 主控台