什麼是 S3 Vectors?
Amazon S3 Vectors 是首個提供針對存放與查詢向量提供原生支援的雲端物件存放區,能夠為 AI 代理程式、AI 推論,以及針對 Amazon S3 內儲存內容的語義搜尋作業提供量身打造、成本最佳化的向量儲存空間。S3 Vectors 最多可將上傳、儲存和查詢向量的成本降低 90%,讓建立和使用大型向量資料集更具成本效益,進而改善 AI 代理程式的記憶功能和情境處理,以及 S3 資料的語義搜尋結果。S3 Vectors 是為提供與 Amazon S3 相同的彈性、擴展性和耐用性而專門設計,可讓您以次秒級查詢效能來存放最高達數十億向量和搜尋資料。該服務非常適合需要大規模建置和維護向量索引的應用程式,讓您可以組織和搜索大量資訊。
藉助 AI 型儲存體來加速建置
您可藉助 S3 Vector,善用專門的 API 集來存放、存取及查詢向量,無須佈建任何基礎結構。S3 Vector 與 Amazon Bedrock 知識庫原生整合,包括在 Amazon SageMaker Unified Studio 內,以便減少檢索增強生成 (RAG) 的費用。透過與 Amazon OpenSearch Service 整合,您可以採用分層策略,將大型向量資料集儲存在 S3 中,以便獲得近乎即時的存取效能,同時輕鬆啟動 OpenSearch 中具有最高效能需求的向量資料。
資料點
90%
減少儲存、上傳與查詢向量的費用20 億
每個索引存放與查詢向量數目上限100 ms
最低暖查詢延遲效能10,000
每個儲存貯體的索引數目,最高達 20 萬億個向量優勢
確保延遲不到一秒的查詢效能,同時將上傳、存放及查詢向量的費用減少最高達 90%。無須選擇昂貴的儲存選項,且只需依用量付費,進而革新您存放數百萬乃至數十億向量的經濟模式。高效地擴展龐大的向量,而無須管理基礎結構,並利用向量索引來整理資料,不需要任何佈建即可適應日益演變的工作負載。針對向量驅動的 AI 使用案例進行專門設計,S3 Vectors 可在效能與效率方面切實地達成平衡。
生成精細的向量嵌入項目,從非結構化資料中獲取更深入的理解,包括影像、影片、音訊及文字。可針對向量搜尋應用程式進行彈性擴展,以便依據語義相似性來改善精細度。無論是分析新聞內容、索引體育亮點,還是處理醫療影像與基因體資料,S3 Vectors 都能憑藉持續一致的查詢效能與靈活的擴展,來為大量工作負載提供支援。
藉助 S3 Vector 來處理大型、長期的向量資料,這些向量資料無須使用具備高輸送量效能的記憶體向量資料庫。Amazon OpenSearch Service 可交付即時應用程式所需的高 QPS (每秒查詢量)、低延遲向量搜尋,而 S3 Vector 則可提供成本最佳化資料基礎,並且具備針對長期儲存與不常存取資料最佳化的查詢效能,兩者相輔相成。此外,您還可受益於提供強效一致性保證的儲存架構,從而確保後續查詢一律包括您最近新增的資料。
善用內建連線能力,並搭配 Amazon OpenSearch Service,以最佳成本效能進行向量搜尋,並使用 Amazon Bedrock 知識庫,以更低成本建置增強的 RAG 應用程式。在 Amazon SageMaker Unified Studio 內存取 Amazon Bedrock,以便使用現有的專案設定檔,來建置推論驅動型應用程式,從而建立整合式、可擴展,以及可共享的 AI 開發環境,來提升團隊協作。
使用案例
依據語義含義與相似度來確定搜尋結果
跨大量向量資料集執行語義與相似度搜尋。媒體機構可對數百萬小時的影片進行索引,以便即刻找到相關片段來製作精彩片段,而醫療機構可存放數十億代表醫學影像的向量嵌入項目,來確定相似病例以及加快診斷速度。藉助 S3 Vector,您能夠在不影響規模的情況下,以更低費用來解鎖非結構化資料的語義值。
藉助 Amazon Bedrock 整合來減少 RAG 費用
藉由整合 S3 Vectors 與 Amazon Bedrock 知識庫,來減少檢索增強生成 (RAG) 費用。透過使用 RAG 應用程式,將專屬資料集轉化為具備情境感知的智慧知識庫。藉助 Amazon Bedrock 的主控台、API、SDK,或者直接在 Amazon SageMaker Unified Studio 內存取 S3 Vectors 中的可擴展向量資料,以及高效能基礎模型與進階知識庫,以便快速建置及自訂生成式 AI 應用程式。
藉助擴大且持久的記憶體來建置更智慧的 AI 代理程式
保留更多關聯內容,藉助更豐富的資料來進行推理,以及透過實惠、大規模的向量儲存體,來建置持久的記憶體,藉此讓您的 AI 代理程式更智慧。以較低的成本,在 PB 級向量資料中,存放每一次互動、文件與洞察,讓代理程式不會被迫忘記寶貴的關聯內容。支援持續性學習、歷程關聯內容、再次培訓,以及微調,來促進更深入地探究代理程式智慧。無論是用於代理程式記憶體,還是跨大量 AI 資料集進行相似度搜尋,S3 Vectors 都能提供經濟高效的資料基礎來存放及擷取向量。
適用於任意開發規模的 AI 型儲存體
存放及迅速存取任意數量的向量資料,以便快速啟動 AI 專案。藉助 S3 Vectors,無須設定基礎結構,即可讓您利用資料來開展工作,並即刻開始 AI 開發。此外,該服務還專門建置用於滿足複雜型 AI 應用程式的嚴苛儲存要求。無論您要建置個人化引擎、自然語言處理系統,還是要導覽大型程式碼庫,S3 Vectors 都能為您提供可依據您的需求擴展的成本最佳化 AI 儲存體,從原型製做到生產,在每一步都能加速 AI 創新。
藉助 Amazon OpenSearch Service 來最佳化向量搜尋價格效能比
透過將 S3 Vectors 中業界領先的可擴展向量儲存體的經濟性,與 Amazon OpenSearch Service 的高效能搜尋功能相結合,來實現高輸送量、低延遲向量搜尋,來平衡成本與效能。搭配使用 S3 Vectors 與 Amazon OpenSearch Service,可減少查詢量較低之向量的儲存費用,然後隨需求增加快速將其移至 OpenSearch 或增強搜尋功能。憑藉此策略性整合,您可以依據效能要求,將向量工作負載分配至最適當的服務,從而確保成本最佳化,以及卓越的查詢回應。
客戶
March Networks
March Networks 是 Delta Group 旗下公司,與全球最大型的銀行及零售商協作交付安全、以雲端為基礎的智慧影片解決方案,藉助即時的商業洞察來增強安全性、營運效率,以及營利能力。
「在大規模影片與相片智慧方面,Amazon S3 Vectors 可提供顯而易見的優勢。藉助其成本最佳化架構,我們能以經濟的方式來存放數十億向量嵌入項目,而順暢整合 Amazon Bedrock 與 S3,能夠精簡生成式 AI 與影片工作流程。透過善用 S3 龐大的規模,以及 99.999999999% 的耐久性,我們獲得了管理日益增長的影片資料與向量嵌入項目所需的穩定性。憑藉高輸送量與低延遲語義搜尋,我們不到一秒鐘的時間,即刻獲得整個影片封存的洞察。S3 Vectors 提供了可擴展、經濟高效的儲存層,這對於進行大規模相片與影片分析至關重要。」
March Networks 產品長 Jeff Corrall
Qlik
Qlik 是一間專於採用 AI 技術進行資料分析與整合的全球化軟體公司,讓組織能藉助即時的資料存取與洞察,來做出更快捷、更明智的決策。其端對端平台將 AI、自動化與受控資料工作流程相結合,以便將原始資料轉換為切實可行的智慧。
「我們藉助 OpenSearch 來善用前端 S3 向量引擎,可擷取透過大量資源索引提供支援的數億向量。這樣一來,我們的分析與資料整合產品中的全部實體皆能實現完整的語義搜尋功能,以便資料工程師、分析取用者,以及 AI 代理程式使用。」
Qlik 首席架構設計師 Martin Andersson
MIXI
MIXI, Inc. 可大規模交付社交通訊與數位娛樂體驗,藉助行動裝置遊戲、體育賽事參與,以及社群平台,來與數百萬使用者建立聯繫。藉由結合深度客戶理解與資料驅動型創新,MIXI 建置了各項互動式服務,可讓人們建立聯繫與豐富日常生活。
「我們能夠採用 Amazon S3 Vectors,來建置靈活的中繼資料感知語義搜尋功能,透過擴展可服務我們擁有超過 2,700 萬使用者的 FamilyAlbum 相片分享社群。相較於自我管理搜尋系統,全受管基礎結構極大地簡化了運作,從而讓我們的團隊能夠專注於交付採用 AI 技術的全新功能。S3 Vectors 計劃在 100 個索引中對大約 4 億個向量進行索引,為我們帶來了擴大語義搜尋所需的效能與成本效益,從而對未來的體驗提供支援,例如,針對每一位使用者提供個人化的相片列印建議。」
MIXI, Inc. ML 工程師 Takahiro Kinouchi
Backlight
Backlight 是一間全球媒體技術公司,專注於藉助簡單、採用 AI 技術的產品來取代遭到破壞的媒體工作流程。 憑藉其整合式解決方案套件,Backlight 能夠支援創意與製作團隊專注於創作引人入勝、具有影響力的故事。
「我們有數百位客戶擁有超過 1,000 小時的影片庫,有些客戶的影片庫甚至高達數十萬小時。關於如何向其擁有及運作的、支援免費廣告的串流電視 (FAST) 與應用程式使用者分發內容,他們需要做出明智的決定。Amazon S3 Vectors 為我們擴展智慧媒體工作流程奠定了基礎,從而讓我們的客戶能夠藉助最大型媒體庫中的可搜尋資料,來擴其媒體內容。
Backlight 總經理 Ed Laczynski
Twilio
Twilio 支援公司利用通訊與資料,在客戶之旅的每一步增強智慧與安全性。當今眾多領先的公司信任 Twilio,與其客戶建立直接、個人化的關係。
「S3 Vectors 將易於存取的向量介面,直接置於我們已經信任的儲存體中,只需按一下,即可獲得 S3 的擴展能力以及語義搜尋智慧。憑藉這種簡單性,Twilio 團隊能夠將強大的檢索增強生成與個人化建議,插入我們的客戶互動平台,免於新建基礎結構或調整的困擾。看到 S3 Vectors 協助開發人員便捷地將日常資料轉化為更智慧、更受信任的客戶體驗,我們激動不已。」
Twilio AI、ML 與資料主管;流量智慧副總裁 Zachary Hanif
TwelveLabs
TwelveLabs 是多模態 AI 的拓荒者,精專於進階影片理解技術。其影片基礎模型讓組織不僅可了解螢幕上顯示的內容,還能了解其背後的豐富背景與意義,進而以類似人類的精確度,來搜索、總結與分析其影片內容。
「影片蘊含世界上一些最寶貴但尚未充分利用的資訊,而直到現在,仍一直被耗時的手動工作流程所束縛。藉助我們的基礎模型,客戶能將 PB 級影片轉化為可搜尋、切實可行的知識。憑藉 Amazon S3 Vectors 等可擴展的基礎結構,我們能夠交付企業級的語義搜尋與影片分析能力,從而支援團隊專注於創造性、決策能力與影響力。」
TwelveLabs 聯合創始人暨執行長 Jae Lee
Spice AI
Spice AI 利用其可移植的開放原始碼資料與 AI 運算引擎,
可協助企業建置快速、準確且可擴展的 AI 應用程式及代理程式。其統一了不同來源的資料與搜索內容,
並支援跨雲端、邊緣和本地系統的工作負載,
從而簡化了 AI 開發。
「隨著 AI 應用程式與代理程式需要存取的資料量與日俱增,產業越來越依賴於物件儲存。Amazon S3 Vectors 令人驚歎不已,因為現在我們透過一個簡單的語義搜尋與擷取索解決方案,即可獲得 S3 的規模、價格點、彈性與耐久性。我們已經與 S3 團隊建立合作關係,以便將 S3 Vector 整合至 Spice.ai 開放原始碼資料與 AI 運算引擎中,從而提供一個簡單的 SQL 介面,來高效地管理與查詢跨企業資料來源的向量嵌入項目。」
Spice AI 創辦人暨執行長 Luke Kim
xCures
xCures 營運一個 AI 輔助醫療保健資料平台,可從彙整、結構化及規範化的醫療記錄中擷取臨床資訊。
「S3 Vectors 與 Amazon OpenSearch Service 相輔相成,提供了一項經濟高效的向量管理服務,在針對不同工作負載確保所需效能的同時,協助我們高效地進行擴展。這樣一來,我們就能更好地辨識醫療記錄中有意義的臨床內容,同時支援大規模地擷取高品質的結構化資料。」
xCures 產品管理副總裁 Zach Kaufman
BMW
BMW Group 是全球領先的優質汽車與機車供應商,旗下擁有 BMW、MINI、Rolls-Royce 及 BMW Motorrad 等品牌。
「Cloud Data Hub 是 BMW Group 的中央資料平台,藉助 Apache Iceberg 來管理 BMW 存放於 S3 的經策管及廣泛的資料集。該公司正在開發混合式搜尋解決方案,以便提升整個組織中以 AI 為基礎的資料可用性,進而整合 BMW 的結構化 Iceberg 資料與現在還是半結構化的資料欄資料。由於 S3 Vectors 在其成本與效能方面可實現最佳平衡,並且與現有的 S3 Iceberg 架構,以及身分與存取管理架構相容,因此我們選擇了該服務。」
BMW Cloud Data Hub 產品管理主管 Ruben Simon
Precisely
Precisely 是深受信任的資料完整性合作夥伴,其擁有數十年的精深領域專業知識,涵蓋軟體、資料,以及資料策略服務。其產品組合可協助整合客戶資料、改善資料品質、控管資料用量、地理編碼,以及分析位置資料,還可透過互補性資料集來擴充這些資料,以便自信地做出業務決策。
能夠探索 Amazon S3 Vectors 的各種潛能,我們激動不已,進而為我們採用 AI 技術的資料探索與中繼資料策管能力帶來經濟高效的靈活性。」
Precisely 技術長 Tendu Yogurtcu
Nomad Media
Nomad Media 提供了一個在 AWS 基礎上建置的雲端原生內容與資產管理、內容分發,以及即時串流平台,能夠將以雲端為基礎的資產管理與 AWS Media Services,以及 AI/生成式 AI 的強大功能無縫合併為一個便捷易用的統一系統。
「藉助 Amazon S3 Vectors,我們能夠在數十億筆記錄中,高效率且經濟高效地擴展媒體搜尋功能。」
Nomad Media 共同創辦人暨執行長 Adam Miller
Natera
Natera 精專於使用非侵入性、無細胞 DNA 技術進行基因體檢測,重點關注腫瘤科、婦女健康,以及器官健康。醫師及診所藉助 Natera 的檢測來制定治療方案,同時為患者提供精確的藥物。
「我們藉助 S3 Vectors 與 Amazon Bedrock,針對實驗室設備工程文件使用案例建立向量索引及擷取向量。藉助此整合功能,實驗室設備服務工程師可快速查找及連線複雜儀器手冊中的資訊,從而顯著改善維護與故障診斷的速度與準確度。因此,Natera 在實驗室營運過程中可更快地解決問題,以及優化儀器的運行時間。」
Ariel Jirau, Sr.Natera 首席軟體工程師
Squiz
Squiz 是全球數位體驗平台服務提供者,藉助 Amazon S3 Vectors 來支援其對話式搜尋工具,從而讓組織能夠藉助使用者目前期待的自然語言互動,來交付更引人入勝的網站體驗。
「藉助 S3 Vector,我們能夠重新構想擷取管道。該服務將我們的對話式資料處理提速 50%,並透過讓我們從客製化、始終在線的基礎結構,轉向可擴展的無伺服器模型來降低成本。如今,我們能夠從每個用戶端 25,000 個向量,順暢擴展至數百萬向量,從而讓我們的工程團隊專注於 RAG 創新,而非基礎結構管理。」
Squiz 技術長 Greg Sherwood
找到今天所需的資訊了嗎?
讓我們知道,以便我們改善頁面內容的品質