Amazon Bedrock AgentCore Browser เพิ่มความสามารถในการโต้ตอบในระดับ OS
Amazon Bedrock AgentCore Browser รองรับความสามารถในการโต้ตอบในระดับ OS แล้ว ซึ่งช่วยให้สามารถทำงานอัตโนมัติบนเวิร์กโฟลว์ของเบราว์เซอร์ที่ต้องใช้การควบคุมระบบปฏิบัติการโดยตรง ซึ่งเกินขอบเขตความสามารถของ Chrome DevTools Protocol (CDP) การปรับปรุงครั้งนี้ช่วยรองรับสถานการณ์การทำงานอัตโนมัติที่ CDP เพียงอย่างเดียวไม่เพียงพอ เช่น การควบคุมเมาส์ กล่องโต้ตอบการพิมพ์ การแจ้งเตือนดั้งเดิมจากระบบ และแป้นพิมพ์ลัด ฟีเจอร์นี้ออกแบบมาเพื่อรองรับนักพัฒนา AI Agent, วิศวกรด้านการทดสอบอัตโนมัติ และองค์กรที่สร้างเครื่องมือการโต้ตอบบนเว็บที่ขับเคลื่อนด้วย LLM
ความสามารถใหม่นี้รองรับการทำงานอัตโนมัติผ่านการควบคุมเมาส์ (คลิก ย้าย ลาก เลื่อน), การควบคุมแป้นพิมพ์ (พิมพ์ กด ทางลัด เช่น ctrl+a และ ctrl+p) และภาพหน้าจอเดสก์ท็อปแบบเต็มหน้าจอ โดยทั้งหมดล้วนอ้างอิงพิกัดระดับ OS ซึ่งขยายขอบเขตออกไปนอกมุมมองของเบราว์เซอร์ กรณีการใช้งานที่สำคัญ ได้แก่ การทดสอบอัตโนมัติสำหรับการจัดการกล่องโต้ตอบของระบบ เวิร์กโฟลว์การจัดการเอกสาร การโต้ตอบกับ UI ที่ซับซ้อนด้วยเมนูคลิกขวา และ AI Agent ที่ใช้การมองเห็น ซึ่งต้องการการมองเห็นสภาพแวดล้อมของเบราว์เซอร์แบบครบถ้วน
ฟีเจอร์นี้มีให้บริการตามค่าเริ่มต้นในอินสแตนซ์เบราว์เซอร์ทั้งหมดใน AWS Region ทั้ง 14 แห่งที่ให้บริการ Amazon Bedrock AgentCore Browser ได้แก่ สหรัฐอเมริกาฝั่งตะวันออก (เวอร์จิเนียฝั่งเหนือ), สหรัฐอเมริกาฝั่งตะวันออก (โอไฮโอ), สหรัฐอเมริกาฝั่งตะวันตก (ออริกอน), ยุโรป (แฟรงก์เฟิร์ต), ยุโรป (ไอร์แลนด์), ยุโรป (ลอนดอน), ยุโรป (ปารีส), ยุโรป (สตอกโฮล์ม), เอเชียแปซิฟิก (มุมไบ), เอเชียแปซิฟิก (สิงคโปร์), เอเชียแปซิฟิก (ซิดนีย์), เอเชียแปซิฟิก (โตเกียว), เอเชียแปซิฟิก (โซล) และแคนาดา (ภาคกลาง)
หากต้องการเรียนรู้เพิ่มเติม โปรดไปที่เอกสารประกอบ AgentCore Browser