Amazon Bedrock AgentCore Browser fügt Interaktionsfunktionen auf Betriebssystemebene hinzu
Amazon Bedrock AgentCore Browser unterstützt jetzt Interaktionsfunktionen auf Betriebssystemebene und ermöglicht die Automatisierung von Browser-Workflows, die eine direkte Betriebssystemsteuerung erfordern, die über die Funktionen des Chrome DevTools Protocol (CDP) hinausgeht. Diese Erweiterung befasst sich mit Automatisierungsszenarien, in denen CDP allein nicht ausreicht, wie Mausoperationen, Druckdialoge, native Systemwarnungen und Tastenkombinationen. Das Feature richtet sich an Entwickler von KI-Agenten, Techniker für Testautomatisierung und Organisationen, die LLM-gestützte Webinteraktionstools entwickeln.
Die neuen Funktionen ermöglichen die Automatisierung durch Mausoperationen (Klicken, Verschieben, Ziehen, Scrollen), Tastaturoperationen (Tippen, Drücken, Tastenkombinationen wie Strg+A und Strg+P) und vollständige Desktop-Screenshots, alles mit Koordinaten auf Betriebssystemebene, die über das Browserfenster hinausgehen. Zu den wichtigsten Anwendungsfällen gehören automatisiertes Testen mit Systemdialogverwaltung, Workflows zur Dokumentenverwaltung, komplexe Benutzeroberflächeninteraktionen mit Rechtsklickmenüs und visionsbasierte KI-Agenten, die eine vollständige Sichtbarkeit der Browserumgebung erfordern.
Dieses Feature ist jetzt in allen 14 AWS-Regionen verfügbar, in denen Amazon Bedrock AgentCore Browser verfügbar ist: USA Ost (Nord-Virginia), USA Ost (Ohio), USA West (Oregon), Europa (Frankfurt), Europa (Irland), Europa (London), Europa (Paris), Europa (Stockholm), Asien-Pazifik (Mumbai), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Tokio), Asien-Pazifik (Seoul) und Kanada (Zentral).
Weitere Informationen finden Sie in der Dokumentation zu AgentCore Browser.