Publié le: Jul 25, 2023

Amazon SageMaker Canvas prend désormais en charge Document Queries, un modèle prêt à l'emploi développé par Amazon Textract. Document Queries vous permet de spécifier les données que vous souhaitez extraire de documents structurés en langage naturel, sans avoir besoin de connaissances préalables sur la structure du document (tableau, formulaire, champs, données imbriquées). Cela élimine le besoin de traitement et de recherche manuels dans les données extraites, ce qui vous permet de gagner du temps et de réduire les risques d’erreurs humaines. 

SageMaker Canvas est une interface visuelle qui permet aux analystes métier de générer seuls des prédictions de ML précises, sans avoir besoin d'expérience dans le machine learning ou d'écrire la moindre ligne de code. Avant ce lancement, Canvas proposait des modèles prêts à l'emploi qui vous permettaient d'extraire des informations telles que du texte, des tableaux et des formulaires à partir de documents. Toutefois, pour répondre à des questions ad hoc (par exemple, « Quel est le chiffre d'affaires total généré par les ventes au troisième trimestre ? ») vous deviez rechercher et traiter les informations extraites, ce qui est inefficace et prend du temps. Avec Document Queries, vous pouvez spécifier les informations dont vous avez besoin en posant des questions en langage naturel (par exemple, « Quel est le nom du client ») et recevoir les informations précises (par exemple, « John Doe ») ainsi que leur emplacement dans le document sans écrire une seule ligne de code. 

Pour commencer, connectez-vous à Amazon SageMaker Canvas et accédez au nouveau modèle Document Queries disponible dans la liste des modèles prêts à l'emploi. Il vous suffit d’importer votre document et, à l'aide de questions en langage naturel, d'obtenir la réponse que vous recherchez. 

Cette nouvelle fonctionnalité est proposée dans toutes les régions AWS où SageMaker Canvas est prise en charge à ce jour. Les tarifs d'Amazon Textract s'appliquent. Pour en savoir plus, consultez la documentation relative au produit.