Publié le: Nov 16, 2020
Amazon Textract est un service de machine learning qui permet d’extraire du texte, des tableaux, des formulaires et d’autres données de documents. Aujourd’hui, nous sommes heureux d’annoncer deux nouvelles fonctionnalités :
- Amazon Textract prend désormais en charge la reconnaissance de textes manuscrits dans les documents, par exemple les feuilles de soins, les ordonnances médicales, les lettres de contestation, les documents fiscaux, les états de revenus, les chèques, les réclamations, les documents universitaires et bien d’autres encore. Vous pouvez utiliser les API Detect Document Text ou Analyze Document pour traiter des documents scannés au format image ou PDF et en extraire du texte imprimé et celui manuscrit, ce qui facilite l’automatisation du traitement de la quasi-totalité des documents scannés. Vous pouvez également utiliser Amazon Augmented AI (Amazon A2I), un autre service AWS, qui simplifie la création de flux de travail de prédictions de machine learning en vue d’une analyse humaine. Vous pouvez vous connecter à la console Amazon Textract pour tester la fonctionnalité de reconnaissance de l’écriture manuscrite ou consulter la nouvelle démonstration de Mike Chambers, Amazon Machine Learning Hero.
- Amazon Textract prend désormais en charge le traitement de documents comportant du texte imprimé en espagnol, en allemand, en italien, en portugais et en français. Vous pouvez commencer à envoyer des documents dans ces langues à des fins d’extraction de texte et Amazon Textract détectera automatiquement les informations et les extraira pour vous.
Nous avons également le plaisir d’annoncer qu’Amazon Textract est désormais disponible dans la région AWS UE (Paris). Pour démarrer, connectez-vous à la console Amazon Textract pour tester la reconnaissance de vos documents manuscrits et les nouvelles langues prises en charge. Pour en savoir plus sur les fonctionnalités de Textract, consultez le site Web d’Amazon Textract, le guide du développeur ou la page des ressources.