Publié le: Nov 2, 2017
Avec Amazon Kinesis Analytics, détectez en temps réel les anomalies de données sur un flux. Aujourd'hui, nous avons lancé deux nouvelles fonctionnalités qui permettent d'expliquer les anomalies, afin de vous faciliter l'analyse des causes premières. Vous pouvez savoir quel champ de données entraîne des scores d'anomalies élevés et identifier les tendances associées à ces anomalies.
Kinesis Analytics utilise l'algorithme Random Cut Forest (forêts d'arbres décisionnels) pour analyser un ou plusieurs champs numériques et générer des scores permettant d'identifier les anomalies au niveau des flux de données. Lorsque les enregistrements de votre flux de données comportent un grand nombre de champs, il peut être difficile de déterminer manuellement quels champs entraînent des scores d'anomalies élevés, en particulier lorsque les données sont volumineuses, se déplacent rapidement et changent fréquemment. Kinesis Analytics fournit maintenant des explications en temps réel des scores d'anomalie à l'aide des techniques d'attribution et de directionnalité. L'attribution explique la contribution des champs de saisie au score global. La directionnalité fournit des informations concernant les tendances telles que les pics et les chutes pour chaque champ. Pour plus d'informations et pour voir un exemple de code, reportez-vous à la section explicative sur Random Cut Forest dans le document Amazon Kinesis Analytics SQL Reference.
Kinesis Analytics est la solution la plus simple pour traiter des données de streaming en temps réel avec du code SQL , sans avoir à maîtriser de nouveaux langages de programmation ou frameworks de traitement. Kinesis Analytics permet d'interroger les données de streaming ou de créer intégralement des applications de streaming avec SQL, de manière à obtenir des informations exploitables et à répondre rapidement aux besoins de votre entreprise et de vos clients. Kinesis Analytics est disponible dans les régions USA Est (Virginie du Nord), USA Ouest (Oregon) et UE (Irlande).