Publicado en: Oct 11, 2021
Nos complace anunciar el almacenamiento de conjuntos de datos de eventos para Amazon Fraud Detector. Esta nueva capacidad permite a los clientes enviar y almacenar fácilmente los datos de fraude de producción directamente en Amazon Fraud Detector. Los clientes pueden utilizar los conjuntos de datos de eventos para entrenar modelos de machine learning (ML) con un mayor rendimiento predictivo, ya que los modelos pueden aplicar el contexto histórico a los nuevos eventos al calcular automáticamente valores como la antigüedad de la cuenta y la frecuencia de compra. Los clientes también pueden avanzar más rápido mediante el reentrenamiento de los modelos sin necesidad de cargar un nuevo conjunto de datos de entrenamiento en S3. Además, pueden cerrar el bucle de retroalimentación de las investigaciones de fraude sin conexión al actualizar las etiquetas de fraude de los eventos almacenados.
Antes de este lanzamiento, los clientes solo podían entrenar modelos con datos almacenados en S3. Para volver a entrenar un modelo, los clientes debían actualizar manualmente el conjunto de datos, cargar la versión más reciente en S3 y, a continuación, dirigir Amazon Fraud Detector hacia este. Estos pasos de preparación de los datos hacían que el reentrenamiento del modelo llevara mucho tiempo, lo que aumentaba las posibilidades de que un modelo se quedara “obsoleto”.
Gracias a los conjuntos de datos de eventos recién lanzados, los clientes pueden cargar los datos de los eventos históricos directamente en Amazon Fraud Detector para entrenar los modelos. El conjunto de datos de eventos también se actualiza automáticamente con cada nueva predicción, por lo que no es necesario cargar nuevos conjuntos de datos cada vez que se vuelve a entrenar el modelo. Las métricas del conjunto de datos de eventos, como el número de eventos y el tamaño del conjunto de datos, se actualizan automáticamente y también se pueden refrescar bajo demanda. Los clientes pueden actualizar las etiquetas de los eventos (por ejemplo, fraude, legítimo) en función de las revisiones sin conexión para cerrar el bucle de retroalimentación de ML. Con el conjunto de datos de eventos almacenado en Amazon Fraud Detector, los clientes pueden ahora entrenar un nuevo modelo o volver a entrenar un modelo existente con menos clics.
Para comenzar, cree un nuevo tipo de evento o seleccione uno ya existente y, a continuación, vaya a la pestaña “Eventos almacenados” en la consola de Fraud Detector. En esta pestaña, puede habilitar el almacenamiento de eventos en tiempo real para las predicciones. Para almacenar datos históricos, puede cargar un archivo CSV de datos de eventos o utilizar la nueva API SendEvent para transmitir los eventos a Amazon Fraud Detector. Una vez que tenga un conjunto de datos almacenado, puede entrenar o volver a entrenar rápidamente las versiones del modelo al seleccionar “eventos almacenados” como origen de datos de entrenamiento del modelo. El almacenamiento de datos de eventos cuesta 0,10 USD por GB al mes y está disponible en las regiones de EE. UU. Este (Norte de Virginia), EE. UU. Este (Ohio), EE. UU. Oeste (Oregón), Europa (Irlanda), Asia-Pacífico (Singapur) y Asia-Pacífico (Sídney). Para obtener más detalles sobre el almacenamiento de datos de eventos, consulte nuestra documentación.