Publicado: Oct 11, 2021
Temos o prazer de anunciar o armazenamento de conjuntos de dados de eventos para o Amazon Fraud Detector. O novo recurso permite que os clientes enviem e armazenem facilmente seus dados de fraude de produção diretamente no Amazon Fraud Detector. Os clientes podem usar seus conjuntos de dados de eventos para treinar modelos de machine learning (ML) com maior performance preditiva, pois os modelos podem aplicar o contexto histórico a novos eventos, calculando automaticamente valores como idade da conta e frequência de compra. Os clientes também podem se mover mais rapidamente treinando modelos sem precisar carregar um novo conjunto de dados de treinamento no S3 e podem fechar o ciclo de feedback das investigações de fraude offline atualizando seus rótulos de fraude para eventos armazenados.
Antes desse lançamento, os clientes só podiam treinar modelos em dados armazenados no S3. Para treinar novamente um modelo, os clientes precisavam atualizar manualmente seu conjunto de dados, carregar o conjunto de dados mais recente no S3 e, em seguida, apontar o Amazon Fraud Detector para ele. Essas etapas de preparação de dados tornaram a reciclagem de modelos demorada, aumentando as chances de um modelo ficar “obsoleto”.
Usando os conjuntos de dados de eventos recém-lançados, os clientes podem carregar seus dados históricos de eventos diretamente no Amazon Fraud Detector para modelos de treinamento. O conjunto de dados do evento também é atualizado automaticamente a cada nova previsão e, portanto, não há necessidade de carregar novos conjuntos de dados para cada reciclagem de modelo. Métricas de conjuntos de dados de eventos, como o número de eventos e o tamanho do conjunto de dados, são atualizadas automaticamente e também podem ser atualizadas sob demanda. Os clientes podem atualizar rótulos de eventos (por exemplo, fraude, legítimos) com base em avaliações offline para fechar o ciclo de feedback de ML. Com o conjunto de dados de eventos armazenado no Amazon Fraud Detector, os clientes agora podem treinar um novo modelo ou treinar novamente um modelo existente com ainda menos cliques.
Para começar, crie um novo tipo de evento ou selecione um existente e navegue até a guia “Stored events” (Eventos armazenados) no console do Fraud Detector. Nessa guia, você pode ativar o armazenamento de eventos em tempo real para previsões. Para armazenar dados históricos, você pode carregar um arquivo CSV de dados de eventos ou usar a nova API SendEvent para transmitir os eventos ao Amazon Fraud Detector. Depois de ter um conjunto de dados armazenado, você pode treinar ou retreinar rapidamente as versões do modelo selecionando “stored events” (eventos armazenados) como fonte de dados de treinamento do modelo. O armazenamento de dados de eventos custa USD 0,10 por GB por mês e está disponível nas seguintes regiões: Leste dos EUA (Norte da Virgínia), Leste dos EUA (Ohio), Oeste dos EUA (Oregon), Europa (Irlanda), Ásia-Pacífico (Singapura) e Ásia-Pacífico (Sydney). Para obter detalhes adicionais sobre o armazenamento de dados de eventos, consulte nossa documentação.