Passer au contenu principalAWS Startups
  1. Bibliothèque d’invites
  2. Chatbot RAG avec Claude

Chatbot RAG avec Claude

Créez un chatbot sans serveur basé sur React à l’aide de Claude sur Bedrock avec des fonctionnalités de génération à enrichissement contextuel (RAG) pour les documents PDF.

  • IA générative
  • Sans serveur

Invite

# AWS Claude RAG Chatbot Architecture Design Request
## Project Overview
I need a comprehensive design for a web-based chatbot application with the following key components:
- Claude 3 Sonnet on Amazon Bedrock as the LLM
- RAG capabilities for PDF documents stored in S3
- React frontend with real-time chat functionality
## Detailed Requirements
### 1. Core Functionality
- **User Interface**: Web-based chat interface built with React
- **AI Backend**: Claude 3 Sonnet model via Amazon Bedrock API
- **RAG System**: 
  - PDF document search and retrieval from S3
  - Document upload functionality for expanding knowledge base
  - Vector search across 1000+ documents
- **Persistence**:
  - Chat history storage and retrieval
  - User authentication and session management
### 2. Performance Requirements
- Support for 100 concurrent users
- Response times under 2 seconds for typical queries
- Ability to process and index documents up to 100MB each
### 3. Cost Optimization Targets
- Monthly operational cost under $200 for moderate usage
- Strategic use of spot instances where appropriate
- Caching implementation to minimize Bedrock API calls
- Pay-per-use services prioritized
### 4. Technical Architecture Preferences
- Serverless backend architecture (AWS Lambda)
- Vector database for embeddings (OpenSearch or equivalent)
- PDF processing pipeline for text extraction and embedding
- WebSocket implementation for real-time chat experience
- API Gateway for REST endpoint management
### 5. Security & Compliance Requirements
- End-to-end encryption for documents (at rest and in transit)
- IAM roles configured with least privilege principle
- Rate limiting implementation to prevent system abuse
- Comprehensive audit logging for all system interactions
## Deliverables Requested
1. Complete AWS solution architecture diagram
2. Infrastructure as Code (Terraform preferred)
3. Detailed deployment guide with step-by-step instructions
4. Cost estimation breakdown by AWS service
5. Security implementation details
6. Readme with full documentation

Please provide a solution that adheres to AWS Well-Architected Framework principles, with particular attention to reliability, performance efficiency, and cost optimization.
Provide your complete solution architecture without any preamble, starting with the high-level architecture diagram description.

Fonctionnement

VERSION BÊTA
  1. Configurer votre environnement AWS et contrôler les coûts

    Suivez le Guide de démarrage sur AWS pour les start-ups pour créer votre compte et configurer l’accès. Consultez le Guide d’optimisation rapide des coûts du cloud pour les start-ups au stade précoce pour établir des budgets, surveiller les dépenses et désactiver les ressources inutilisées.

  2. Installer l’AWS CLI

    Téléchargez et installez la version d’AWS CLI correspondant à votre système d’exploitation.

  3. Copier l’invite

    Cliquez sur « Copier l’invite » pour copier l’invite dans votre presse-papiers.

  4. Tester votre invite

    Collez l’invite dans votre outil d’IA (par exemple, l’interface de la ligne de commande Kiro) et exécutez-la pour générer les résultats.

  5. Examiner, déployer et surveiller

    Examinez les ressources générées et les coûts estimés. Déployez d’abord dans un environnement de développement. Surveillez les performances et les dépenses avant de passer à la production.

En utilisant ces invites, vous acceptez cette clause de non-responsabilité.