Essayez Amazon CloudSearch gratuitement

Démarrer un essai gratuit d'Amazon CloudSearch
En savoir plus

Bénéficiez de 750 heures gratuites d'instances de recherche entièrement fonctionnelles pendant 30 jours. Pour commencer :

Connectez-vous à votre compte AWS et lancez la console CloudSearch

Créez et configurez un domaine de recherche en quelques clics

Chargez des données et envoyez des requêtes de recherche ou de mise à jour à l'aide de la console, du kit SDK AWS ou de l'interface de ligne de commande


Q : Qu'est-ce qu'Amazon CloudSearch ?

Amazon CloudSearch est un service entièrement géré qui est basé sur le cloud AWS. Ce service facilite la configuration, la gestion et la mise à l'échelle d'une solution de recherche pour votre site Web ou application.

Q : En quoi utiliser un service de recherche géré tel qu'Amazon CloudSearch est-il plus avantageux que d'exécuter mon propre service de recherche sur EC2 ?

 

Amazon CloudSearch présente plusieurs avantages par rapport à l'exécution d'un service de recherche géré par vos soins, notamment : une configuration simple, un dimensionnement automatique des données et du trafic, des clusters se réparant automatiquement et une haute disponibilité grâce à Multi-AZ. Dans AWS Management Console, vous pouvez, en quelques clics, créer un domaine de recherche ou charger des données interrogeables ; Amazon CloudSearch met automatiquement en service les ressources nécessaires et déploie un index de recherche parfaitement adapté.

Q : Qu'est-ce qu'un moteur de recherche ?

Un moteur de recherche permet d'effectuer des recherches dans des ensembles étendus d'éléments d'information, principalement textuels, (appelés documents) pour trouver rapidement les résultats les plus pertinents. Les demandes de recherche consistent généralement en quelques mots de texte non structuré, par exemple « films matt damon ». Les résultats obtenus sont généralement classés en commençant par les éléments qui correspondent le mieux, ou les plus pertinents (ceux qui sont les plus proches des termes de la recherche).

Les documents peuvent ne pas être structurés du tout ou contenir plusieurs champs dans lesquels des recherches individuelles sont, éventuellement, possibles. Un service de recherche de films peut, par exemple, comporter des documents avec des champs pour le titre, le réalisateur, l'acteur, la description et les critiques. Les résultats renvoyés par un moteur de recherche sont généralement des proxies pour les documents sous-jacents, comme des adresses URL qui renvoient à des pages Web particulières. Le service de recherche peut, toutefois, aussi renvoyer le contenu réel de champs individuels.

Q : Quels sont les avantages d'Amazon CloudSearch ?

Amazon CloudSearch est un service de recherche entièrement géré qui s'adapte automatiquement au volume de données et à la complexité des demandes de recherche pour fournir rapidement des résultats précis. Amazon CloudSearch permet aux clients d'ajouter une fonctionnalité de recherche sans avoir à gérer des hôtes, la mise à l'échelle des données et du trafic, la redondance ou les progiciels. Un tarif horaire avantageux est facturé aux utilisateurs pour les ressources qu'ils consomment. Amazon CloudSearch peut représenter un coût total de possession sensiblement inférieur à ce que vous coûteraient l'exploitation et la gestion de votre propre environnement de recherche.

Q : Est-il possible d'utiliser Amazon CloudSearch avec un service de stockage ?

Les services de recherche et de stockage sont complémentaires. Un service de recherche nécessite que vos documents soient déjà stockés quelque part, qu'il s'agisse de fichiers dans un système de fichiers, de données dans Amazon S3 ou d'enregistrements dans une instance Amazon DynamoDB ou Amazon RDS. Le service de recherche est un système d'extraction rapide qui rend ces éléments consultables avec des temps d'attente inférieurs à la seconde grâce à un processus appelé indexation.

Q : Est-il possible d'utiliser Amazon CloudSearch avec une base de données ?

Moteurs de recherche et bases de données ne sont pas incompatibles ; en réalité, ils sont souvent utilisés conjointement. Si vous disposez déjà d'une base de données contenant des données structurées, il se peut que vous vouliez utiliser un moteur de recherche pour filtrer et classer intelligemment le contenu de la base de données en utilisant des mots-clés de recherche comme critères de pertinence.

Il est possible d'utiliser un service de recherche pour indexer et effectuer des recherches à la fois dans des données structurées et non structurées. Le contenu peut provenir de plusieurs sources et inclure des champs de base de données de même que des fichiers dans divers formats, des pages Web, etc. Un service de recherche peut prendre en charge une classification personnalisable des résultats ainsi que des fonctions de recherche spéciales, par exemple, en utilisant des facettes pour le filtrage, lesquelles ne sont pas disponibles dans des bases de données.

Q : Dans quelles régions Amazon CloudSearch est-il disponible ?

Amazon CloudSearch est actuellement disponible dans les régions AWS suivantes : USA Est (Virginie du Nord), USA Ouest (Oregon), USA Ouest (Californie du Nord), UE (Irlande), UE (Francfort), Amérique du Sud (Sao Paulo) et Asie-Pacifique (Singapour, Tokyo, Sydney).


Q : Quelles sont les nouvelles fonctionnalités prises en charge par Amazon CloudSearch ?

La dernière version d'Amazon CloudSearch inclut plusieurs nouvelles fonctions de recherche et de gestion. Voici les principales nouvelles fonctionnalités :

  • Prise en charge linguistique :
    • 34 langues, ainsi qu'une option « multiple » pour gérer les champs contenant plusieurs langues
    • Configuration de la langue par champ
    • Analyses de texte adaptées à la langue
    • Plusieurs niveaux d'algorithmes de racinisation disponibles dans de nombreuses langues, y compris le niveau « aucune racinisation »
  • Fonctionnalités de recherche améliorées :
    • Suggestions
    • Mise en surbrillance
    • Recherche géolocalisée
    • Nouveaux types de données : date, double, entier signé 64 bits, LatLon
    • Recherche de groupes de mots avec opérateur de proximité
    • Augmentation du score d'un terme
    • Possibilités de recherche étendues à tous les types de champs
    • Prise en charge de plusieurs analyseurs de requêtes : simple, structuré, lucene, dismax
    • Options de configuration des analyseurs de requêtes
  • Fonctionnalités d'administration :
    • Option haute disponibilité
    • Intégration d'IAM
    • Mise à l'échelle configurable par l'utilisateur
  • Disponible dans des régions AWS supplémentaires : Asie-Pacifique (Tokyo), Asie-Pacifique (Singapour), Asie-Pacifique (Sydney), Asie-Pacifique (Séoul) et Amérique du Sud (Sao Paulo)

Q : Amazon CloudSearch prend-il toujours en charge la racinisation par dictionnaire ?

Oui. La nouvelle version d'Amazon CloudSearch prend en charge la racinisation par dictionnaire, en plus de la racinisation algorithmique.

Q : La nouvelle version d'Amazon CloudSearch utilise-t-elle Apache Solr ?

Oui. La dernière version d'Amazon CloudSearch a été modifiée pour utiliser Apache Solr en tant que moteur de recherche de texte sous-jacent. Amazon CloudSearch propose désormais plusieurs fonctionnalités courantes de moteur de recherche disponibles avec Apache Solr, en les associant à son expérience de service de recherche géré pour faciliter la configuration, la gestion et le dimensionnement d'un domaine de recherche.

Q : Puis-je accéder à la nouvelle version d'Amazon CloudSearch via la console ?

Oui. Vous pouvez accéder à la nouvelle version d'Amazon CloudSearch via la console. Si vous utilisez déjà Amazon CloudSearch et disposez de domaines de recherche, vous pouvez sélectionner la version d'Amazon CloudSearch à utiliser lorsque vous créez de nouveaux domaines de recherche. Les nouveaux clients utiliseront cette dernière version d'Amazon CloudSearch par défaut, et n'auront pas accès à la version du 01-01-2011.

Q : Quels sont les types de données pris en charge par la nouvelle version d'Amazon CloudSearch ?

Amazon CloudSearch prend en charge deux types de champs de texte : texte et littéral. Les champs de texte sont traités selon la langue configurée et permettent de déterminer quels mots isolés peuvent représenter des résultats pour les requêtes. Les champs de type littéral ne sont pas traités et doivent présenter une correspondance exacte, y compris au niveau de la casse. CloudSearch prend également en charge quatre types de données numériques : int, double, date et latlon. Les champs de type int correspondent à des valeurs d'entiers signés de 64 bits. Les champs de type double correspondent à des valeurs à virgule flottante à double précision. Les champs de type date contiennent des dates en UTC (Temps universel coordonné), et sont spécifiés au format IETF RFC3339 : aaaa-mm-jjT00:00:00Z. Les champs de type LatLon contiennent des coordonnées, stockées en tant que paires de valeur (latitude et longitude).

Q : Mes domaines de recherche existants, créés avec la version du 01-02-2011 d'Amazon CloudSearch, fonctionnent-ils toujours ?

Oui. Les domaines de recherche existants créés avec la version du 01-02-2011 d'Amazon CloudSearch continuent de fonctionner.

Q : Pourrai-je utiliser les nouvelles fonctions sur mes domaines de recherche existants créés avec la version du 01-01-2011 d'Amazon CloudSearch ?

Non. Les domaines de recherche existants créés avec la version du 01-01-2011 d'Amazon CloudSearch ne pourront pas accéder aux fonctions disponibles dans la nouvelle version. Pour accéder à ces nouvelles fonctionnalités, vous devrez créer un nouveau domaine de recherche utilisant la version du 01-01-2013 d'Amazon CloudSearch.

Q : Comment puis-je faire migrer mes applications créées à partir de la version du 01-01-2011 d'Amazon CloudSearch vers la nouvelle version d'Amazon CloudSearch ?

Pour utiliser la nouvelle version d'Amazon CloudSearch, vous devez recréer les domaines existants à l'aide de cette nouvelle version, puis charger à nouveau vos données. Pour en savoir plus, reportez-vous à la section Migrating to the 2013-01-01 API du manuel Amazon CloudSearch Developer Guide.

 

 

Q : La version du 01-02-2011 d'Amazon CloudSearch est-elle toujours prise en charge par AWS ?

Oui. AWS maintient la prise en charge de la version du 01-02-2011 d'Amazon CloudSearch.

 

Q : Puis-je créer de nouveaux domaines de recherche à l'aide de la version du 01-02-2011 d'Amazon CloudSearch ?

Les clients Amazon CloudSearch possédant déjà des domaines de la version du 01-02-2011 peuvent indiquer si leurs nouveaux domaines doivent utiliser l'API du 01-02-2011 ou la nouvelle API du 01-01-2013. Les domaines de recherche créés par de nouveaux clients utilisent automatiquement l'API 2013-01-01.

Q : Puis-je profiter de l'offre d'essai gratuit avec cette nouvelle version d'Amazon CloudSearch ?

Les nouveaux clients conservent la possibilité de profiter de l'offre d'essai gratuit d'Amazon CloudSearch. Pour en savoir plus, consultez la page relative à l'essai gratuit d'Amazon CloudSearch.


Q : Comment démarrer avec Amazon CloudSearch ?

Pour souscrire à Amazon CloudSearch, cliquez sur le bouton Créer un compte gratuit sur la page de présentation d'Amazon CloudSearch et suivez la procédure d'inscription. Vous devez disposer d'un compte Amazon Web Services. Si ce n'est pas le cas, vous serez invité à créer un compte AWS au début de la procédure d'inscription à Amazon CloudSearch.

Une fois inscrit, sélectionnez Amazon CloudSearch dans AWS Management Console. La console Amazon CloudSearch vous permet de créer rapidement un domaine de recherche, de configurer vos champs de recherche, de charger des données types et d'envoyer des demandes de recherche à votre domaine de recherche. Vous pouvez également utiliser les kits SDK AWS et l'interface de ligne de commande pour effectuer ces tâches.

Pour plus d'informations, voir le didacticiel Getting Started dans le manuel Amazon CloudSearch Developer Guide.

Q : Les kits SDK AWS prennent-ils en charge Amazon CloudSearch ?

Oui, les kits SDK AWS pour Java, Ruby, Python, .Net, PHP et Node.js prennent en charge CloudSearch. Les kits SDK AWS vous permettent de créer rapidement un domaine de recherche, de configurer vos champs de recherche, de charger des données types et d'envoyer des demandes de recherche à votre domaine de recherche.

Q : L'interface de ligne de commande AWS prend-t-elle en charge Amazon CloudSearch ?

Oui, l'interface de ligne de commande AWS prend en charge CloudSearch. L'interface de ligne de commande AWS vous permet de créer rapidement un domaine de recherche, de configurer vos champs de recherche, de charger des données types et d'envoyer des demandes de recherche à votre domaine de recherche.

Q : Puis-je continuer à utiliser les outils de ligne de commande Amazon CloudSearch ?

Oui, les outils de ligne de commande Amazon CloudSearch continueront de fonctionner.


Q : Qu'est-ce qu'un domaine de recherche et comment en créer un ?

Un domaine de recherche consiste en un conteneur de données et un ensemble de services qui rendent les données consultables. Parmi ces services, citons :

  • Un service documentaire permettant de charger des données sur votre domaine à des fins d'indexation.
  • Un service de recherche vous permettant d'effectuer des demandes de recherche parmi vos données indexées.
  • Un service de configuration pour contrôler le comportement de votre domaine (y compris un classement par pertinence).

Vous pouvez créer, gérer et supprimer des domaines de recherche à l'aide d'AWS Management Console, des kits SDK AWS ou de l'interface de ligne de commande AWS.

Q : Comment puis-je charger des documents dans mon domaine de recherche ?

Vous pouvez charger des documents dans votre domaine à l'aide d'AWS Management Console, des kits SDK AWS ou de l'interface de ligne de commande AWS.

Q : Mes documents doivent-ils être dans un format particulier ?

Pour pouvoir effectuer des recherches sur vos données, celles-ci doivent être converties au format JSON ou XML. Chaque élément que vous souhaitez faire figurer dans les résultats de recherche est représenté sous la forme d'un document. Chaque document possède un identifiant unique ainsi qu'un ou plusieurs champs contenant les données sur lesquelles peuvent porter les recherches. Amazon CloudSearch génère un index de recherche à partir des données de votre document en fonction des champs d'index configurés pour le domaine. Lorsque vos données changent, vous soumettez des mises à jour pour ajouter des documents ou en supprimer de votre index.

Q : Comment puis-je créer des lots de documents dans un format adapté pour Amazon CloudSearch ?

Pour créer des lots de documents décrivant vos données, vous devez créer des fichiers texte JSON ou XML qui spécifient les éléments suivants :

  • Type d'opération : ajout ou suppression
  • Identifiant unique
  • Les champs proprement dits et leurs données

L'exemple suivant présente un lot comprenant un seul document au format JSON :

[
    {
       "fields" : {
         "directors" : [
             "Francis Lawrence"
          ],
          "release_date" : "2013-11-11T00:00:00Z",
          "genres" : [
             "Action",
             "Adventure",
             "Sci-Fi",
             "Thriller"
          ],
          "image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg",
          "plot" : "Katniss Everdeen and Peeta Mellark become targets of the Capitol after their victory in the 74th Hunger Games sparks a rebellion in the Districts of Panem.",
          "title" : "The Hunger Games: Catching Fire",
          "rank" : 4,
          "running_time_secs" : 8760,
          "actors" : [
             "Jennifer Lawrence",
             "Josh Hutcherson",
             "Liam Hemsworth"
           ],
          "year": 2013
       },
       "id" : "tt1951264",
       "type": "add"
    }
]

 

Les valeurs numériques telles que l'année ne sont pas entourées de guillemets, et les valeurs incluses dans un champ à valeurs multiples, comme les genres, sont listées dans un tableau JSON.

Pour rendre ces données accessibles à Amazon CloudSearch, vous pouvez les enregistrer dans un fichier et charger ce dernier à l'aide d'AWS Management Console, des kits SDK AWS ou de l'interface de ligne de commande AWS.

Q : Comment s'effectue l'indexation de mes documents ?

Les documents sont automatiquement indexés lorsque vous les chargez dans votre domaine de recherche. Vous pouvez également réindexer explicitement vos documents lorsque vous modifiez la configuration en envoyant une demande IndexDocuments.

Q : Quand dois-je réindexer mon domaine ?

Certaines options de configuration, comme l'ajout d'un nouveau champ d'index ou l'actualisation de vos dictionnaires de radicaux ou de mots vides, ne sont pas disponibles tant que votre domaine n'a pas été réindexé. Lorsque vous avez apporté des changements qui nécessitent une indexation, le statut du domaine indique qu'il doit être indexé. Vous pouvez lancer l'indexation à partir d'AWS Management Console, des kits SDK AWS ou de l'interface de ligne de commande AWS.

Q : Comment puis-je envoyer des demandes de recherche à mon domaine de recherche ?

Chaque domaine de recherche comporte un service de recherche REST avec une URL unique (point de terminaison de recherche) qui accepte les demandes de recherche pour son ensemble de documents. Vous pouvez envoyer des requêtes de recherche à partir d'AWS Management Console, des kits SDK AWS ou de l'interface de ligne de commande AWS.

Q : Un domaine de recherche peut-il couvrir plusieurs zones de disponibilité ?

Oui. Si vous activez l'option multi-AZ, Amazon CloudSearch déploie des instances supplémentaires dans une deuxième zone de disponibilité de la même région. Pour plus d'informations, consultez la section Configuring Availability Options du manuel Amazon CloudSearch Developer Guide.

Q : Puis-je déplacer un domaine de recherche d'une région vers une autre ?

A l'heure actuelle, il n'existe aucune méthode permettant de faire migrer automatiquement un domaine de recherche d'une région vers une autre. Vous devez créer et configurer un domaine dans la région cible souhaitée, puis y charger vos données et supprimer le domaine d'origine.

Q : Comment supprimer mon domaine de recherche ?

Pour supprimer un domaine de recherche, cliquez sur le bouton Delete Domain dans la console Amazon CloudSearch. Vous pouvez également supprimer des domaines par le biais des kits SDK AWS ou de l'interface de ligne de commande AWS.

Q : Comment supprimer des documents de mon domaine de recherche ?

Pour supprimer des documents, vous devez spécifier une opération de suppression dans votre chargement par lot, en indiquant l'ID du document à supprimer.

Vous pouvez soumettre des mises à jour des données par le biais d'AWS Management Console, des kits SDK AWS ou de l'interface de ligne de commande AWS.

Q : Comment vider mon domaine de recherche ?

Si vous souhaitez conserver les points de terminaison de votre domaine, vous pouvez envoyer une demande de suppression pour chaque document de votre domaine.

Q : Pourquoi mon domaine présente-t-il le statut « en cours de traitement » ?

Un domaine peut présenter trois statuts différents : « en cours de traitement », « actif » ou « en cours de réindexation ». En temps normal, votre domaine est en statut « actif », ce qui indique qu'aucune modification n'est actuellement effectuée, que le domaine peut faire l'objet de requêtes et de mises à jour, et que toutes les modifications précédentes sont actuellement visibles dans les résultats de recherche.

Lorsqu'un domaine doit être réindexé, Amazon CloudSearch doit entièrement recréer l'index. Toutefois, le domaine ne passe pas en statut « en cours de traitement » tant que vous ne lancez pas la réindexation. Au cours de cette étape, le domaine peut toujours faire l'objet de requêtes et de mises à jour, mais les modifications apportées à la configuration ne seront pas visibles dans les résultats de recherche avant que l'indexation ne soit terminée et que le domaine ne passe à nouveau en statut « actif ».

Vous pouvez également continuer à charger des lots de documents sur votre domaine. Cependant, si vous soumettez un important volume de mises à jour pendant que votre domaine est en statut « en cours de traitement », l'application des mises à jour à votre index de recherche peut prendre davantage de temps. Si cela devient un problème, ralentissez le rythme de vos mises à jour jusqu'à ce que le domaine repasse au statut « actif ».


Q : Quelles sont les bonnes pratiques pour lancer des données dans CloudSearch ?

Après avoir lancé votre domaine, l'étape suivante consiste à charger vos données dans Amazon CloudSearch. Vous devrez probablement charger un ensemble de données unique mais volumineux, puis procéder à des petites mises à jour ou à de petits ajouts au fur et à mesure que de nouvelles données sont disponibles. Les recommandations suivantes vous aideront à lancer facilement et rapidement vos données initiales dans CloudSearch.

1. Utilisez l'outil de ligne de commande curl -v lorsque vous préparez votre script

Pendant le chargement d'un ensemble de données, le script que vous avez rédigé lit vos données et les utilise pour créer des documents JSON ou XML. Nous vous recommandons de préparer ce script à l'avance et d'utiliser curl ou un autre outil de ligne de commande simple pour vérifier que vous pouvez charger les documents créés par le script. L'option « -v » de curl fournit généralement des informations plus détaillées sur les problèmes de syntaxe que le kit SDK AWS ou Boto, qui suppriment tous deux les erreurs à des fins de production. Curl affiche plus de messages d'erreur, ce qui vous aide à identifier les sources des problèmes.

2. Utilisez le code de caractère UTF-8

Assurez-vous que toutes les données sont au format de code de caractère UTF-8 et que tous les mauvais caractères Unicode ont été supprimés avant de procéder au chargement vers CloudSearch. Les caractères illégaux peuvent faire échouer le chargement du document.

3. Regroupez vos documents

Regrouper vos documents représente peut-être l'étape la plus importante dans l'amorçage des données. Soumettre des documents individuellement dans CloudSearch est non seulement inefficace, mais provoque également des erreurs évitables.

Un lot de documents est simplement un regroupement des opérations d'ajout et de suppression, qui représente les documents que vous souhaitez ajouter, mettre à jour ou supprimer de votre domaine. Les lots sont décrits au format JSON ou XML et, lorsque vous chargez ces lots sur un domaine, les données sont indexées automatiquement, en fonction des options d'indexation définies pour le domaine. Dans la mesure où vous êtes facturé selon le nombre total de lots de documents chargés sur votre domaine de recherche, il est plus rentable de charger vos données par lots de 5 Mo, la taille maximale autorisée par chargement. Vous pouvez également charger des lots en parallèle, pour réduire le temps nécessaire au chargement de vos données.

4. Pré-dimensionnez vos données

Il est également important de pré-dimensionner vos données avant de les charger sur CloudSearch. Le pré-dimensionnement implique de sélectionner le type d'instance approprié à la quantité de données que vous souhaitez charger.

Choisir une instance possédant une capacité suffisante pour prendre en charge le volume de votre chargement peut vous aider à éviter les erreurs et un nombre de réplications élevé. Bien que la réplication puisse aider à diminuer le temps de réponse des recherches, elle n'augmente pas la taille du canal de données et ne règle pas les principaux problèmes liés au chargement des données.

CloudSearch se mettra automatiquement à l'échelle vers des instances plus volumineuses au fur et à mesure que vous envoyez des données supplémentaires. Toutefois, pré-sélectionner le type d'instance approprié permet ensuite de gagner du temps lors du processus d'amorçage, car la mise à l'échelle d'une instance à une autre a tendance a être un processus long. Vous trouverez ci-dessous un exemple de script permettant de pré-dimensionner le domaine pour l'amorçage et de restaurer le type d'instance après le chargement des données.

Pré-dimensionnement avant l'amorçage :

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge

 

aws cloudsearch index-documents --domain-name foo

Restauration après le chargement des données :

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small

 

aws cloudsearch index-documents --domain-name foo

Q : Existe-t-il des moyens d'éviter les erreurs 504 ?

Si vous constatez des erreurs 504 ou un nombre de réplications élevé, essayez de passer à un type d'instance plus volumineux. Par exemple, si vous rencontrez des problèmes avec une instance m3.large, passez à une instance m3.xlarge. Si vous obtenez toujours des erreurs 504, même après le pré-dimensionnement, commencez à regrouper les données et augmentez le délai entre les tentatives.

Q : Quelles sont les bonnes pratiques pour accélérer la réindexation et la configuration du domaine ?

Lorsque vous modifiez les options de configuration de votre domaine de recherche, vous devez recréer votre index de recherche pour que ces modifications prennent effet dans les résultats de recherche. La recréation de l'index peut prendre de 30 à 60 minutes, selon que vous effectuez une ou plusieurs modifications de la configuration à la fois. Même si votre domaine ne contient qu'un petit nombre de documents, la réindexation requiert ce délai en raison du traitement et du dimensionnement nécessaires pour créer l'index et le distribuer. De ce fait, nous vous conseillons de planifier les modifications de votre configuration à l'avance, d'effectuer tous vos changements en même temps, puis de réindexer votre domaine. Il en va de même lorsque vous configurez un nouveau domaine : planifiez votre configuration avant la mise en place de façon à effectuer une seule indexation et à pouvoir démarrer et commencer à travailler le plus rapidement possible.

Certaines modifications du domaine requièrent une réindexation quand d'autres ne nécessitent qu'un redéploiement de l'index existant. Redéployer le domaine ne prend que 10 à 15 minutes, contrairement aux 30 à 60 minutes requises pour une réindexation. Au cours du redéploiement, CloudSearch crée de nouveaux nœuds, déploie l'index sur ces derniers et met fin aux anciens nœuds. Le statut de votre domaine passe à « En cours de traitement » pendant le redéploiement. Lorsqu'une réindexation est nécessaire, le statut de votre domaine passe à « Indexation requise », puis à « En cours de traitement » une fois que vous avez lancé l'indexation. Une fois le nouvel index créé, votre domaine est redéployé. Le tableau suivant résume les modifications qui nécessitent une réindexation, puis un redéploiement, et celles qui requièrent uniquement un redéploiement. Comprendre ceci vous aidera à mieux planifier les modifications de votre configuration.

Modification                                         
Réindexation requise
Redéploiement requis
Multi-AZ Non
Oui

Champs d'index

Oui
Oui

Options des champs d'index

Oui Oui

Type d'instance

Oui Oui

Nombre de partitions

Oui Oui

Nombre de réplications

Non Oui

Outils de suggestion

Oui Oui

Expressions

Non Oui

Schémas d'analyse

Oui Oui

Q : Quelles sont les fonctions de recherche fournies par Amazon CloudSearch ?

Amazon CloudSearch fournit des fonctions permettant d'indexer et de rechercher à la fois des données structurées et du texte en clair, notamment des recherches à facettes, des recherches en texte libre, des expressions de recherche booléenne, une classification personnalisable par pertinence, des expressions de classement des interrogations par durée, la pondération des champs, la recherche et le tri des résultats par champ, ainsi que des options de traitement de texte parmi lesquelles la segmentation du texte, les mots vides, l'indexation par radicaux et les synonymes. Ce service permet également une indexation quasi en temps réel pour la mise à jour des documents. Voici quelques-unes des nouvelles fonctionnalités :

  • Suggestions de remplissage automatique
  • Mise en surbrillance
  • Recherche géolocalisée
  • Nouveaux types de données : date, double, entier signé 64 bits, LatLon
  • Champs dynamiques
  • Statistiques de champ d'index
  • Recherche de groupes de mots avec opérateur de proximité
  • Augmentation du score d'un terme
  • Possibilités de recherche étendues à tous les types de champs
  • Filtres de recherche n'affectant pas la pertinence
  • Prise en charge de plusieurs analyseurs de requêtes : simple, structuré, lucene, dismax
  • Options de configuration des analyseurs de requêtes

Q : Qu'est-ce que la recherche à facettes ?

La recherche à facettes vous permet de classer les résultats de votre recherche par catégories et d'affiner la recherche en fonction de celles-ci. Un utilisateur peut, par exemple, rechercher des « parapluies » les facettes lui permettant de regrouper les résultats par prix, comme 0-10 USD, 10-20 USD, 20-40 USD, etc. Amazon CloudSearch permet d'inclure les totaux des résultats dans les facettes, de telle sorte que chaque recherche affinée renvoie à un total du nombre de documents figurant dans ce groupe. L'exemple pourrait alors être : 0-10 USD (4 articles), 10-20 USD (123 articles), 20-40 USD (57 articles), etc.

Q : Quelles sont les langues prises en charge par Amazon CloudSearch ?

Amazon CloudSearch prend actuellement en charge 34 langues : allemand (de), anglais (en), arabe (ar), arménien (hy), basque (eu), bulgare (bg), catalan (ca), chinois simplifié (zh-Simp), chinois traditionnel (zh-Trad), coréen (ko), danois (da), espagnol (es), finnois (fi), français (fr), galicien (gl), grec (el), hébreu (he), hindi (hi), hongrois (hu), indonésien (id), irlandais (ga), italien (it), japonais (ja), letton (la), néerlandais (nl), norvégien (no), perse (fa), portugais (pt), roumain (ro), russe (ru), suédois (sv), tchèque (cs), thaï (th) et turc (tr). Amazon CloudSearch inclut également une option Multiple (mul) pour les champs contenant plusieurs langues.

Q : Amazon CloudSearch prend-il en charge la recherche géolocalisée ?

Oui, Amazon CloudSearch permet la prise en charge native de la latitude et de la longitude (latlon) ; vous pouvez donc facilement mettre en place une recherche et un tri selon des critères géographiques. Pour plus d'informations, consultez la section Searching and Ranking Results by Geographic Location du manuel Amazon CloudSearch Developer Guide.


Q : Sous quel délai mes documents seront-ils consultables ?

Les documents chargés sur un domaine de recherche sont généralement consultables après quelques secondes ou minutes.

Q : Combien de demandes de recherche puis-je envoyer à mon domaine de recherche ?

Il n'existe aucune limite intrinsèque quant au nombre de demandes de recherche qui peuvent être envoyées à un domaine de recherche.

Q : Quels sont les facteurs qui influencent le temps d'attente de mes demandes de recherche ?

Vos demandes de recherche sont généralement traitées en quelques centaines de millisecondes, souvent beaucoup plus vite. La latence dépend de nombreux facteurs, notamment du temps de transfert des requêtes et réponses entre votre propre application et votre domaine de recherche, de la complexité de votre requête de recherche et de la charge d'utilisation de votre domaine de recherche.

Q : Qu'est-ce qui fait qu'une demande de recherche est plus complexe qu'une autre ?

Amazon CloudSearch a été conçu pour traiter de manière efficace et très rapidement une large gamme de demandes de recherche. La complexité des requêtes de recherche varie en fonction des expressions déterminant quels documents correspondent et de critères supplémentaires déterminant le degré de correspondance de chaque document. Le traitement des demandes de recherche auxquelles correspondent un nombre élevé de documents prend plus de temps que celui de celles auxquelles correspondent très peu de documents. Le traitement des requêtes de recherche impliquant le calcul d'expressions complexes prend plus de temps que celui des requêtes qui procèdent à un classement en utilisant un critère simple, comme un champ unique. Pour vous aider à comprendre la différence de complexité entre les requêtes de recherche, le temps nécessaire au traitement de la requête est indiqué dans la réponse.

Q : Où dois-je exécuter mon application de recherche pour limiter le temps de communication avec mon domaine de recherche ?

Les applications hébergées dans la même région AWS que votre domaine de recherche offriront une meilleure réactivité.


Q : Qu'est-ce qu'une instance de recherche ?

Une instance de recherche est un moteur de recherche unique dans le cloud qui indexe des documents et répond à des demandes de recherche. Elle dispose d'une quantité définie de RAM et de ressources UC pour indexer des données et traiter des demandes.

Q : Qu'est-ce qu'une partition de recherche ?

Une partition de recherche est la partie de vos données qui tient sur une seule instance de recherche. Un domaine de recherche peut comporter une ou plusieurs partitions de recherche, et le nombre de partitions de recherche peut changer à mesure que vos documents sont indexés.

Q : Comment mon domaine de recherche s'adapte-t-il aux besoins de mon application ?

L'échelle des domaines de recherche évolue selon deux dimensions : données et trafic. Lorsque le volume de vos données augmente, vous avez besoin de davantage d'instances de recherche (ou d'instances de recherche plus grandes) pour contenir vos données indexées, et votre index est séparé entre les instances de recherche. Quand le volume ou la complexité de votre demande augmente, chaque partition de recherche doit être répliquée afin de fournir davantage d'UC pour cette partition de recherche. Par exemple, si vos données nécessitent trois partitions de recherche, votre domaine de recherche comportera trois instances de recherche. Lorsque votre trafic augmente au-delà de la capacité d'une seule instance de recherche, chaque partition est dupliquée pour fournir davantage de capacité UC, ajoutant trois instances de recherche supplémentaires à votre domaine de recherche. D'autres augmentations du trafic entraîneront des duplications supplémentaires, à concurrence de cinq, pour chaque partition de recherche.

Q : Quel volume de données puis-je charger dans mon domaine de recherche ?

Le nombre de partitions dont vous avez besoin dépend de vos données et de votre configuration ; le nombre maximum de données que vous pouvez charger correspond donc à l'ensemble de données qui, lorsque votre configuration de recherche est appliquée, aboutit à 10 partitions de recherche. Lorsque vous dépassez votre limite de partitions de recherche, votre domaine cesse d'accepter les chargements tant que vous n'aurez pas supprimé des documents et réindexé votre domaine. Si vous avez besoin de plus de dix partitions de recherche, veuillez nous contacter.

Q : Dois-je sélectionner le nombre et le type d'instances de recherche pour mon domaine de recherche ?

CloudSearch est un service de recherche entièrement géré qui adapte automatiquement l'échelle de votre domaine et sélectionne le nombre et le type d'instances de recherche. Toutes les instances de recherche d'un domaine de recherche donné sont du même type, et ce type peut changer dans le temps à mesure que vos données ou le trafic augmentent.

Vous pouvez également configurer des options de dimensionnement afin qu'un domaine Amazon CloudSearch privilégie les opérations suivantes :

  • Augmentation de la capacité de chargement
  • Accélération des requêtes de recherche
  • Augmentation de la capacité de recherche
  • Amélioration de la tolérance aux pannes

Q : Quels sont les types d'instance pris en charge par Amazon CloudSearch ?

Amazon CloudSearch prend en charge les types d'instance suivants :

  • Instance de recherche Small
  • Instance de recherche Large
  • Instance de recherche Extra Large
  • Instance de recherche Double Extra Large

Q : Comment puis-je trouver le nombre et le type d'instances de recherche dans mon domaine de recherche ?

Vous pouvez trouver le nombre et le type d'instances de recherche dans votre domaine de recherche à l'aide d'AWS Management Console, des kits SDK AWS ou de l'interface de ligne de commande AWS. Le nombre et le type d'instances de recherche change avec le temps et augmente ou diminue automatiquement en fonction de vos données indexables et du trafic de recherche.

Q : A quelle vitesse mon domaine de recherche s'adapte-t-il aux changements de données et de trafic ?

Les domaines de recherche réagissent généralement en quelques minutes à des augmentations du trafic. Cette adaptation peut prendre plus de temps en cas de modification du volume de données ou de baisse du trafic, mais vous pouvez accélérer le processus via une opération IndexDocuments. Si vous vous apprêtez à charger un grand volume de données ou prévoyez une forte augmentation du trafic de requêtes, vous pouvez mettre à l'échelle votre domaine par avance en sélectionnant le type d'instance et le nombre de réplications souhaités. Pour plus d'informations, consultez la section Configuring Scaling Options du manuel Amazon CloudSearch Developer Guide.

Q : Amazon CloudSearch prend-il en charge les déploiements multi-AZ ?

Oui. Amazon CloudSearch prend en charge les déploiements multi-AZ. Lorsque l'option de déploiement multi-AZ est activée, Amazon CloudSearch met en service et maintient des instances supplémentaires pour votre domaine de recherche dans une deuxième zone de disponibilité, ce qui garantit une haute disponibilité. Les mises à jour sont automatiquement appliquées aux instances des deux zones de disponibilité. Le trafic de recherche est réparti sur toutes les instances ; en cas de défaillance, les instances de chaque zone sont capables de traiter l'ensemble du trafic.

Q : Comment fonctionne la nouvelle fonction de déploiement Multi-AZ ? Mon système risque-t-il de rencontrer des temps d'arrêt en cas d'échec ?

Lorsque l'option de déploiement multi-AZ est activée, les instances Amazon CloudSearch de chaque zone sont capables de traiter l'ensemble du trafic. En cas d'interruption du service ou de dégradation des instances dans l'une des zones, Amazon CloudSearch dirige l'ensemble du trafic vers l'autre zone de disponibilité. Les instances redondantes sont restaurées dans une zone de disponibilité séparée, sans aucune action d'administration ni interruption du service.

Il se peut que certaines requêtes en cours de transmission échouent et doivent être réitérées. Les mises à jour envoyées au domaine de recherche sont stockées durablement et ne seront pas perdues en cas d'échec.

Q : Un domaine de recherche peut-il être déployé dans plus de 2 zones de disponibilité ?

Non. Un domaine peut être déployé dans deux zones de disponibilité au maximum.

Q : Est-il possible de modifier la configuration multi-AZ de mon domaine de recherche ?

Oui. Vous pouvez activer et désactiver la configuration multi-AZ de vos domaines de recherche quand vous le souhaitez. La modification de ce paramètre n'entraîne aucune interruption du service.

Q : Puis-je choisir les zones de disponibilité dans lesquelles mon domaine de recherche est déployé ?

Non. A l'heure actuelle, Amazon CloudSearch sélectionne automatiquement une autre zone de disponibilité au sein de la même région.

Q : Est-il possible de choisir le type d'instance utilisé par mon domaine ?

Oui. La dernière version d'Amazon CloudSearch vous permet d'indiquer le type d'instance de votre choix pour votre domaine. Si nécessaire, Amazon CloudSearch transférera votre domaine vers un type d'instance offrant plus de capacité, mais jamais vers un type d'instance aux capacités moindres.

Q : Quelle est la manière la plus rapide de transférer mes données vers CloudSearch ?

Par défaut, tous les domaines ne comportent au départ qu'une petite instance de recherche. Si vous avez besoin de charger un grand volume de données, nous vous conseillons de mettre à l'échelle votre domaine par avance en choisissant un type d'instance offrant plus de capacité. Pour plus d'informations, consultez la section Bulk Uploads du manuel Amazon CloudSearch Developer Guide.

Q : Comment savoir quel type d'instance choisir pour ma configuration initiale ?

Pour les ensembles de données représentant moins de 1 Go de données ou moins d'un million de documents de 1 Ko, commencez avec les paramètres par défaut correspondant à une seule instance de recherche de type Small. Pour les ensembles de données plus volumineux, vous pouvez préparer le domaine en définissant la taille d'instance souhaitée. Pour les ensembles de données de 8 Go et moins, commencez par une instance de recherche de type Large. Pour les ensembles de données compris entre 8 et 16 Go, commencez par une instance de recherche de type Extra Large. Pour les ensembles de données compris entre 16 et 32 Go, commencez par une instance de recherche de type Double Extra Large. Contactez-nous si vous avez besoin de capacités de chargement plus importantes ou si vous devez indexer plus de 500 Go de données.


Q : Quelles sont les fonctions de sécurité supplémentaires disponibles avec la nouvelle version d'Amazon CloudSearch ?

La dernière version d'Amazon CloudSearch permet l'intégration d'IAM pour le service de configuration et chacun des services des domaines de recherche. Vous pouvez contrôler l'accès à certaines actions dans Amazon CloudSearch et exiger que chaque demande soit authentifiée. Les demandes sont authentifiées à l'aide de Signature Version 4.

Q : Comment puis-je charger en toute sécurité mes données dans Amazon CloudSearch ?

Vous envoyez vos données au moyen d'une connexion SSL sécurisée et cryptée en utilisant le protocole HTTPS plutôt que HTTP lorsque vous vous connectez à Amazon CloudSearch.

Q : Mes données sont déjà cryptées. Puis-je simplement vous envoyer les données cryptées et la clé de cryptage ?

Nous ne prenons pas en charge les clés de cryptage générées par l'utilisateur. Vous devrez décrypter les données et les charger en utilisant le protocole HTTPS.

Q : Les résultats de recherche cryptés sont-ils pris en charge ?

Oui. Nous prenons en charge le protocole HTTPS pour toutes les demandes Amazon CloudSearch.

Q : Comment puis-je empêcher que des utilisateurs spécifiques n'accèdent à mon domaine de recherche ?

Amazon CloudSearch prend en charge l'intégration d'IAM pour le service de configuration et chacun des services des domaines de recherche. Vous pouvez accorder aux utilisateurs un accès complet à Amazon CloudSearch, limiter l'accès à certains domaines, ou encore autoriser ou interdire l'accès à certaines actions.


Q : Comment l'utilisation d'Amazon CloudSearch me sera-t-elle facturée ?

Il n'y a pas de frais d'installation, ni aucun engagement à prendre, pour commencer à utiliser le service. Après la fin du mois, votre carte de crédit sera automatiquement débitée pour l'utilisation de ce mois. Vous pouvez afficher vos frais pour la période de facturation en cours à tout moment sur le site Web AWS, en vous connectant à votre compte Amazon Web Services, et en cliquant sur « Account Activity » sous « Your Web Services Account ».

Q : Que coûte l'utilisation d'Amazon CloudSearch ?

Le modèle de tarification d'Amazon CloudSearch n'a pas été modifié pour le moment. Pour obtenir des informations détaillées sur la tarification, consultez la section Tarification Amazon CloudSearch.

Q : Est-il possible de bénéficier d'un essai gratuit pour Amazon CloudSearch ?

Oui. Tout nouveau client de CloudSearch peut bénéficier d'un essai gratuit. Pour en savoir plus, consultez la page relative à l'essai gratuit d'Amazon CloudSearch durant 30 jours.

Q : Comment est facturée l'utilisation de la nouvelle version d'Amazon CloudSearch ?

Le modèle de tarification d'Amazon CloudSearch n'a pas été modifié pour le moment. Pour plus d'informations, consultez la page Tarification.

 

Q : La nouvelle version d'Amazon CloudSearch permet-elle de réaliser des économies ?

La nouvelle version d'Amazon CloudSearch inclut une compression avancée des index et prend en charge des index plus volumineux pour chaque type d'instance. La nouvelle version d'Amazon CloudSearch est donc plus efficace que la précédente, ce qui peut générer des économies conséquentes.

Q : vos prix sont-ils toutes taxes comprises ?

Sauf indication contraire, nos prix n'incluent pas les taxes et redevances applicables, y compris la TVA et les taxes sur les ventes applicables. Pour les clients dont l'adresse de facturation est située au Japon, l'utilisation des services AWS est soumise à la taxe sur la consommation applicable dans ce pays. En savoir plus.