Amazon CloudSearch kostenlos testen

Das kostenlose CloudSearch-Testprogramm starten
Weitere Informationen

Sie erhalten 30 Tage lang insgesamt 750 kostenlose Stunden voll funktioneller Such-Instances. So starten Sie:

Melden Sie sich in Ihrem AWS-Konto an und starten Sie die CloudSearch-Konsole.

Such-Domain mit nur wenigen Klicks erstellen

Daten hochladen und Such-/Update-Anfragen über die Konsole, AWS SDK oder CLI senden


F: Was ist Amazon CloudSearch?

Amazon CloudSearch ist ein vollständig verwalteter Suchdienst in der AWS-Cloud, der die Einrichtung, Verwaltung und Skalierung einer Suchlösung für Ihre Website oder Anwendung vereinfacht.

F: Was sind die Vorteile bei der Ausführung eines verwalteten Suchdiensts wie Amazon CloudSearch im Vergleich zur Ausführung meines eigenen Suchdiensts in EC2?

 

Amazon CloudSearch bietet mehrere Vorteile im Vergleich zum Ausführen eines eigenen selbstverwalteten Suchdienstes, so z. B. einfache Konfiguration, automatische Skalierung je nach Datenmenge und -verkehr, selbstheilende Cluster sowie Hochverfügbarkeit durch Multi-AZ-Bereitstellung. Mit ein paar Klicks in der AWS Management Console erstellen Sie einfach eine Such-Domain und laden die Daten, die durchsuchbar gemacht werden sollen, in Amazon CloudSearch hoch. Der Service bietet dann automatisch die benötigten Ressourcen und stellt einen stark optimierten Suchindex bereit.

F: Was ist eine Suchmaschine?

Eine Suchmaschine ermöglicht es, große Sammlungen von Daten, meist Texte (Dokumente genannt) zu durchsuchen, um schnell die am besten passenden Ergebnisse zu finden. Suchanfragen sind in der Regel ein paar Worte unstrukturierter Text, zum Beispiel "Matt Damon Filme". Bei den zurückgegebenen Ergebnissen werden in der Regel die am besten passenden oder die relevantesten Elemente zuerst aufgeführt (die den Suchbegriffen am besten entsprechen).

Dokumente können vollkommen unstrukturiert sein oder mehrere Felder enthalten, die wahlweise einzeln durchsucht werden können. Zum Beispiel könnte ein Suchdienst für Filme Dokumente mit Feldern für Titel, Regisseur, Schauspieler, Beschreibung und Bewertung enthalten. Die Ergebnisse, die von einer Suchmaschine zurückgegeben werden, sind in der Regel Proxies für die zugrundeliegenden Dokumente, z.B. URLs, die auf bestimmte Webseiten verweisen. Allerdings kann der Suchdienst auch die eigentlichen Inhalte der einzelnen Felder zurückgeben.

F: Welche Vorteile bietet Amazon CloudSearch?

Amazon CloudSearch ist ein vollständig verwalteter Suchdienst, der automatisch anhand der Datenmenge und der Komplexität der Suchanfragen skaliert wird, um schnelle und genaue Ergebnisse zu liefern. Mit Amazon CloudSearch können Kunden Suchkapazität hinzufügen, ohne Hosts, Verkehrs- und Datenskalierung, Redundanz oder Software-Pakete verwalten zu müssen. Benutzer zahlen geringe und stets verbrauchsbasierte Gebühren auf Stundenbasis. Amazon CloudSearch bietet im Vergleich zum Betrieb einer eigenen Suchumgebung deutlich niedrigere Gesamtbetriebskosten für Ihre Suchanwendungen.

F: Kann Amazon CloudSearch mit einem Speicherdienst genutzt werden?

Ein Suchdienst und ein Speicherdienst ergänzen sich gegenseitig. Ein Suchdienst erfordert, dass Ihre Dokumente bereits irgendwo gespeichert sind, zum Beispiel als Dateien eines Dateisystems, Daten in Amazon S3 oder Datensätze in einer Amazon DynamoDB- oder einer Amazon RDS-Instance. Der Suchdienst ist ein schnelles Datenabfragesystem, das diese Elemente mit Latenzen von unter einer Sekunde durch einen Prozess namens Indizierung durchsuchbar macht.

F: Kann Amazon CloudSearch mit einer Datenbank verwendet werden?

Suchmaschinen und Datenbanken schließen einander nicht aus – sie werden sogar oft gemeinsam eingesetzt. Wenn Sie bereits über eine Datenbank mit strukturierten Daten verfügen, sollten Sie eine Suchmaschine verwenden, um den Inhalt der Datenbank intelligent zu filtern und zu ordnen und dazu Schlüsselsuchbegriffe als Relevanzkriterien verwenden.

Ein Suchdienst kann zum Indizieren und Durchsuchen sowohl strukturierter als auch unstrukturierter Daten verwendet werden. Die Inhalte können aus verschiedenen Quellen stammen und Datenbankfelder in Dateien in verschiedenen Formaten, in Webseiten, usw. enthalten. Ein Suchdienst unterstützt eine anpassbare Ergebnissortierung sowie spezielle Suchfunktionen wie die Verwendung von Facetten zum Filtern, die nicht in Datenbanken enthalten sind.

F: In welchen AWS-Regionen ist Amazon CloudSearch verfügbar?

Amazon CloudSearch ist derzeit in den folgenden AWS-Regionen verfügbar: USA Ost (Nord-Virginia), USA West (Oregon), USA West (Nordkalifornien), EU (Irland), EU (Frankfurt), Südamerika (São Paulo) und Asien-Pazifik (Singapur, Tokio, Sydney).


F: Welche neuen Funktionen unterstützt Amazon CloudSearch?

Die neueste Version von Amazon CloudSearch unterstützt mehrere neue Such- und Verwaltungsfunktionen. Die wesentlichen neuen Funktionen sind u. a.:

  • Unterstützung von Sprachen:
    • 34 Sprachen plus die Funktion "Multiple" für die Verarbeitung von Feldern mit mehreren Sprachen
    • Feldbezogene Sprachkonfiguration
    • Sprachspezifische Textanalyse
    • Für viele Sprachen stehen mehrere Ebenen der algorithmischen Wortstammerkennung zur Verfügung, einschließlich der Option "None"
  • Optimierte Suchfunktionen:
    • Vorschläge
    • Hervorhebung
    • Geodatensuche
    • Neue Datentypen: Date, Double, 64-Bit-signiertes Int, LatLon
    • Ungenaue Ausdruckssuche
    • Höhere Gewichtung von Begriffen
    • Optimierte Bereichssuche für alle Feldtypen
    • Unterstützung mehrerer Abfrageparser: Einfach, Strukturiert, Lucene, Dismax
    • Optionen für die Konfiguration von Abfrageparsern
  • Verwaltungsfunktionen:
    • Option für hohe Verfügbarkeit
    • IAM-Integration
    • Benutzerkonfigurierbare Skalierung
  • Verfügbar in weiteren AWS-Regionen: Asien-Pazifik (Tokio), Asien-Pazifik (Singapur), Asien-Pazifik (Sydney), Asien-Pazifik (Seoul) und Südamerika (São Paulo)

F: Unterstützt Amazon CloudSearch weiter die Wortstammerkennung im Wörterbuch?

Ja. Die neue Version von Amazon CloudSearch unterstützt neben der algorithmischen Wortstammerkennung die Wortstammerkennung im Wörterbuch.

F: Wird Apache Solr von der neuen Version von Amazon CloudSearch verwendet?

Ja. Die neueste Version von Amazon CloudSearch wurde dahingehend überarbeitet, dass Apache Solr als zugrunde liegende Textsuchmaschine genutzt wird. Amazon CloudSearch bietet nun zusätzlich zur verwalteten Suchdienstumgebung mehrere beliebte Suchmaschinenfunktionen von Apache Solr, die das Einrichten, Betreiben und Skalieren einer Such-Domain vereinfachen.

F: Kann ich über die Konsole auf die neue Version von Amazon CloudSearch zugreifen?

Ja. Sie können über die Konsole auf die neue Version von Amazon CloudSearch zugreifen. Wenn Sie derzeit Amazon CloudSearch-Kunde mit vorhandenen Such-Domains sind, können Sie beim Erstellen neuer Such-Domains auswählen, welche Version von Amazon CloudSearch Sie verwenden möchten. Neukunden verwenden standardmäßig die neue Version von Amazon CloudSearch und haben keinen Zugriff auf die Version "2011-01-01".

F: Welche Datentypen unterstützt die neue Version von Amazon CloudSearch?

Amazon CloudSearch unterstützt zwei Typen von Textfeldern: Text und Literal. Textfelder werden gemäß der für das Feld konfigurierten Sprache verarbeitet, um einzelne Wörter zu bestimmen, die als Übereinstimmungen für Abfragen dienen können. Literalfelder werden nicht verarbeitet und müssen einschließlich Groß-/Kleinschreibung exakt übereinstimmen. CloudSearch unterstützt auch vier numerische Typen: Int, Double, Date und Latlon. Int-Felder enthalten 64-Bit-Ganzzahlwerte mit Vorzeichen. Double-Felder enthalten Fließkommawerte mit doppelter Breite. Date-Felder enthalten im UTC-Format (Coordinated Universal Time) angegebene Datumsangaben gemäß IETF RFC3339: yyyy-mm-ddT00:00:00Z. LatLon-Felder enthalten eine Position, die als Wertepaar aus geografischer Länge und Breite gespeichert ist.

F: Funktionieren meine vorhandenen mit der Version "2011-02-01" von Amazon CloudSearch erstellten Such-Domains weiter?

Ja. Vorhandene mit der Version "2011-02-01" von Amazon CloudSearch erstellte Such-Domains funktionieren auch weiterhin.

F: Kann ich die neuen Funktionen für meine mit Version "2011-01-01" von Amazon CloudSearch erstellten Such-Domains verwenden?

Nein. Vorhandene mit der Version "2011-01-01" von Amazon CloudSearch erstellte Such-Domains haben keinen Zugriff auf die in der neuen Version verfügbaren Funktionen. Um die neuen Funktionen nutzen zu können, müssen Sie eine neue Such-Domain mit der Version "2013-01-01" von Amazon CloudSearch erstellen.

F: Wie kann ich meine mit der Version "2011-01-01" von Amazon CloudSearch erstellten Anwendungen zur neuen Version von Amazon CloudSearch migrieren?

Zum Nutzen der neuen Version von Amazon CloudSearch müssen Sie vorhandene Domains unter Verwendung der neuen Version von Amazon CloudSearch neu erstellen und Ihre Daten erneut hochladen. Weitere Informationen finden Sie im Amazon CloudSearch Developer Guide unter Migrating to the 2013-01-01 API.

 

 

F: Wird AWS die Version "2011-02-01" von Amazon CloudSearch weiter unterstützen?

Ja. AWS setzt die Unterstützung für die Version "2011-02-01" von Amazon CloudSearch fort.

 

F: Kann ich mit der Version "2011-02-01" von Amazon CloudSearch neue Such-Domains erstellen?

Aktuelle Amazon CloudSearch-Kunden mit vorhandenen Domains der Version "2011-02-01" können neue Domains mit der API-Version "2011-02-01" oder der neuen API-Version "2013-01-01" erstellen. Von Neukunden angelegte Such-Domains werden automatisch mit der API-Version "2013-01-01" erstellt.

F: Kann ich für die neue Version von Amazon CloudSearch das kostenlose Testangebot nutzen?

Neukunden können weiterhin das für Amazon CloudSearch verfügbare kostenlose Testangebot nutzen. Einzelheiten finden Sie unter Amazon CloudSearch – 30 Tage kostenloses Testprogramm.


F: Welches sind die ersten Schritte bei einem Einstieg in Amazon CloudSearch?

Zur Registrierung bei Amazon CloudSearch klicken Sie auf die Schaltfläche Jetzt anmelden auf der Detailseite von Amazon CloudSearch und folgen dem Anmeldeprozess. Sie müssen über ein Amazon Web Services-Konto verfügen. Wenn Sie noch keinAWS-Konto haben, werden Sie aufgefordert, eines zu erstellen, wenn Sie mit dem Anmeldeprozess für Amazon CloudSearch beginnen.

Nach der Anmeldung wählen Sie in der AWS Management Console die Option Amazon CloudSearch. Über die Amazon CloudSearch-Konsole können Sie schnell eine Such-Domain erstellen, Ihre Suchfelder konfigurieren, Beispieldaten hochladen und Suchanfragen an Ihre Such-Domain senden. Sie können diese Vorgänge auch mithilfe der AWS SDKs und Befehlszeilen-Schnittstelle (CLI) ausführen.

Weitere Informationen finden Sie im Tutorial Getting Started im Amazon CloudSearch Developer Guide.

F: Wird Amazon CloudSearch von den AWS SDKs unterstützt?

Ja, die AWS SDKs für Java, Ruby, Python, .NET, PHP und Node.js bieten Unterstützung für CloudSearch. Über die AWS SDKs können Sie schnell eine Such-Domain erstellen, Ihre Suchfelder konfigurieren, Daten hochladen und Suchanfragen an Ihre Such-Domain senden.

F: Wird Amazon CloudSearch von der AWS-Befehlszeilen-Schnittstelle (CLI) unterstützt?

Ja, die AWS CLI bietet Unterstützung für Amazon CloudSearch. Über die AWS CLI können Sie schnell eine Such-Domain erstellen, Ihre Suchfelder konfigurieren, Daten hochladen und Suchanfragen an Ihre Such-Domain senden.

F: Kann ich die Befehlszeilen-Tools für Amazon CloudSearch weiterverwenden?

Ja, die Befehlszeilen-Tools für Amazon CloudSearch funktionieren weiterhin.


F: Was ist eine Such-Domain und wie kann ich sie erstellen?

Eine Such-Domain ist ein Datencontainer und eine Reihe von Diensten, um Daten durchsuchbar zu machen. Diese Dienste umfassen:

  • Einen Dokumentendienst, mit dem Sie Daten hochladen können, damit die Indizierung mit Ihrer Domain möglich ist.
  • Einen Suchdienst, mit dem Sie Suchanfragen in Ihren indizierten Daten durchführen können.
  • Ein Konfigurationsdienst zur Steuerung des Verhaltens Ihrer Domain (einschließlich Relevanzeinstufung).

Sie können Such-Domains mit der AWS Management Console, den AWS SDKs oder der AWS CLI erstellen, verwalten und löschen.

F: Wie kann ich Dokumente auf meine Such-Domain hochladen?

Sie laden Dokumente mithilfe der AWS Management Console, den AWS SDKs oder der AWS CLI in Ihre Domain hoch.

F: Müssen meine Dokumente ein bestimmtes Format haben?

Um Ihre Daten durchsuchbar zu machen, müssen Sie sie im JSON- oder XML-Format formatieren.  Jedes Element, das als Suchergebnis zurückgegeben werden soll, wird als Dokument dargestellt. Jedes Dokument hat eine eindeutige Dokument-ID und mindestens ein Feld mit den Daten, die Sie durchsuchen und in Ergebnissen zurückgeben möchten. Amazon CloudSearch generiert aus Ihren Dokumentdaten einen Suchindex, der den Indexfeldern entspricht, die für die Domain konfiguriert sind. Wenn sich Ihre Daten ändern, senden Sie Aktualisierungen, um Dokumente Ihrem Index hinzuzufügen oder daraus zu löschen.

F: Wie erstelle ich für Amazon CloudSearch formatierte Dokumentstapel?

Zum Erstellen von Dokumentstapeln zum Beschreiben Ihrer Daten erstellen Sie JSON- oder XML-Textdateien, die Folgendes angeben:

  • Den Operationstyp: hinzufügen oder löschen
  • Einen eindeutiger Identifikator
  • Die eigentlichen Felder und ihre Daten

Das folgende Beispiel zeigt einen einzelnen mit JSON formatierten Dokumentstapel:

[
    {
       "fields" : {
         "directors" : [
             "Francis Lawrence"
          ],
          "release_date" : "2013-11-11T00:00:00Z",
          "genres" : [
             "Action",
             "Adventure",
             "Sci-Fi",
             "Thriller"
          ],
          "image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg",
          "plot" : "Katniss Everdeen and Peeta Mellark become targets of the Capitol after their victory in the 74th Hunger Games sparks a rebellion in the Districts of Panem.",
          "title" : "The Hunger Games: Catching Fire",
          "rank" : 4,
          "running_time_secs" : 8760,
          "actors" : [
             "Jennifer Lawrence",
             "Josh Hutcherson",
             "Liam Hemsworth"
           ],
          "year": 2013
       },
       "id" : "tt1951264",
       "type": "add"
    }
]

 

Beachten Sie, dass numerische Werte wie beispielsweise die Versionsnummer und das Jahr nicht in Anführungszeichen stehen und dass Werte in einem Feld mit mehreren Werten wie "genre" in einem JSON-Array aufgelistet werden.

Damit diese Daten für Amazon CloudSearch verfügbar sind, können Sie sie als Datei speichern und mit der AWS Management Console, den AWS SDKs oder der AWS CLI hochladen.

F: Wie werden meine Dokumente indiziert?

Die Dokumente werden automatisch indiziert, wenn Sie sie auf Ihre Such-Domain hochladen. Sie können Ihre Dokumente auch explizit neu indizieren, wenn Sie Konfigurationsänderungen vornehmen, indem Sie eine IndexDocuments-Anfrage senden.

F: Wann muss ich meine Domain neu indizieren?

Bestimmte Konfigurationsoptionen, zum Beispiel das Hinzufügen eines neuen Indexfeldes oder die Aktualisierung Ihrer Abstammungs- oder Stoppwortwörterbücher, sind erst wieder verfügbar, wenn Ihre Domain neu indiziert wurde. Nach Änderungen, die eine Indizierung erfordern, zeigt der Domain-Status an, dass die Domain indiziert werden muss. Sie können die Indizierung über die AWS Management Console, AWS SDKs oder AWS CLI auslösen.

F: Wie sende ich Suchanfragen an meine Such-Domain?

Jede Such-Domain besitzt einen REST-basierten Suchdienst mit einer eindeutigen URL (Such-Endpunkt), der Suchanfragen für seinen Dokumentensatz annimmt. Sie können Suchanfragen über die AWS Management Console, AWS SDKs oder AWS CLI senden.

F: Kann eine Such-Domain mehrere Availability Zones umfassen?

Ja. Wenn Sie die Option "Multi-AZ" aktivieren, stellt Amazon CloudSearch weitere Instances in einer zweiten Availability Zone in derselbe Region bereit. Weitere Informationen finden Sie unter Configuring Availability Options im Amazon CloudSearch Developer Guide.

F: Kann ich eine Such-Domain aus einer Region in eine andere verschieben?

Derzeit gibt es keine Möglichkeit, eine Such-Domain automatisch aus einer Region in eine andere zu verschieben. Sie müssen in der Zielregion eine neue Domain erstellen und konfigurieren, Ihre Daten hochladen und die ursprüngliche Domain anschließend löschen.

F: Wie lösche ich meine Such-Domain?

Klicken Sie zum Löschen einer Such-Domain in der Amazon CloudSearch-Konsole auf die Schaltfläche "Delete Domain". Sie können Domains auch über die AWS SDKs oder AWS CLI löschen.

F: Wie lösche ich Dokumente aus meiner Such-Domain?

Zum Löschen von Dokumenten geben Sie einen Löschbefehl für den Hochladevorgang des Stapels an, der die ID des Dokuments enthält, das Sie entfernen möchten.

Sie können Datenaktualisierungen über die AWS Management Console, AWS SDKs oder AWS CLI übermitteln.

F: Wie leere ich meine Such-Domain?

Wenn Sie die Endpunkte Ihrer Domain beibehalten möchten, können Sie einen Löschvorgang für jedes Dokument in Ihrer Domain senden.

F: Warum befindet sich meine Domain im Status "in Bearbeitung"?

Eine Domain kann einen der folgenden drei Status haben: "in Bearbeitung", "aktiv" oder "erneut indexiert". Normalerweise hat Ihre Domain den Status "aktiv". Dieser gibt an, dass aktuell keine Änderungen vorgenommen werden, die Domain abgefragt und aktualisiert werden kann und dass alle vergangenen Änderungen aktuell in den Suchergebnissen sichtbar sind.

Wenn eine Domain neu indiziert werden muss, muss Amazon CloudSearch den Index vollständig neu erstellen. Die Domain befindet sich jedoch erst dann im Status "in Bearbeitung", wenn Sie mit der erneuten Indizierung starten. Die Domain kann in diesem Status weiterhin abgefragt und aktualisiert werden. Allerdings sind Konfigurationsänderungen erst dann in den Suchergebnissen zu sehen, wenn die Indizierung abgeschlossen ist und der Status der Domain wieder zu "aktiv" geändert wurde.

Sie können auch weiterhin Dokumentenstapel in Ihre Domain hochladen. Wenn Sie jedoch viele Updates absenden, während sich Ihre Domain im Status "in Bearbeitung" befindet, kann es länger dauern, bis Ihre Updates im Suchindex angewendet werden. Falls dies zu einem Problem wird, verlangsamen Sie die Geschwindigkeit Ihrer Updates, bis die Domain sich wieder im Status "aktiv" befindet.


F: Welche Vorgehensweise wird für das Bootstrapping von Daten in CloudSearch empfohlen?

Wenn Sie Ihre Domain gestartet haben, laden Sie im nächsten Schritt Ihre Daten in Amazon CloudSearch hoch. Sie müssen wahrscheinlich einen einzigen großen Datensatz hochladen und kleinere Aktualisierungen oder Hinzufügungen dann vornehmen, wenn Sie neue Daten haben. Befolgen Sie die nachstehenden Richtlinien, um das Bootstrapping Ihrer ursprünglichen Daten in CloudSearch schnell und einfach durchzuführen.

1. Verwenden Sie zur Vorbereitung Ihres Skripts das Befehlszeilentool curl-v.

Beim Hochladen eines Datensatzes liest das von Ihnen geschriebene Skript Ihre Daten und erstellt damit JSON- oder XML-Dokumente. Bereiten Sie dieses Skript im Voraus vor. Verwenden Sie curl oder ein anderes einfaches Befehlszeilentool, um zu testen, ob Sie die vom Skript erstellten Dokumente hochladen können. Die Option "-v" in curl bietet oft detailliertere Informationen zu Syntaxproblemen als das AWS SDK oder Boto, die zu Produktionszwecken Fehler unterdrücken. Curl zeigt detailliertere Fehlermeldungen an, anhand derer Sie Fehlerquellen einfacher ermitteln können.

2. Verwenden Sie den Zeichencode UTF-8.

Achten Sie darauf, dass alle Daten im Zeichencode-Format UTF-8 formatiert sind und dass alle ungültigen Unicode-Zeichen vor dem Hochladen in CloudSearch entfernt wurden. Wenn Sie nicht zugelassene Zeichen verwenden, tritt beim Hochladen des Dokuments ein Fehler auf.

3. Stapeln Sie Ihre Dokumente.

Das Stapeln Ihrer Dokumente ist wahrscheinlich der wichtigste Schritt beim Daten-Bootstrapping. Das Senden einzelner Dokumente in CloudSearch ist nicht nur ineffizient, es führt auch zu unnötigen Fehlern.

Ein Dokumentenstapel ist einfach eine Sammlung von Vorgängen zum Hinzufügen und Löschen, die die Dokumente darstellen, die Sie Ihrer Domain hinzufügen, in Ihre Domain hochladen oder aus ihr löschen möchten. Stapel werden entweder in JSON oder XML beschrieben. Wenn Sie sie in eine Domain hochladen, werden die Daten entsprechend der Indizierungsoptionen der Domain automatisch indiziert. Da die Gebühren nach der Gesamtzahl der Dokumentenstapel berechnet werden, die Sie in Ihre Suchdomain hochladen, ist es am günstigsten, wenn Sie Ihre Daten in Stapeln mit einer Größe von 5 MB (Höchstgrenze pro Upload) hochladen. Sie können Stapel auch parallel hochladen, um die Upload-Zeit Ihrer Daten zu verkürzen.

4. Vorskalierung

Es ist wichtig, dass Sie Ihre Daten vor dem Hochladen in CloudSearch vorskalieren. Dazu gehört die Auswahl eines geeigneten Instance-Typs für die Datenmenge, die Sie hochladen möchten.

Indem Sie eine Instance mit genügend Kapazität für die Größe Ihres Uploads verwenden, können Sie Fehler und eine hohe Anzahl an Replikationen vermeiden Obwohl durch die Replikation die Reaktionszeit der Suche verringert werden kann, erhöht Sie nicht die Größe Ihrer Datenpipeline oder behandelt Kernprobleme beim Daten-Upload.

CloudSearch skaliert automatisch auf höhere Instances, wenn Sie mehr Daten senden. Sie sparen dennoch später beim Bootstrapping Zeit, wenn Sie die geeigneten Instance-Typen vorher auswählen, da die Skalierung von einer Instance auf die nächste in der Regel langsamer vor sich geht. Nachstehend finden Sie ein Skript-Beispiel für die Vorskalierung der Domain für das Bootstrapping sowie die Wiederherstellung der Instance-Typen nach dem Laden der Daten.

Vorskalierung vor dem Bootstrapping:

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge

 

aws cloudsearch index-documents --domain-name foo

Wiederherstellung nach dem Laden der Daten:

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small

 

aws cloudsearch index-documents --domain-name foo

F: Wie kann ich den Fehler 504 vermeiden?

Wenn Sie den Fehler 504 oder hohe Replikationsraten sehen, verwenden Sie größere Instance-Typen. Wenn beispielsweise bei m3.large Probleme auftreten, verwenden Sie m3.xlarge. Wenn der Fehler 504 auch nach der Vorskalierung noch auftritt, stapeln Sie die Daten und erhöhen Sie die Verzögerung zwischen erneuten Versuchen.

F: Wie beschleunige ich die Konfiguration und erneute Indizierung meiner Domain am besten?

Wenn Sie die Konfigurationsoptionen Ihrer Suchdomain ändern, müssen Sie Ihren Suchindex neu erstellen, damit diese Änderungen in den Suchergebnissen wirksam werden. Die Neuerstellung des Index kann zwischen 30 und 60 Minuten dauern. Die benötigte Zeit hängt davon ab, ob Sie je eine Konfigurationsänderung oder mehrere Konfigurationsänderungen gleichzeitig vornehmen. Selbst wenn in Ihrer Domain nur wenige Dokumente vorhanden sind, dauert die erneute Indizierung wegen der Bearbeitung und Bereitstellung, die für die Erstellung und Verteilung des Index nötig sind, so lange. Planen Sie Ihre Konfigurationsänderungen daher im Voraus, nehmen Sie alle Änderungen gleichzeitig vor und indizieren Sie Ihre Domain anschließend erneut. Dies gilt auch für die Einrichtung einer neuen Domain: Planen Sie Ihre Konfiguration vor der Einrichtung, damit die Indizierung nur einmal nötig ist und Sie so schnell wie möglich starten können.

Bei manchen Domainänderungen ist eine erneute Indizierung nötig, bei anderen hingegen reicht die erneute Bereitstellung des vorhandenen Index aus. Die erneute Bereitstellung einer Domain dauert 10 bis 15 Minuten, die erneute Indizierung hingegen 30 bis 60 Minuten. Während der erneuten Bereitstellung erstellt CloudSearch neue Knoten, stellt die Indizes darauf bereit und deaktiviert alte Knoten. Während der erneuten Bereitstellung ändert sich der Status Ihrer Domain zu "in Bearbeitung". Wenn eine erneute Indizierung nötig ist, ändert sich der Status Ihrer Domain zu "Indizierung nötig". Sobald Sie die Indizierung gestartet haben, ändern sich der Status zu "in Bearbeitung". Nachdem der neue Index erstellt wurde, wird Ihre Domain erneut bereitgestellt. In der folgenden Tabelle sind die Änderungen zusammengefasst, für die eine erneute Indizierung, gefolgt von einer erneuten Bereitstellung, erforderlich ist, sowie die Änderungen, für die lediglich eine erneute Bereitstellung nötig ist. Wenn Sie darüber Bescheid wissen, können Sie Ihre Konfigurationsänderungen besser planen.

Änderung                                         
Erneute Indizierung nötig
Erneute Bereitstellung nötig
Multi-AZ Nein
Ja

Indexfelder

Ja
Ja

Optionen für Indexfelder

Ja Ja

Instance-Typ

Ja Ja

Anzahl der Verteilungen

Ja Ja

Anzahl der Replikationen

Nein Ja

Vorschlagfunktionen

Ja Ja

Ausdrücke

Nein Ja

Analyseschemen

Ja Ja

F: Welche Suchfunktionen bietet Amazon CloudSearch?

Amazon CloudSearch bietet Funktionen zum Indizieren und Durchsuchen sowohl strukturierten Daten als auch unformatiertem Text, einschließlich facettierter Suche, Freitextsuche, boolescher Suchausdrücke, anpassbarer Relevanzsortierung, Ausdrücke zum Bestimmen der Bewertung anhand der Abfragezeit, Feldgewichtung, Suchen und Sortieren von Ergebnissen anhand eines beliebigen Felds sowie Textverarbeitungsoptionen wie beispielsweise Tokenisierung, Stoppwörtern, Wortstammerkennung und Synonyme. Der Service bietet auch die Indizierung von Dokumentaktualisierungen nahezu in Echtzeit. Neue Funktionen sind u. a:

  • Vorschläge zur AutoVervollständigung
  • Hervorhebung
  • Geodatensuche
  • Neue Datentypen: Date, Double, 64-Bit-signiertes Int, LatLon
  • Dynamische Felder
  • Statistiken für Indexfelder
  • Ungenaue Ausdruckssuche
  • Höhere Gewichtung von Begriffen
  • Optimierte Bereichssuche für alle Feldtypen
  • Suchfilter ohne Auswirkung auf die Relevanz
  • Unterstützung mehrerer Abfrageparser: Einfach, Strukturiert, Lucene, Dismax
  • Optionen für die Konfiguration von Abfrageparsern

F: Was ist Facettierung?

Die Facettierung ermöglicht es Ihnen, Ihre Suchergebnisse in verfeinerten Einheiten zu kategorisieren, die dem Benutzer eine weitere Suche ermöglichen. Zum Beispiel könnte ein Benutzer nach ''Regenschirme'' suchen, und die Facetten können die Ergebnisse nach Preisgruppe zurückgeben, zum Beispiel 0 – 10 USD, 10 – 20 USD, 20 – 40 USD und so weiter. Amazon CloudSearch ermöglicht es auch, Ergebnismengen in die Facetten einzubeziehen, so dass jede Verfeinerung die Anzahl der Dokumente in dieser Gruppe enthält. Das Beispiel könnte dann lauten: 0 – 10 USD (4 Artikel), 10 – 20 USD (123 Artikel), 20 – 40 USD (57 Artikel) und so weiter.

F: Welche Sprachen unterstützt Amazon CloudSearch?

Amazon CloudSearch unterstützt derzeit 34 Sprachen: Arabisch (ar), Armenisch (hy), Baskisch (eu), Bulgarisch (bg), Katalanisch (ca), vereinfachtes Chinesisch (zh-Simp), traditionelles Chinesisch (zh-Trad), Dänisch (da), Niederländisch (nl), Deutsch (de), Englisch (en), Finnisch (fi), Französisch (fr), Galizisch (gl), Griechisch (el), Hebräisch (he), Hindi (hi), Indonesisch (id), Irisch (ga), Italienisch (it), Japanisch (ja), Koreanisch (ko), Lettisch (la), Norwegisch (no), Persisch (fa), Portugiesisch (pt), Rumänisch (ro), Russisch (ru), Spanisch (es), Schwedisch (sv), Thai (th), Tschechisch (cs), Türkisch (tr) und Ungarisch (hu). Darüber hinaus unterstützt Amazon CloudSearch die Option "Multiple (mul)" für Felder mit gemischten Sprachen.

F: Unterstützt Amazon CloudSearch eine Geodatensuche?

Ja, Amazon CloudSearch bietet einen systemeigenen Suchtyp, der Längen- und Breitengrade (LatLon) unterstützt, damit Sie eine geobasierte Suche und Sortierung einfach implementieren können. Weitere Informationen finden Sie unter Searching and Ranking Results by Geographic Location im Amazon CloudSearch Developer Guide.


F: Wie schnell werden meine hochgeladenen Dokumente durchsuchbar?

Dokumente sind in der Regel innerhalb weniger Sekunden oder Minuten nach dem Hochladen auf eine Such-Domain durchsuchbar.

F: Wie viele Suchanfragen kann ich an meine Such-Domain senden?

Es gibt keine intrinsische Grenze für die Anzahl von Suchanfragen, die an eine Such-Domain gesendet werden können.

F: Welche Faktoren beeinflussen die Latenz meiner Suchanfragen?

Ihre Suchanfragen werden in der Regel innerhalb von wenigen hundert Millisekunden verarbeitet, häufig sehr viel schneller. Die Latenz hängt von vielen Faktoren ab, einschließlich der Zeit, die für die Übertragung Ihrer Anforderung und der Antworten zwischen Ihrer eigenen Anwendung und Ihrer Such-Domain benötigt wird, sowie von der Komplexität Ihrer Suchanfrage und wie intensiv Sie Ihre Such-Domain verwenden.

F: Was macht eine Suchanfrage komplexer als andere?

Amazon CloudSearch ist dazu konzipiert, eine Vielzahl von Suchanfragen effizient und sehr schnell zu verarbeiten. Suchanfragen sind unterschiedlich komplex, was von den Ausdrücken, die festlegen, welche Dokumente übereinstimmen, und von zusätzlichen Kriterien abhängt, die bestimmen, wie genau jedes Dokument übereinstimmt. Die Verarbeitung von Suchanfragen, denen viele Dokumente entsprechen, dauert länger als von solchen, denen nur sehr wenige Dokumente entsprechen. Die Verarbeitung von Suchanfragen, die komplexe Ausdrücke berechnen, dauert länger als von solchen, die ein einfaches Kriterium verwenden, zum Beispiel nur ein einzelnes Feld. Damit Sie den Unterschied bei der Komplexität zwischen Suchanfragen besser erkennen, wird die benötigte Verarbeitungszeit jeder Anfrage als Teil der Antwort zurückgegeben.

F: Wo soll ich meine Suchanwendung ausführen, um die Kommunikationsdauer mit meiner Such-Domain zu minimieren?

Die Kommunikation ist am schnellsten, wenn Anwendungen in derselben AWS-Region wie Ihre Such-Domain gehostet werden.


F: Was ist eine Suchinstanz?

Eine Such-Instance ist eine zentrale Suchmaschine in der Cloud, die Dokumente indiziert und auf Suchanfragen reagiert. Sie besitzt eine endliche Menge an RAM- und CPU-Ressourcen für die Indizierung von Daten und die Verarbeitung von Anfragen.

F: Was ist eine Suchpartition?

Eine Suchpartition ist der Teil Ihrer Daten, der auf eine einzelne Suchinstanz passt. Eine Such-Domain kann über eine oder mehrere Suchpartitionen verfügen und die Anzahl der Suchpartitionen kann sich ändern, wenn Ihre Dokumente indiziert werden.

F: Wie wird meine Such-Domain skaliert, um meinen Anwendungsbedarf zu erfüllen?

Such-Domains werden in zwei Dimensionen skaliert: Daten und Verkehr. Wenn Ihr Datenvolumen wächst, brauchen Sie mehr (oder größere) Suchinstanzen für Ihre indizierten Daten, und Ihr Index wird auf die Suchinstanzen verteilt. Wenn Volumen oder Komplexität Ihrer Anfragen steigen, muss jede Suchpartition repliziert werden, um zusätzliche CPU-Leistung für diese Suchpartition zur Verfügung zu stellen. Wenn zum Beispiel Ihre Daten drei Suchpartitionen erfordern, hat Ihre Such-Domain drei Suchinstanzen. Wenn Ihr Datenverkehr die Kapazität einer einzigen Suchinstanz übersteigt, wird jede Partition repliziert, um zusätzliche CPU-Kapazität zu schaffen, und es werden drei zusätzliche Suchinstanzen zu Ihrer Such-Domain hinzugefügt. Weitere Erhöhungen des Datenverkehrs führen zu zusätzlichen Replikaten für jede Suchpartition, maximal 5.

F: Wie viele Daten kann ich auf meine Such-Domain hochladen?

Die Anzahl der benötigten Partitionen hängt von Ihren Daten und Ihrer Konfiguration ab. Die maximale Datenmenge, die Sie hochladen können, entspricht der Datenmenge, die nach Anwenden Ihrer Suchkonfiguration in 10 Suchpartitionen resultiert. Wenn Sie die Grenze Ihrer Suchpartition überschreiten, nimmt Ihre Domain keine Uploads mehr an, bis Sie Dokumente löschen und Ihre Domain neu indizieren. Wenn Sie mehr als 10 Suchpartitionen benötigen, wenden Sie sich an uns.

F: Muss ich die Anzahl und Art der Suchinstanzen für meine Such-Domain auswählen?

CloudSearch ist ein vollständig verwalteter Dienst, der Ihre Such-Domain automatisch skaliert und die Zahl und Art der Suchinstanzen auswählt. Alle Suchinstanzen in einer bestimmten Such-Domain sind vom gleichen Typ und dieser kann sich im Lauf der Zeit ändern, wenn Ihre Datenmenge oder Ihr Datenverkehr wachsen.

Sie können auch Skalierungsoptionen für eine Amazon CloudSearch-Domain für folgende Zwecke konfigurieren:

  • Erhöhen der Hochladekapazität
  • Beschleunigen von Suchanfragen
  • Erhöhen der Suchkapazität
  • Verbessern der Fehlertoleranz

F: Welche Instance-Typen unterstützt Amazon CloudSearch?

Amazon CloudSearch unterstützt die folgenden Instance-Typen:

  • Such-Instance "Small"
  • Such-Instance "Large"
  • Such-Instance "Extra Large"
  • Double Extra Large Such-Instance

F: Wie finde ich die Anzahl und Art der Suchinstanzen in meiner Such-Domain heraus?

Über die AWS Management Console, AWS SDKs oder AWS CLI können Sie Anzahl und Typ von Such-Instances in Ihrer Such-Domain ermitteln. Die Anzahl und Art der Suchinstanzen ändert sich im Lauf der Zeit und wird automatisch je nach Menge der indizierbaren Daten und Stärke des Suchverkehrs nach oben oder unten skaliert.

F: Wie schnell wird meine Such-Domain skaliert, um sich an Änderungen bei Daten und Verkehr anzupassen?

Such-Domains reagieren in der Regel innerhalb von Minuten auf Erhöhungen des Verkehrs. Bei Veränderungen der Datenmenge oder einer Reduzierung des Datenverkehrs kann es länger dauern, doch Sie können diesen Prozess durch Aufrufen des Vorgangs "IndexDocuments" beschleunigen. Wenn Sie eine große Datenmenge hochladen wollen oder einen Anstieg beim Abfragedatenverkehr erwarten, können Sie Ihre Domain vorab skalieren, indem Sie den gewünschten Instance-Typ und die Anzahl der Replikationen festlegen. Weitere Informationen finden Sie unter Configuring Scaling Options im Amazon CloudSearch Developer Guide.

F: Unterstützt Amazon CloudSearch Multi-AZ-Bereitstellungen?

Ja. Amazon CloudSearch unterstützt Multi-AZ-Bereitstellungen. Wenn Sie die Option "Multi-AZ" aktivieren, werden von Amazon CloudSearch in einer zweiten Availability Zone zur Sicherstellung von Hochverfügbarkeit zusätzliche Instances vorgehalten und verwaltet. Aktualisierungen erfolgen automatisch an den Instances in beiden Availability Zones. Suchdatenverkehr wird auf alle Instance verteilt und die Instances in beiden Zonen können bei einem Ausfall die volle Last bewältigen.

F: Wie funktioniert die neue Multi-AZ-Funktion? Kommt es bei einem Ausfall zu Ausfallzeiten in meinem System?

Bei aktivierter Option "Multi-AZ" können Amazon CloudSearch-Instances bei einem Ausfall in der jeweils anderen Zone die volle Last bewältigen. Wenn der Service unterbrochen wird oder die Leistung der Instances in einer Zone nachlässt, leitet Amazon CloudSearch den gesamten Datenverkehr zur anderen Availability Zone. Redundante Instances werden in einer getrennten Availability Zone ohne administrative Eingriffe oder Serviceunterbrechung wiederhergestellt.

Laufende Abfragen schlagen ggf. fehl und müssen wiederholt werden. An die Such-Domain gesendete Aktualisierungen werden beständig gespeichert und gehen daher bei einem Ausfall nicht verloren.

F: Kann eine Such-Domain in mehr als 2 Availability Zones bereitgestellt werden?

Nein. 2 ist die maximale Anzahl von Availability Zones, in denen eine Domain bereitgestellt werden kann.

F: Kann ich die Multi-AZ-Konfiguration meiner Such-Domain ändern?

Ja. Sie können die Multi-AZ-Konfiguration für Ihre Such-Domains aktivieren und deaktivieren. Der Service wird nicht gestört, wenn diese Einstellung geändert wird.

F: Kann ich wählen, in welchen Availability Zones meine Such-Domain bereitgestellt ist?

Nein. Derzeit wählt Amazon CloudSearch automatisch eine alternative Availability Zone in derselben Region.

F: Kann ich den Instance-Typ wählen, den meine Domain nutzt?

Ja. Die neueste Version von Amazon CloudSearch erlaubt Ihnen die Angabe des gewünschten Instance-Typs für Ihre Domain. Bei Bedarf skaliert Amazon CloudSearch Ihre Such-Domain auf einen größeren Such-Instance-Typ. Eine Skalierung zurück zu einem kleineren Instance-Typ erfolgt hingegen nicht.

F: Wie gelangen meine Daten am schnellsten in CloudSearch?

Standardmäßig beginnen alle Domains mit einer Such-Instance vom Typ "Small". Wenn Sie vorhaben, große Datenmengen hochzuladen, skalieren Sie Ihre Domain vorab auf einen größeren Instance-Typ. Weitere Informationen finden Sie unter Bulk Uploads im Amazon CloudSearch Developer Guide.

F: Woher weiß ich, welchen Instance-Typ ich für meine anfängliche Einrichtung wählen soll?

Bei Datenmengen von weniger als 1 GB bzw. weniger als 1 Mio. Dokumente mit 1 KB beginnen Sie mit den Standardeinstellungen einer einzelnen Such-Instance vom Typ "Small". Erwägen Sie bei größeren Datenmengen die Anpassung der Domain durch Festlegen des gewünschten Instance-Typs. Beginnen Sie bei Datenmengen bis zu 8 GB mit einer Such-Instance vom Typ "Large". Beginnen Sie bei Datenmengen von 8 GB bis 16 GB mit einer Such-Instance vom Typ "Extra Large". Beginnen Sie bei Datenmengen von 16 GB bis 32 GB mit einer Such-Instance vom Typ "Double Extra Large". Kontaktieren Sie uns, wenn Sie mehr Upload-Kapazität benötigen oder mehr als 500 GB indizieren müssen.


F: Welche neuen Sicherheitsmerkmale bietet die neue Version von Amazon CloudSearch?

Mit der neuesten Version bietet Amazon CloudSearch nun IAM-Integration für den Konfigurationsservice und alle Domain-Suchservices. Sie können den Zugriff auf bestimmte Aktionen von Amazon CloudSearch kontrollieren und Authentifizierung für alle Anforderungen verlangen. Anforderungen werden durch Unterzeichnen mit Signature Version 4 authentifiziert.

F: Wie lade ich meine Daten sicher auf Amazon CloudSearch hoch?

Sie senden uns Ihre Daten über eine sichere und verschlüsselte SSL-Verbindung mit HTTPS statt mit HTTP, wenn Sie eine Verbindung zu Amazon CloudSearch herstellen.

F: Meine Daten sind bereits verschlüsselt. Kann ich Ihnen einfach die verschlüsselten Daten und den Schlüssel dafür senden?

Wir unterstützen keine benutzergenerierten Schlüssel. Sie müssen die Daten entschlüsseln und unter Verwendung von HTTPS hochladen.

F: Unterstützen Sie verschlüsselte Suchergebnisse?

Ja. Wir unterstützen HTTPS für alle Anfragen bei Amazon CloudSearch.

F: Wie kann ich verhindern, dass bestimmte Benutzer Zugriff auf meine Such-Domain haben?

Amazon CloudSearch unterstützt die IAM-Integration für den Konfigurationsservice und alle Domain-Suchservices. Sie können Benutzern Vollzugriff auf Amazon CloudSearch gewähren, ihren Zugriff auf bestimmte Domains beschränken oder den Zugriff auf bestimmte Aktionen zulassen oder verweigern.


F: Wie wird mir die Nutzung von Amazon CloudSearch in Rechnung gestellt?

Sie können mit der Verwendung dieses Service beginnen, ohne dass Ihnen Einrichtungsgebühren oder sonstige Verpflichtungen entstehen. Am Ende eines Monats wird Ihre Kreditkarte automatisch mit den Nutzungsgebühren für den betreffenden Monat belastet. Sie können die Gebühren für den aktuellen Abrechnungszeitraum jederzeit auf der AWS-Website einsehen. Melden Sie sich hierzu bei Ihrem Amazon Web Services-Konto an und klicken Sie unter ''Your Web Services Account'' auf Account Activity.

F: Wie viel kostet die Nutzung von Amazon CloudSearch?

Derzeit gibt es keine Änderungen an der Preisstruktur von Amazon CloudSearch. Weitere Informationen finden Sie in der Amazon CloudSearch-Preisliste.

F: Gibt es eine kostenlose Testversion von Amazon CloudSearch?

Ja, für CloudSearch-Neukunden gibt es eine kostenlose Testversion. Weitere Informationen finden Sie unter Amazon CloudSearch – 30¬Tage kostenloses Testprogramm.

F: Wie viel kostet die Nutzung der neuen Version von Amazon CloudSearch?

Derzeit gibt es keine Änderungen an der Preisstruktur von Amazon CloudSearch. Auf der Seite mit den Preisen finden Sie weitere Informationen.

 

F: Bringt die neue Version von Amazon CloudSearch Kosteneinsparungen?

Die neue Version von Amazon CloudSearch bietet eine optimierte Indexkomprimierung und unterstützt für alle Instance-Typen größere Indizes. Dadurch ist die neue Version Amazon CloudSearch effizienter als die frühere Version, was zu beträchtlichen Kosteneinsparungen führen kann.

F: Sind Steuern bereits in den Preisen enthalten?

Falls nicht anders angegeben, gelten unsere Preise zuzüglich anfallender Steuern und Abgaben, u. a. MwSt. und Umsatzsteuer. Bei Kunden mit japanischer Rechnungsadresse unterliegt die Nutzung von AWS-Services der japanischen Verbrauchssteuer. Weitere Informationen.