免费试用 Amazon CloudSearch

开始免费试用 CloudSearch
了解更多

获取 30 天免费试用全功能搜索实例 750 小时的使用时间。要开始试用,请执行以下操作:

登录您的 AWS 账户并启动 CloudSearch 控制台

只需单击几次便可创建和配置一个搜索域

上传数据并通过控制台、AWS 开发工具包或 CLI 发送搜索/更新请求


问:什么是 Amazon CloudSearch?

在 AWS 云中,Amazon CloudSearch 是一款完全托管的服务,可让您轻松地为网站或应用程序设置、管理或扩展搜索解决方案。

问:比起在 EC2 上运行自己的搜索服务,运行 Amazon CloudSearch 之类的托管搜索服务有什么收益?

 

与运行您的自管搜索服务相比,Amazon CloudSearch 提供了多个优势,包括配置简单、根据数据和流量进行自动扩展、自恢复集群、高可用性(通过多可用区实现)。您只需在 AWS 管理控制台中单击几下,即可创建一个搜索域,并上传您希望能通过 Amazon CloudSearch 搜索的信息,该服务会自动预配置所需的资源,并部署一个高度优化的搜索索引。

问:什么是搜索引擎?

通过搜索引擎,用户可以搜索大多数文字数据项目(称为文档)的集合,以快速查找最匹配结果。搜索请求通常是由非结构化文本组成的几个词,例如“马特 达蒙 电影”。返回的结果通常是按序排列的,最匹配或最关联的结果列在最前面(它们与搜索词的关系最密切)。

文档可以是完全非结构化的,也可以包含能够单独搜索的多个字段。例如,电影搜索服务的文档可能包含片名、导演、演员、介绍和评论等字段。搜索引擎返回的结果通常是对基本文档的引用,例如引用特定网页的 URL。但是,搜索服务也可以返回各个字段的实际内容。

问:Amazon CloudSearch 可带来哪些好处?

Amazon CloudSearch 是一种完全托管的搜索服务,可根据数据容量和搜索请求复杂性而自动扩展,以交付快速、准确的结果。Amazon CloudSearch 让客户能够增加搜索功能,而无需管理主机、流量和数据扩展、冗余或软件包。用户只需为消耗的资源支付较低的小时费率。与运行和管理您自己的搜索环境相比,Amazon CloudSearch 的总拥有成本得到了显著降低。

问:Amazon CloudSearch 是否可与存储服务结合使用?

搜索服务和存储服务互为补充。搜索服务要求您的文档已经存储在某个位置,无论它是在文件系统的文件中,还是在 Amazon S3 中的数据中、Amazon DynamoDB 还是 Amazon RDS 实例中的记录中。搜索服务是一个快速提取系统,通过名为索引的过程,让用户能够搜索出这些项目,而只产生次秒级的延迟。

问:Amazon CloudSearch 是否可与数据库结合使用?

搜索引擎和数据库并不是相互排斥的 – 事实上,它们通常结合使用。如果您已经有了一个包含结构化数据的数据库,则您可能希望使用搜索引擎,利用搜索关键字作为关联性标准,通过智能化方式筛选和排列数据库内容。

搜索服务可用于索引和搜索结构化数据和非结构化数据。搜索内容可以来自多个来源,还可以包括数据库字段,以及各种格式的文件、网页等。搜索服务能够支持可自定义的结果排名,还支持特殊搜索功能,例如使用分面进行数据库中不可用的筛选。

问:Amazon CloudSearch 在哪些区域提供?

Amazon CloudSearch 目前在以下 AWS 区域提供:美国东部 (弗吉尼亚北部)、美国西部 (俄勒冈)、美国西部 (加利福尼亚北部)、欧洲 (爱尔兰)、欧洲 (法兰克福)、南美洲 (圣保罗) 和亚太地区 (新加坡、东京、悉尼和首尔)。


问:Amazon CloudSearch 支持哪些新功能?

通过此最新发布版本,Amazon CloudSearch 支持多项新的搜索和管理功能。主要新功能包括:

  • 语言支持:
    • 34 种语言,另外还有可处理混合语言字段的“多语言”选项
    • 各字段语言配置
    • 特定语言文本分析
    • 多级算法词干搜索,可用于多种语言,包括“无”
  • 增强的搜索功能:
    • 建议
    • 突出显示
    • 地理空间搜索
    • 新的数据类型:date 型、double 型、64 位带符号 int 型以及 latlon 型
    • 模糊的短语搜索
    • 增加术语相关度
    • 增强范围搜索(所有字段类型)
    • 多查询解析支持:简单、结构化的lucene、dismax
    • 查询解析配置选项
  • 管理功能:
    • 高可用性选项
    • IAM 集成
    • 用户可配置扩展
  • 在其他 AWS 区域提供:亚太地区 (东京)、亚太地区 (新加坡)、亚太地区 (悉尼)、亚太地区 (首尔) 和南美洲 (圣保罗)

问:Amazon CloudSearch 是否仍然可以支持字典词干搜索?

可以。除了算法词干搜索外,新版的 Amazon CloudSearch 还支持字典词干搜索。

问:新版 Amazon CloudSearch 是否使用 Apache Solr?

可以。最新版 Amazon CloudSearch 已进行修改,以便能将 Apache Solr 用作基础的文本搜索引擎。除了托管搜索服务体验外,Amazon CloudSearch 现在还提供可通过 Apache Solr 使用的几个热门搜索引擎功能,这使设置、操作和扩展搜索域变得简单起来。

问:我是否可以通过控制台访问新版 Amazon CloudSearch?

可以。您可以通过控制台访问新版 Amazon CloudSearch。如果您当前是 Amazon CloudSearch 客户并且拥有搜索域,那么当您创建新的搜索域时,可以选择使用哪个版本的 Amazon CloudSearch。默认情况下,新客户将使用新版 Amazon CloudSearch 且不能访问 2011-01-01 版本。

问:新版 Amazon CloudSearch 支持哪些数据类型?

Amazon CloudSearch 支持两种类型的文本字段,文本和文字。文本字段根据为该字段配置的语言进行处理,从而确定可用作查询匹配的个别单词。包括案例在内的文字字段未经处理,且必须准确匹配。CloudSearch 还支持四种数字类型:int、double、date 和 latlon。Int 字段具有 64 位带符号的整数值。Double 字段具有双宽度浮点值。Date 字段具有根据 IETF RFC3339: yyyy-mm-ddT00:00:00Z 指定的 UTC(协调通用时间)日期。LatLon 字段包含存储为经纬度值对的位置。

问:我的现有搜索域是使用 2011-02-01 版 Amazon CloudSearch 创建的,能否继续使用?

可以。使用 2011-02-01 版 Amazon CloudSearch 创建的现有搜索域可以继续使用。

问:我能否在使用 2011-01-01 版 Amazon CloudSearch 创建的现有搜索域上使用新功能?

不能。使用 2011-01-01 版 Amazon CloudSearch 创建的现有搜索域不能访问新版本提供的功能。如需使用新功能,您必须使用 2013-01-01 版 Amazon CloudSearch 创建新搜索域。

问:如何将使用 2011-01-01 版 Amazon CloudSearch 构建的应用程序迁移到新版 Amazon CloudSearch 中?

如需使用新版 Amazon CloudSearch,您需要使用新版 Amazon CloudSearch 重新创建现有域并重新上传数据。想要了解更多信息,请参阅 Amazon CloudSearch 开发人员指南中的迁移到 2013-01-01 API

 

 

问:AWS 是否继续支持 2011-02-01 版 Amazon CloudSearch?

可以。AWS 会继续支持 2011-02-01 版 Amazon CloudSearch。

 

问:我是否可以使用 2011-02-01 版 Amazon CloudSearch 创建新的搜索域?

当前拥有现有 2011-02-01 域的 Amazon CloudSearch 客户可以选择他们的新域是使用 2011-02-01 API 还是新的 2013-01-01 API。新客户创建的搜索域将自动使用 2013-01-01 API。

问:是否可以获得包含新版 Amazon CloudSearch 的免费试用优惠?

新客户仍然可以获得包含 Amazon CloudSearch 的免费试用优惠。要了解详细信息,请参阅 Amazon CloudSearch 免费试用页面。


问:如何开始使用 Amazon Amazon CloudSearch?

要注册 Amazon CloudSearch,请单击 Amazon CloudSearch 详细信息页面上的“Create Free Account”按钮并完成注册过程。您必须拥有 Amazon Web Services 账户。如果还没有账户,则在您开始 Amazon CloudSearch 注册过程时,系统将会提示您创建 AWS 账户。

注册后,请从 AWS 管理控制台选择 Amazon CloudSearch。使用 Amazon CloudSearch 控制台,您可以快速创建搜索域、配置搜索字段、上传示例数据,并将搜索查询发送至搜索域。您还可以使用 AWS 开发工具包和 CLI 来执行这些操作。

有关更多信息,请参阅 Amazon CloudSearch Developer Guide 中的入门教程。

问:AWS 开发工具包是否支持 Amazon CloudSearch?

是,适用于 Java、Ruby、Python、.Net、PHP 和 Node.js 的 AWS 开发工具包都支持 CloudSearch。使用 AWS 开发工具包,您可以快速创建搜索域、配置搜索字段、上传数据,并将搜索查询发送至搜索域。

问:AWS CLI 是否支持 Amazon CloudSearch?

是,AWS CLI 支持 CloudSearch。使用 Amazon CLI,您可以快速创建搜索域、配置搜索字段、上传数据,并将搜索查询发送至搜索域。

问:我可以继续使用 Amazon CloudSearch CLT 吗?

可以,Amazon CloudSearch CLT 依然有效。


问:什么是搜索域?如何创建搜索域?

搜索域是一个数据容器和一系列服务,可将数据变成可搜索数据。这些服务包括:

  • 文档服务,让您能够将数据上传至搜索域以便进行索引。
  • 搜索服务,让您能够针对您索引的数据来执行搜索请求。
  • 配置服务,用于控制搜索域的行为(包括关联性排名)。

您可以使用 AWS 管理控制台、AWS 开发工具包或 AWS CLI 来创建、管理和删除搜索域。

问:如何将文档上传到搜索域?

通过使用 AWS 管理控制台、AWS 开发工具包或 AWS CLI 可以将文档上传到域中。

问:我的文档必须是特定格式的吗?

为使您的数据可以被搜索到,您需要将数据转换为 JSON 或 XML 格式。您希望能够作为搜索结果收到的每个项目都表示为一个文档。每个文档具有唯一文档 ID 以及一个或多个字段,其中包含您希望搜索并在结果中返回的数据。Amazon CloudSearch 会根据为该域配置的索引字段,从您的文档数据生成搜索索引。随着您的数据更改,您需要提交更新,以便将文档添加到索引中或从索引中删除。

问:我如何创建适用于 Amazon CloudSearch 格式的文档批次?

要创建描述您的数据的文档批次,您可以创建指定以下信息的 JSON 或 XML 文本文件:

  • 操作类型:添加或删除
  • 唯一标识符
  • 实际字段及其数据

以下示例显示了一个 JSON 格式的文档批次:

[
    {
       "fields" : {
         "directors" : [
             "Francis Lawrence"
          ],
          "release_date" : "2013-11-11T00:00:00Z",
          "genres" : [
             "Action",
             "Adventure",
             "Sci-Fi",
             "Thriller"
          ],
          "image_url" : "http://ia.media-imdb.com/images/M/MV5xMzzAx._V1_SX400_.jpg",
          "情节" : "Katniss Everdeen 和 Peeta Mellark 获得第 74 届《饥饿者游戏》的冠军后成为国会的目标,在 Panem 国地区引起一场叛乱。",
          "title" : "The Hunger Games: Catching Fire",
          "rank" : 4,
          "running_time_secs" : 8760,
          "actors" : [
             "Jennifer Lawrence",
             "Josh Hutcherson",
             "Liam Hemsworth"
           ],
          "year" : 2013
       },
       "id" : "tt1951264",
       "type" : "add"
    }
]

 

请注意,数值(例如年份)没有括在引号中,多值字段(例如 genre)中的整型值在 JSON 数列中列出。

要让数据在 Amazon CloudSearch 中使用,您可以将其保存为文件,然后使用 AWS 管理控制台、AWS 开发工具包或 AWS CLI 进行上传。

问:如何为我的文档建立索引?

当您将文档上传到搜索域时,将会自动建立索引。当您进行配置更改时,您也可以通过发送 IndexDocuments 请求,显式地为文档重新建立索引。

问:何时需要对我的域重新建立索引?

在对域重新建立索引之前,某些配置选项(例如添加新索引字段或更新词干或非索引字字典)是不可用的。如果您所做的更改必须进行索引,则域状态将显示需要将它加入索引。您可以从 AWS 管理控制台、AWS 开发工具包或 AWS CLI 启动索引。

问:如何向搜索域发送搜索请求?

每个搜索域都提供基于 REST 的搜索服务,该服务具有唯一 URL(搜索终端节点),接受对其文档集的搜索请求。您可以从 AWS 管理控制台、AWS 开发工具包或 AWS CLI 发送搜索请求。

问:搜索域可以横跨多个可用区域吗?

可以。如果您启用了多可用区域选项,则 Amazon CloudSearch 可在同一地区中的辅助可用区域内部署额外实例。想要了解更多信息,请参阅 Amazon CloudSearch 开发人员指南中的配置可用性选项部分。

问:是否可以将搜索域从一个地区转移到另一个?

当前,无法自动将搜索域从一个地区迁移到另一个地区。您需要在目标地区创建一个新域、配置此域并上传数据,然后删除原始域。

问:如何删除搜索域?

要删除一个搜索域,请单击 Amazon CloudSearch 控制台中的“Delete Domain”按钮。您还可以通过 AWS 开发工具包或 AWS CLI 删除域。

问:如何将文档从搜索域中删除?

要删除文档,可以在您的批上传中指定一个删除操作,其中包含您要删除的文档的 ID。

通过 AWS 管理控制台、AWS 开发工具包或 AWS CLI 可以提交数据上传。

问:如何清空搜索域?

如果希望保持域的终端节点,可以针对域中每个文档发送删除请求。

问:为什么我的域处在“Processing”状态?

域可能有三种不同状态:“processing”、“active”或“reindexing”。正常情况下域应该为“active”状态,该状态表示目前没有做出任何变更,该域可以查询和更新,所有之前所做的变更现在可以在搜索结果中看到。

当域需要重新索引时,Amazon CloudSearch 需要彻底重建索引。但是,在您开始重新索引前,域不会进入“processing”状态。在此阶段中,仍可以对域进行查询和更新,但是配置变更在索引结束前不会显示在搜索结果中,域的状态会变回“active”。

您还可以继续将成批文档上传到您的域。但是,如果您在域为“processing”状态时提交了大量更新,则将更新应用到搜索索引的时间将会增加。如果这对您造成了困扰,请将更新率调低,直至域返回到“active”状态。


问:将数据引导启动到 CloudSearch 中的最佳实践是什么?

将域启动后,下一步操作是将数据加载到 Amazon CloudSearch 中。您可能需要上传一个大型单一数据集,然后当新数据进来时进行小规模的更新或添加。下面的指南将帮助您将第一批数据快速轻松地引导启动到 CloudSearch 中。

1. 准备脚本时请使用 curl-v 命令行工具

在数据集上传的过程中,您编写的脚本会读取您的数据并将其用于创建 JSON 或 XML 文档。我们建议您提前将这个脚本准备好,并使用 curl 或其他简单的命令行工具进行查看,确认您是否可以上传脚本创建的文档。curl 中的“-v”选项通常可以提供比 AWS 软件开发工具包或 Boto (这两种工具都会阻碍生产目的相关错误的出现)更为详尽的语法问题相关信息。curl 能够显示更加详细的错误消息,有助于发现问题的源头。

2. 使用 UTF-8 字符代码

确保所有数据都采用 UTF-8 字符代码格式进行过格式化,任何错误的 Unicode 字符会在上传到 CloudSearch 之前被删除。非法字符将导致文档上传失败。

3. 批量处理文档

批量处理文档大概是数据引导启动中最重要的环节了。将文档逐一提交到 CloudSearch 效率不佳,还可能引起本可避免的错误。

文档批处理表示一系列添加和删除操作,这些操作代表了您希望从您的域中添加、更新或删除的文档。批处理用 JSON 或 XML 表示,当您将其上传到域时,数据会根据域的索引选项自动进行索引编制工作。因为计费的标准是上传到搜索域的文档批处理的总数,因此将数据以 5 MB 大小(上传允许的最大值)的批次进行上传比较符合成本效益。您也可以并行上传多个批处理文档,以减少上传数据所花费的时间。

4. 预扩展

将数据上传到 CloudSearch 之前对其进行预扩展也是一项重要的工作。预扩展包括针对需要上传的数据量选择合适的实例类型。

选择一种容量够用的实例来处理上传数据的大小,可以避免出现错误和较高的复制计数。虽然复制可以帮助减少搜索响应时间,但是并不能增加数据管道的大小,也无法解决数据上传中出现的核心问题。

当您发送的数据变多时,CloudSearch 可以自动调整规模,使用更大的实例。但是预先选择合适的实例类型仍能够在后续的引导启动流程中节省时间,因为从一个实例扩展到另一个通常是比较缓慢的过程。下方是一个示例脚本,对域进行预先扩展用于引导启动,并在数据加载后还原实例类型。

在引导启动前进行预先扩展:

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m3.2xlarge

 

aws cloudsearch index-documents --domain-name foo

在数据加载后进行还原:

aws cloudsearch update-scaling-parameters --domain-name foo --scaling-parameters DesiredInstanceType=search.m1.small

 

aws cloudsearch index-documents --domain-name foo

问:哪些方法可以避免 504 错误的出现?

如果您看到 504 错误或者较高的复制计数,可以尝试使用更大型的实例类型。例如,要是使用 m3.large 有问题,就去使用 m3.xlarge。如果您在预先扩展之后还是存在 504 错误,可以批量处理数据并延长每次重试之后的延迟时间。

问:加快域配置和索引重新编制速度的最佳实践有哪些?

当您改变搜索域的配置选项后,必须重建搜索索引,以便让所做的改变在搜索结果中生效。重建索引可能需要 30 到 60 分钟,不论您一次做出几项配置更改,时间不会有太大出入。即使您的域只有数量不多的文档,重建索引也要花差不多一样的时间,因为需要进行必要的处理和调配才能构建索引并对其进行分配。因此,您应该提前对配置变更进行计划,一次完成所有的变更内容,然后对域进行索引重建。这样的方法同样适用于新域的建立,建立新域前先对配置进行计划,这样就只需要进行一次索引编制,以最短的时间准备就绪开始运行。

有些域的变更还需要重建索引,而有些则只需要重新部署现有的索引即可。重新部署域需要 10 到 15 分钟时间,而重建索引需要 30 到 60 分钟时间。重新部署过程中,CloudSearch 会创建新的节点,在这些节点上面部署索引,并关闭旧的节点。重新部署进行过程中,域的状态会变成“Processing”。如果需要重建索引,域的状态会变成“Needs Indexing”,然后在索引开始编制后再变成“Processing”。新的索引创建完成后,域就重新部署完成了。下表总结了哪些变更需要先重建索引再重新部署,哪些只需要重新部署。了解这一点可以帮助您更好地计划配置的变更。

变更                                         
需要重建索引
需要重新部署
多可用区

索引字段



索引字段选项


实例类型


分区计数


复制计数


建议程序


表达式


分析计划


问:Amazon CloudSearch 提供哪些搜索功能?

Amazon CloudSearch 提供用于索引和搜索结构化数据和纯文本的多种功能,包括分面搜索、自由文本搜索、布尔搜索表达式、可自定义关联性排名、查询时间排名表达式、字段权重、使用任何字段对结果进行搜索和排序,以及文本处理选项,包括词汇切分、非索引字、词干和同义词。它还提供针对文档更新的接近实时索引。新功能包括:

  • 自动完成建议:
  • 突出显示
  • 地理空间搜索
  • 新的数据类型:date 型、double 型、64 位带符号 int 型以及 latlon 型
  • 动态字段
  • 索引字段统计
  • 模糊的短语搜索
  • 增加术语相关度
  • 增强范围搜索(所有字段类型)
  • 不影响相关性的搜索过滤器
  • 多查询解析支持:简单、结构化的lucene、dismax
  • 查询解析配置选项

问:什么是分面?

通过分面,您可将搜索结果分类为细化结果,让用户基于该结果执行进一步搜索。例如,用户可能搜索“伞”,通过分面,您可以按价格对搜索结果进行分组,例如 0-10 USD、10 USD-20 USD、20 USD-40 USD 等。Amazon CloudSearch 还允许在分面中包括一个结果计数,因而每个细化结果具有本组中的文档数量计数。例如:0-10 USD(4 个项目)、10 USD-20 USD(123 个项目)、20 USD-40 USD(57 个项目)等。

问:Amazon CloudSearch 支持哪些语言?

Amazon CloudSearch 目前支持 34 种语言:阿拉伯语 (ar)、亚美尼亚语 (hy)、巴斯克语 (eu)、保加利亚语 (bg)、加泰罗尼亚语 (ca)、简体中文 (zh-Simp)、繁体中文 (zh-Trad)、捷克语 (cs)、丹麦语 (da)、荷兰语 (nl)、英语 (en)、芬兰语 (fi)、法语 (fr)、加里西亚语 (gl)、德语 (de)、希腊语 (el)、希伯来语 (he)、北印度语 (hi)、匈牙利语 (hu)、印度尼西亚语 (id)、爱尔兰语 (ga)、意大利语 (it)、日语 (ja)、韩语 (ko)、拉脱维亚语 (la)、挪威语 (no)、波斯语 (fa)、葡萄牙语 (pt)、罗马尼亚语 (ro)、俄语 (ru)、西班牙语 (es)、瑞典语 (sv)、泰语 (th) 和土耳其语 (tr)。此外,Amazon CloudSearch 还支持多语言 (mul) 选项,用于含有混合语言的字段。

问:Amazon CloudSearch 是否支持地理空间搜索?

是,Amazon CloudSearch 有一种支持纬度和经度 (latlon) 的原生类型,以便您可以轻松执行基于地理空间的搜索和分类。想要了解更多信息,请参阅 Amazon CloudSearch 开发人员指南中的按地理位置查找和排列结果部分。


问:我上传的文档需要多长时间变成可搜索文档?

上传到搜索域的文档通常可在几秒钟至几分钟之内变成可搜索文档。

问:我可以向搜索域发出多少个搜索请求?

对于可以向搜索域发出的搜索请求数量,并不存在固有限制。

问:哪些因素会影响搜索请求的延迟?

您的搜索请求通常可在几百毫秒之内得到处理,而且速度通常更快。延迟受到诸多因素的影响,包括请求和响应在您自己的应用程序和搜索域之间传输花费的时间、您搜索请求的复杂性、您使用搜索域的负载大小。

问:哪些因素导致某些搜索请求比其他请求更加复杂?

Amazon CloudSearch 可以非常快速地高效处理大量搜索请求。各个搜索请求的复杂性都不相同,取决于确定哪些文档匹配的表达式和确定各个文档的匹配程度的其他标准。匹配大量文档的搜索请求所需的处理时间,长于匹配少量文档的搜索请求。计算复杂表达式的搜索请求所需的处理时间,长于使用简单的标准(例如单个字段)的搜索请求。为了帮助您了解搜索请求之间的复杂性差异,系统会在响应中返回每个请求所消耗的时间。

问:我应该在哪里运行我的搜索应用程序,以最大程度缩短与搜索域的通信时间?

将应用程序托管在搜索域所在的 AWS 地区将体验到最快的通信速度、最短的通信时间。


问:什么是搜索实例?

一个搜索实例是中的单个搜索引擎,可以索引文档并响应搜索请求。它获得有限的 RAM 和 CPU 资源,用于索引数据和处理请求。

问:什么是搜索分区?

搜索分区是由单个搜索实例处理的一部分数据。一个搜索域可能有一个或多个搜索分区,当您索引文档时,搜索分区的数量可能变化。

问:我的搜索域如何扩展以满足我的应用程序需求?

搜索域可在两个方面进行扩展:数据和流量。随着您的数据容量增长,您需要更多(或更大)的搜索实例以包含您的索引数据,而且您的索引将在多个搜索实例中分区。随着您的请求量或请求复杂性增加,每个搜索分区必须进行复制,以便为该搜索分区提供更多 CPU 容量。例如,如果您的数据需要三个搜索分区,则在您的搜索域中将有 3 个搜索实例。随着您的流量超出单个搜索实例的容量,每个分区将进行复制,以提供更多 CPU 容量,为您的搜索域添加另外三个搜索实例。流量进一步增加将导致更多复制,每个搜索分区可以复制最多 5 个。

问:我可以将多少数据上传到搜索域?

您需要的分区数量取决于您的数据和配置,因此您可以上传的最大数据量是当您应用的搜索配置导致产生 10 个搜索分区时的数据集。当您超出数据分区限制时,您的搜索域将停止接收上传,直至您删除文档或重新索引您的搜索域。如果您需要 10 个以上的搜索分区,请联系我们

问:我需要为搜索域选择搜索实例的数量和类型吗?

CloudSearch 是一种完全托管的搜索服务,可自动扩展您的搜索域,并选择搜索实例的数量和类型。特定搜索域中的所有搜索实例都属于同一种类型,随着您的数据或流量增加,此类型可能变化。

您还可以配置 Amazon CloudSearch 域扩展选项,从而:

  • 提升上传容量
  • 加速搜索请求
  • 提升搜索容量
  • 改进容错能力

问:Amazon CloudSearch 支持哪些实例类型?

Amazon CloudSearch 支持以下实例类型:

  • 小型搜索实例
  • 大型搜索实例
  • 超大型搜索实例
  • 双超大型搜索实例

问:我可以怎样了解到我搜索域中搜索实例的数量和类型?

通过使用 AWS 管理控制台、AWS 开发工具包或 AWS CLI,可以了解搜索域中搜索实例的数量和类型。搜索实例的数量和类型随着时间推移而变化,根据您的可索引数据和搜索流量而自动扩展。

问:我的搜索域能够以多快速度进行扩展,以适应数据和流量的变化?

搜索域通常在几分钟之内对流量增加做出反应。数据量变化或流量减小可能需要更长时间,但您可以通过调用 IndexDocuments 操作来加速这一过程。如果您正要上传大量数据或者预计查询流量将有一次猛增,可以通过设置所需的实例类型和复制次数预先扩展您的域。更多信息,请参阅 Amazon CloudSearch Developer Guide 中的 Configuring Scaling Options 部分。

问:Amazon CloudSearch 支持多可用区域部署吗?

可以。Amazon CloudSearch 支持多可用区域部署。启用了多可用区域选项后,Amazon CloudSearch 在辅助可用区域内为您的搜索域预置和维护额外实例,以确保高可用性。更新会自动应用到两个可用区域中的实例。搜索流量在所有实例间分配,并且,在出现故障时,各区域中的实例都能够处理所有负载。

问:新多可用区域功能如何发挥作用?我的系统是否会在发生故障时发生任何停机?

启用了多可用区域选项后,万一发生故障,各区域中的 Amazon CloudSearch 实例都能处理全部负载。如果服务中断或者一个区域中的实例降级,Amazon CloudSearch 会将所有流量路由到另一可用区域。冗余实例存储在单独的可用区域中,无需任何管理员干预或中断服务。

有些正在传送中的查询可能会失败,需要重试。发送至搜索域的更新会持久存储,并且不会在发生故障时丢失。

问:是否可以在 2 个以上可用区域中部署一个搜索域?

不能。一个域最多可以部署在 2 个可用区域中。

问:我是否可以在我的搜索域上修改多可用区配置?

可以。您可以打开/关闭您的搜索域的多可用区域配置。设置改变时,服务不会中断。

问:我是否可以选择在哪个可用区域部署我的搜索域?

不能。此时 Amazon CloudSearch 自动选择同一地区中的可用区域。

问:我是否可以选择我的域使用的实例类型?

可以。在最新发布的版本中,Amazon CloudSearch 允许您为域指定所需的实例类型。如果必要,Amazon CloudSearch 会将您的域扩展至更大的实例类型,但是绝不会收缩回较小的实例类型。

问:将数据放入 CloudSearch 的最快速的方法是什么?

默认情况下,所有域都是从小型搜索实例开始。如果您需要上传大量数据,则应预先将域扩展到较大实例类型。想要了解更多信息,请参阅 Amazon CloudSearch 开发人员指南中的批量上传

问:我如何知道应为我的初始设置选择哪个实例类型?

如果数据集小于 1GB 或少于 100 万个 1KB 大小的文档,初始默认设置是一个小型搜索实例。对于较大的数据集,则考虑通过设置所需实例类型来预热域。对于大至 8GB 的数据集,一开始就使用大型搜索实例。对于 8GB 到 16GB 的数据集,一开始就使用超大型搜索实例。对于 16GB 到 32GB 的数据集,一开始就使用双倍超大型搜索实例。如果您需要更多上传容量或具有 500GB 以上的容量进行索引,请联系我们


问:新版 Amazon CloudSearch 提供哪些额外的安全功能?

在发布了最新版本后,Amazon CloudSearch 现已能够与 IAM 相集成,用于控制对配置服务和所有搜索域服务的访问权限。您可以控制对特定 Amazon CloudSearch 操作的访问权限,也可以要求所有请求均需要通过身份验证。使用 Signature Version 4 签名对请求进行身份验证。

问:如何将数据安全上传至 Amazon CloudSearch?

在连接到 Amazon CloudSearch 时,您可以使用 HTTPS 取代 HTTP,从而使用安全和加密的 SSL 连接上传您的数据。

问:我的数据已加密。我可以只将加密数据和加密密钥发送给你们吗?

我们不支持用户生成的加密密钥。您必须解密数据,然后使用 HTTPS 上传数据。

问:你们支持加密搜索结果吗?

可以。我们支持在所有 Amazon CloudSearch 请求中使用 HTTPS 加密。

问:如何防止特定用户访问我的搜索域?

Amazon CloudSearch 支持用于配置服务和所有搜索域服务的 IAM 集成。您可以授予用户对 Amazon CloudSearch 的完全访问权限、限制访问特定域,并允许或拒绝访问特定操作。


问:Amazon CloudSearch 的使用如何收费和记账?

开始使用服务时,没有安装费,用户无需对服务的使用签订任何长期使用期限合约。每个月底之后将自动从您的信用卡扣除当月使用费。您可以随时在 AWS 网站上查看当前账单期的费用,只需登录您的 Amazon Web Services 账户,并单击“您的 Web 服务账户”下的“账户活动”。

问:使用 Amazon CloudSearch 如何收费?

目前,Amazon CloudSearch 的定价结构没有变化。有关详细定价信息,请参阅 Amazon CloudSearch 定价

问:Amazon CloudSearch 是否有免费试用版?

有,免费试用版可供新的 CloudSearch 客户试用。要了解更多信息,请参阅 Amazon CloudSearch 30 天免费试用

问:使用新版 Amazon CloudSearch 的费用是多少?

目前,Amazon CloudSearch 的定价结构没有变化。请参阅定价页面了解更多信息。

 

问:使用新版 Amazon CloudSearch 会产生任何成本节省吗?

新版 Amazon CloudSearch 具有高级索引压缩的功能特点,并支持为每种实例类型执行较大索引。这使新版 Amazon CloudSearch 比起之前版本更高效,因而,可以节省大量资金。

问:价格是否含税?

除非另行说明,否则我们的价格不包括适用的税费和关税 (包括增值税和适用销售税)。使用日本账单地址的客户若要使用 AWS,则需缴纳日本消费税。了解更多