有关 OpenSearch 无服务器扩容和定价的问题

0

【以下的问题经过翻译处理】 serverless-overview 说明如下:

对于账户中的第一个集合,您需要支付至少 4 个 OCU 的费用(2 个用于摄取,包括主要和备用;2 个用于搜索,包括一个用于确保高可用性的活动副本)。

还有:

每个 OCU 是 6GiB 内存和相应的虚拟 CPU(vCPU)以及创建到 Amazon S3 的数据管道的组合。每个 OCU 都包含足够的热临时存储,可存储 120 GiB 的索引数据。

以下是针对全文搜索用例的一些问题:

1.120 GiB 的索引数据是文档大小吗?还是实际的OpenSearch索引段文件大小? 2.假设一个应用程序有 2 个集合,每个集合都有 120 GiB 的索引数据。当访问这两个集合时,将运行多少个OCU?8 个OCU? 3.假设 OpenSearch Serverless 可以自动缩小到 4 个 OCU,当一个集合没有被访问时。那么这些集合的数据会如何被缓存?当两个集合的负载到达相同时,OpenSearch Serverless 会扩展到 8 个 OCU 吗?查询的延迟是多少?假设最小的 4 个 OCU 将在 OCU 的本地存储中保存 120 GiB 的索引数据。但是,新的 4 个 OCU 将需要在查询服务之前下载剩余的 120 GiB的索引数据吗?如果是这样的话,查询可能会非常慢?

profile picture
专家
已提问 5 个月前110 查看次数
1 回答
0

【以下的回答经过翻译处理】 120GB 的索引数据是指文档的大小还是 OpenSearch 索引段文件的实际大小?

这 120GB 是 OCU 可用的存储空间。它将为索引中的分片(主分片和副本分片)存储数据,因此这是索引大小,而不是源大小。

假设一个应用程序有 2 个集合,每个集合都有 120GB 的索引数据。当访问这两个集合时,将运行多少个 OCU?8 个 OCU?

有相同 KMS 密钥的集合共享计算资源。因此,如果它们使用相同的密钥,将是 4 个 OCU(最少),然后根据索引大小进行扩展。

假设 OpenSearch Serverless 可以在一个集合不被访问时自动缩小到 4 个 OCU。这些集合的数据将如何进行缓存?如果同时加载这两个集合, OpenSearch Serverless 会扩展到 8 个 OCU 吗?查询的延迟会是多少?假设最少的 4 个 OCU 将保留 120GB 的索引数据在 OCU 的本地存储中。但是,新的 4 个 OCU 需要下载其余的 120GB 索引数据才能响应查询?如果是这样的话,查询可能会非常慢?

所有数据都从索引移动到 S3 并由搜索 OCU 从那里检索。存储在热存储中的数据取决于集合类型(搜索或时间序列)。搜索集合将所有数据都保持在热存储状态,以提供最佳的延迟。时间序列集合将每个索引的最新一天保留在热存储中。目前,我们不提供保留策略的控制。

OCU 何时扩容取决于他们有多少数据。如果你的 2 个集合有超过 240GB 索引,那么没错,OCU 将扩容来满足集合的需求。数据加载依赖于其他多个因素,因此我真的无法预测第一次查询的延迟。

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则