有关 OpenSearch 无服务器扩容和定价的问题

0

【以下的问题经过翻译处理】 serverless-overview 说明如下:

对于账户中的第一个集合,您需要支付至少 4 个 OCU 的费用(2 个用于摄取,包括主要和备用;2 个用于搜索,包括一个用于确保高可用性的活动副本)。

还有:

每个 OCU 是 6GiB 内存和相应的虚拟 CPU(vCPU)以及创建到 Amazon S3 的数据管道的组合。每个 OCU 都包含足够的热临时存储,可存储 120 GiB 的索引数据。

以下是针对全文搜索用例的一些问题:

1.120 GiB 的索引数据是文档大小吗?还是实际的OpenSearch索引段文件大小? 2.假设一个应用程序有 2 个集合,每个集合都有 120 GiB 的索引数据。当访问这两个集合时,将运行多少个OCU?8 个OCU? 3.假设 OpenSearch Serverless 可以自动缩小到 4 个 OCU,当一个集合没有被访问时。那么这些集合的数据会如何被缓存?当两个集合的负载到达相同时,OpenSearch Serverless 会扩展到 8 个 OCU 吗?查询的延迟是多少?假设最小的 4 个 OCU 将在 OCU 的本地存储中保存 120 GiB 的索引数据。但是,新的 4 个 OCU 将需要在查询服务之前下载剩余的 120 GiB的索引数据吗?如果是这样的话,查询可能会非常慢?

profile picture
EXPERTE
gefragt vor 5 Monaten119 Aufrufe
1 Antwort
0

【以下的回答经过翻译处理】 120GB 的索引数据是指文档的大小还是 OpenSearch 索引段文件的实际大小?

这 120GB 是 OCU 可用的存储空间。它将为索引中的分片(主分片和副本分片)存储数据,因此这是索引大小,而不是源大小。

假设一个应用程序有 2 个集合,每个集合都有 120GB 的索引数据。当访问这两个集合时,将运行多少个 OCU?8 个 OCU?

有相同 KMS 密钥的集合共享计算资源。因此,如果它们使用相同的密钥,将是 4 个 OCU(最少),然后根据索引大小进行扩展。

假设 OpenSearch Serverless 可以在一个集合不被访问时自动缩小到 4 个 OCU。这些集合的数据将如何进行缓存?如果同时加载这两个集合, OpenSearch Serverless 会扩展到 8 个 OCU 吗?查询的延迟会是多少?假设最少的 4 个 OCU 将保留 120GB 的索引数据在 OCU 的本地存储中。但是,新的 4 个 OCU 需要下载其余的 120GB 索引数据才能响应查询?如果是这样的话,查询可能会非常慢?

所有数据都从索引移动到 S3 并由搜索 OCU 从那里检索。存储在热存储中的数据取决于集合类型(搜索或时间序列)。搜索集合将所有数据都保持在热存储状态,以提供最佳的延迟。时间序列集合将每个索引的最新一天保留在热存储中。目前,我们不提供保留策略的控制。

OCU 何时扩容取决于他们有多少数据。如果你的 2 个集合有超过 240GB 索引,那么没错,OCU 将扩容来满足集合的需求。数据加载依赖于其他多个因素,因此我真的无法预测第一次查询的延迟。

profile picture
EXPERTE
beantwortet vor 5 Monaten

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen