如何将Amazon SageMaker端点的自动缩放端点在闲时成本降至0?

0

【以下的问题经过翻译处理】 我想使用 Amazon Sagemaker 端点来进行自定义分类模型。该端点应仅处理零散的输入(例如每周几次)。为此,我想使用自动扩展,当端点未被使用时将实例数量缩减至零。如果端点没有实例,是否有任何相关的费用?谢谢!

1 Answer
0

【以下的回答经过翻译处理】 当端点大小缩到0时,您不需要支付任何计算成本的费用。但我认为您可以设计得更好。在SageMaker端点中,还有一些其他选项可供您使用(假设您正在使用实时端点):1. 尝试使用SageMaker无服务器推理。它具有完全的无服务器性质,因此只有在端点提供推理时才需支付费用。我认为这更适合您的要求。2. 您也可以考虑使用Lambda,这将减少您的托管成本。但是,您需要更多地设置推理堆栈。3. 还有SageMaker异步推理选项,但它主要适用于需要更长时间处理每个请求的推理。之所以提到它,是因为它也支持在没有流量时缩放到0。

profile picture
EXPERT
answered 8 months ago

You are not logged in. Log in to post an answer.

A good answer clearly answers the question and provides constructive feedback and encourages professional growth in the question asker.

Guidelines for Answering Questions