如何将Amazon SageMaker端点的自动缩放端点在闲时成本降至0?

0

【以下的问题经过翻译处理】 我想使用 Amazon Sagemaker 端点来进行自定义分类模型。该端点应仅处理零散的输入(例如每周几次)。为此,我想使用自动扩展,当端点未被使用时将实例数量缩减至零。如果端点没有实例,是否有任何相关的费用?谢谢!

1 回答
0

【以下的回答经过翻译处理】 当端点大小缩到0时,您不需要支付任何计算成本的费用。但我认为您可以设计得更好。在SageMaker端点中,还有一些其他选项可供您使用(假设您正在使用实时端点):1. 尝试使用SageMaker无服务器推理。它具有完全的无服务器性质,因此只有在端点提供推理时才需支付费用。我认为这更适合您的要求。2. 您也可以考虑使用Lambda,这将减少您的托管成本。但是,您需要更多地设置推理堆栈。3. 还有SageMaker异步推理选项,但它主要适用于需要更长时间处理每个请求的推理。之所以提到它,是因为它也支持在没有流量时缩放到0。

profile picture
专家
已回答 8 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则