1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 Kubernetes中没有内置的挂起/恢复Pod的设施。希望在Spot实例上处理长时间运行的任务的客户应确保其应用程序使用某种持久存储(如EBS、EFS或S3)执行检查点操作。当Pod重新调度时,它可以恢复其检查点状态并恢复处理。
即使对于非Spot工作负载,考虑到可靠性构建是一个好主意,因为硬件可能会失效。
最后,值得一提的是,通过遵循Spot最佳实践,他们可以以方式配置其节点组,从而最小化他们具有的Spot中断的数量。这可以通过在其EC2自动缩放组中添加多个实例类型并使用容量优化的分配策略来完成。如果他们正在使用带有Spot实例的EKS托管节点组,那么这已经在开箱即用中配置好了。
相关内容
- AWS 官方已更新 1 年前
- AWS 官方已更新 2 年前
- AWS 官方已更新 3 年前