在AWS Lake Formation中是否可以指定DB快照?

0

【以下的问题经过翻译处理】 在AWS Lake Formation中定义蓝图时,我们可以指定特定的快照吗?Lake Formation默认始终使用最近的快照吗?

profile picture
专家
已提问 5 个月前24 查看次数
1 回答
0

【以下的回答经过翻译处理】 AWS Lake Formation蓝图与您的数据库建立JDBC连接,并有效地对您要导入的表执行“select *”。它被称为数据库快照,因为它在某个时间点带来了完整的表。它不使用RDS备份快照来导入数据。

Lake Formation使您能够从蓝图创建工作流,在Lake Formation中创建工作流更加简单和自动化。另一种选择是在 AWS Glue中创建工作流。 Lake Formation提供以下类型的蓝图:

数据库快照 – 从JDBC源将所有表中的数据加载或重新加载到数据湖中。您可以根据排除模式从源中排除一些数据。

增量数据库——基于先前设置的书签,仅将新数据从 JDBC 源加载到数据湖中。您指定要包括的 JDBC 源数据库中的各个表。对于每个表,您选择书签列和书签排序顺序以跟踪以前加载的数据。第一次针对一组表运行增量数据库蓝图时,工作流会加载表中的所有数据并为下一次增量数据库蓝图运行设置书签。因此,您可以使用增量数据库蓝图而不是数据库快照蓝图来加载所有数据,前提是您将数据源中的每个表指定为参数。

日志文件 – 从日志文件源批量加载数据,包括AWS CloudTrail、Elastic Load Balancing日志和Application Load Balancer日志。

不要将这与Amazon RDS中可以从RDS备份快照中获取数据并将其加载到S3中的功能混淆。有关这方面的更多信息,请参阅:https://docs.aws.amazon.com/AmazonRDS/latest/UserGuide/USER_ExportSnapshot.html

profile picture
专家
已回答 5 个月前

您未登录。 登录 发布回答。

一个好的回答可以清楚地解答问题和提供建设性反馈,并能促进提问者的职业发展。

回答问题的准则