1 回答
- 最新
- 投票最多
- 评论最多
0
【以下的回答经过翻译处理】 首先,考虑一下是否拥有一个所有开发人员都连接的单个副本可以满足您的需求。他们可以远程连接,并且它将是您生产数据的一个副本。因此,它非常棒,因为很容易定期更新并保证覆盖所有生产用例。它有很多优势。
但这可能不能满足您的需求。您说您需要本地数据库。在这种情况下,我认为您有两条主要路径要考虑。
- 生成示例数据
- 创建提取生产数据子集的过程
在开始时,生成示例数据可能需要更多的工作。但它有一些不错的优点。很容易确保您生成所需的数据。它将是参数化的,因此每个开发人员在那个时刻生成他/她关心的数据。下载大数据集没有网络问题。
但如果您确实需要提取主数据库的一部分,那么您需要将其视为提取-转换-加载(ETL)项目。使用数据集成(DI/ETL)工具连接到主数据库并提取一些子集。理想情况下,子集将很容易定义。也许对于大多数表,您只需取最近2个月的数据,对于其他表(如参考表),则取整个表。定义所有单个映射可能需要很大的努力...但实际上并不复杂。您可以决定详细信息,如将数据加载到另一个数据库或保存到CSV文件中。然后使数据库转储或CSV文件可供您的开发人员使用。作为一名开发人员,您可能会倾向于编写自己的脚本来执行此作业。当然,这是可能的。但有许多优秀的ETL工具可供使用(包括一些免费工具),强烈推荐用相关工具来处理类似任务。
相关内容
- AWS 官方已更新 3 年前
- AWS 官方已更新 3 年前
- AWS 官方已更新 2 年前