1 Antwort
- Neueste
- Die meisten Stimmen
- Die meisten Kommentare
0
【以下的回答经过翻译处理】 AWS有多种选项可以用于这种工作负载。如果没有所有生产者/消费者和其他要求的详细信息,就很难指定解决方案。我会尝试为您提供一些关于一些选项的指引。
S3很适合作为数据湖。您将保留用于处理的原始数据。通常,ETL将启动,从S3下载数据,处理后保存在另一个数据存储中。
这个第二个数据存储将是数据仓库(DW),在那里您有一些已处理的数据和一些商业价值。从那里运行分析作业应该更容易,因为DW解决方案通常针对这种事情进行了优化(例如Redshift)。
至于速度,这取决于一堆因素。
*您的数据是否分散在多个文件中,可以并行处理它们? *您是否可以优化代码? *是否达到了CPU/内存/IO限制? *下载时间(从S3)是否可接受?
很抱歉没有更具指导性的答案,但希望这可以帮助您一些。
Relevanter Inhalt
- AWS OFFICIALAktualisiert vor einem Jahr
- AWS OFFICIALAktualisiert vor einem Jahr
- AWS OFFICIALAktualisiert vor einem Jahr
- AWS OFFICIALAktualisiert vor 3 Jahren