1 Resposta
- Mais recentes
- Mais votos
- Mais comentários
0
【以下的回答经过翻译处理】 S3 Select无法保证扫描CSV行的任何特定顺序。它旨在处理存储在亚马逊S3中的对象,这是一个分布式存储系统,它可能在多个节点上并行处理数据,这可能导致扫描行的顺序是不确定的。
因此,如果你想使用S3 Select从存储在S3中的CSV文件中检索特定行,则不应依赖于任何特定的行扫描顺序。S3 Select针对性能进行了优化,它可以选择扫描整个文件或仅其子集,具体取决于诸如查询过滤器和文件大小等因素。
在你的示例中,如果要选择的行接近于文件底部,则根据使用的查询过滤器,S3 Select仍然可能需要扫描整个文件才能找到它们。如果这些行在文件的前几行中,则情况也是如此。
为了提高S3 Select的性能,您可以考虑将CSV文件分成较小的文件或使用类似于Apache Parquet的列格式,这可以通过减少需要扫描的数据量来提高查询性能。
Conteúdo relevante
- AWS OFICIALAtualizada há um ano
- AWS OFICIALAtualizada há 2 anos
- AWS OFICIALAtualizada há 2 anos