Using Amazon EBS for Data Lake

0

Hi, I'd like to know if it's possible to use Amazon EBS for storing data(csv,json,...) for Data Lake, and acces them for processing and store to s3 ?

posix
gefragt vor 2 Jahren337 Aufrufe
1 Antwort
0
Akzeptierte Antwort

Hi,

While you could use EBS to implement portions of a data lake architecture (volumes for data analytics EC2 instances, for example), it is not a good choice for storing the actual data in a data lake. This is because EBS volumes are typically only accessible by one instance (excluding multi-attach, which requires a cluster-aware filesystem) and should not be used for sharing data. They will not be accessible by Glue, Athena or OpenSearch. Your better bet would be to store the shared data in S3, which is a key aspect of data lake design.

AWS
kdavyd
beantwortet vor 2 Jahren
AWS
EXPERTE
überprüft vor 2 Jahren
  • Oley i understand. Thank you.

Du bist nicht angemeldet. Anmelden um eine Antwort zu veröffentlichen.

Eine gute Antwort beantwortet die Frage klar, gibt konstruktives Feedback und fördert die berufliche Weiterentwicklung des Fragenstellers.

Richtlinien für die Beantwortung von Fragen