使用AWS re:Post即您表示您同意 AWS re:Post 使用条款

标记有以下标签的问题: 亚马逊 EMR 无服务器

Run big data applications using open-source frameworks without managing clusters and servers

内容语言: 中文 (简体)

Select up to 5 tags to filter
排序方式 最新

浏览下面列出的问题和回答,或者筛选和排序以缩小结果范围。

14 条结果
【以下的问题经过翻译处理】 EMR Serverless 服务是否有利用 Spot 容量的计划?类似的,例如到 ECS 的 Fargate Spot。
1
回答
0
点赞数
65
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 您能否建议使用哪些工具来迁移Spark应用程序到AWS?: Spark应用程序仅用于更改数据,没有任何UI。我们会定期启动它,可能每周启动几次。每次启动都会触及不同数量的来自Hadoop的数据。从我们团队中的不同人员启动该应用程序。 * 输入为:Hadoop / Kafka / HDFS中的表, * 输出为:Hadoop / Kafka和一些Clickhouse,但不是...
1
回答
0
点赞数
95
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 *下面的CF堆栈出现错误,错误信息为“Resource handler returned message: Error occurred during operation 'CreateApplication'.”(RequestToken:<some-token-id>,HandlerErrorCode:GeneralServiceException)” *区域:eu...
1
回答
0
点赞数
98
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我知道EMR Serverless 有应用程序限制。但是当同一个应用程序上同时运行多个Job 时,它们是否可以共享Worker的 可用容量?或者如果一个作业被分配了工作,它们被分配了整个工作容量吗?
1
回答
0
点赞数
79
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我在EMR Serverless中运行了一个ETL作业,但是即使EMR应用程序和S3存储桶位于同一地区,我仍然被收取了NAT gateway费用。我还在VPC中配置了网关终端节点以连接S3,但仍然看到NAT gateway费用。使用EC2实例测试了VPC终端节点,可以连接到S3。我想知道为什么EMR Serverless要使用NAT gateway而不是VPC终端节点,...
1
回答
0
点赞数
43
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 Hi,我想在 EMR Serverless上运行一个Job,该Job从 PostgreSQL 中读取和写入数据。我已经下载了 Jar 文件并将其上传到 S3,并在管理控制台的 Spark 属性中设置了 "spark.jars"。然而,作业失败了。 谢谢,Muthu
1
回答
0
点赞数
69
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 你好, 我终于使用EMR无服务器应用程序解决了大部分问题,但根据日志显示,似乎在以下代码行中存在特定问题: if (DeltaTable.isDeltaTable(spark, targetDeltaTableURI)): 日志中的错误消息如下所示,你可以在日志的顶部看到数据帧已创建,但在检查Delta表是否存在时出现错误。 |135123 |167...
1
回答
0
点赞数
53
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 你好,团队, 我想在 EMR Serverless 上运行使用 JDK 11 构建的 Spark 应用程序。由于默认映像不支持 JDK 11,因此我根据以下链接创建了自定义映像: Use case 2 : <https://aws.amazon.com/ru/blogs/big-data/add-your-own-libraries-and-application-...
1
回答
0
点赞数
87
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我正在评估EMR Serverless,通过文档了解到如何将Python依赖项打包到虚拟环境压缩包中并上传到S3,然后在Spark配置中使用。相比之下,对于EMR上的EKS,你需要构建包含依赖项的Docker镜像,将其上传到ECR,并使用 `spark.kubernetes.container.image` 选项指定。这种解决方案似乎比将虚拟环境打包成 .tar.gz ...
1
回答
0
点赞数
75
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 当配置EMR Serverless应用程序时,您可以选择预初始化容量的磁盘大小和应用程序的最大磁盘限制: ![磁盘大小](/media/postImages/original/IMeTrUgzw3RciHzq-O7IJugw) 但是,至少对于Hive作业,EMR Serverless将scratch和warehouse目录都存储在S3中。那么这个配置的磁盘空间用于什...
1
回答
0
点赞数
43
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 使用Scala创建了一个Spark作业,现在尝试找到将日志记录到cloudwatch的方法。 到目前为止,我尝试将作业打包为一个[cloudwatch appender](https://github.com/kdgregory/log4j-aws-appenders)的uber Jar,并通过传递log4j选项来实现,如下所示: ``` --class Main ...
1
回答
0
点赞数
49
检视次数
profile picture
专家
已提问 1 年前
【以下的问题经过翻译处理】 我每个小时都会在EMR无服务器上运行作业。所有作业都提交到同一个应用程序中,没有预先初始化的容量。在运行之间终止应用程序是否有任何好处?运行之间大约有30分钟的间隔。有任何费用方面的弊端吗?
1
回答
0
点赞数
57
检视次数
profile picture
专家
已提问 1 年前
  • 1
  • 2
  • 12 条/页