Quero vincular meu Caderno Amazon EMR a um repositório baseado em Git.
Resolução
**Observação:**Os Cadernos do Amazon EMR estão disponíveis como Amazon EMR Studio Workspaces no novo console do Amazon EMR.
Para criar um novo notebook Amazon EMR no console antigo e associar o notebook a um repositório baseado em Git, conclua as seguintes etapas:
- Crie uma sub-rede privada em uma Amazon Virtual Private Cloud (Amazon VPC).
- Crie um gateway NAT e atualize sua tabela de rotas para apontar para o gateway NAT.
- Inicie um cluster do Amazon EMR na sub-rede privada. Na seção Configuração de software, certifique-se de selecionar uma configuração que inclua Apache Spark, Apache Hadoop e Apache Livy.
- Quando você estiver esperando que o cluster alcance o estado WAITING, adicione o repositório baseado em Git.
- Para credenciais do Git, escolha Criar um novo segredo. Certifique-se de que o nome de usuário seja o alias da conta do Git.
- Crie um grupo de segurança personalizado chamado ElasticMapReduceEditors-Editor com as seguintes regras de saída:
Para a regra 1, defina Tipo como regra TCP personalizada, Protocolo como TCP, Intervalo de portas como 18888 e Destino como ElasticMapReduceEditors-Livy.
Para a regra 2, defina Tipo como HTTPS, Protocolo como TCP, Intervalo de portas como 443 e Destino como 0.0.0.0/0.
- Adicione uma regra de entrada ao grupo de segurança ElasticMapReduceEditors-Livy com as seguintes configurações:
Tipo: Regra TCP personalizada
Protocolo: TCP
Intervalo de portas: 18888
Destino: Insira o nome do seu grupo de segurança personalizado.
- Modifique a função de serviço dos Cadernos do Amazon EMR, EMR\ _Notebooks\ _DefaultRole para permitir a ação SecretsManager:getSecretValue.
- Crie um notebook Amazon EMR com as seguintes configurações de grupo de segurança:
Na seção Grupos de segurança, selecione Escolher grupos de segurança.
Para Grupos de segurança para instância principal, escolha ElasticMapReduceEditors-Livy.
Para Grupos de segurança para instância de notebook, escolha seu grupo de segurança personalizado.
- Confirme se o status do repositório baseado em Git muda para Vinculado. Quando o status muda para Vinculado, você pode usar repositórios Git no seu notebook.