Como faço para vincular meu Caderno Amazon EMR a um repositório baseado em Git?

2 minuto de leitura
0

Quero vincular meu Caderno Amazon EMR a um repositório baseado em Git.

Resolução

**Observação:**Os Cadernos do Amazon EMR estão disponíveis como Amazon EMR Studio Workspaces no novo console do Amazon EMR.

Para criar um novo notebook Amazon EMR no console antigo e associar o notebook a um repositório baseado em Git, conclua as seguintes etapas:

  1. Crie uma sub-rede privada em uma Amazon Virtual Private Cloud (Amazon VPC).
  2. Crie um gateway NAT e atualize sua tabela de rotas para apontar para o gateway NAT.
  3. Inicie um cluster do Amazon EMR na sub-rede privada. Na seção Configuração de software, certifique-se de selecionar uma configuração que inclua Apache Spark, Apache Hadoop e Apache Livy.
  4. Quando você estiver esperando que o cluster alcance o estado WAITING, adicione o repositório baseado em Git.
  5. Para credenciais do Git, escolha Criar um novo segredo. Certifique-se de que o nome de usuário seja o alias da conta do Git.
  6. Crie um grupo de segurança personalizado chamado ElasticMapReduceEditors-Editor com as seguintes regras de saída:
    Para a regra 1, defina Tipo como regra TCP personalizada, Protocolo como TCP, Intervalo de portas como 18888 e Destino como ElasticMapReduceEditors-Livy.
    Para a regra 2, defina Tipo como HTTPS, Protocolo como TCP, Intervalo de portas como 443 e Destino como 0.0.0.0/0.
  7. Adicione uma regra de entrada ao grupo de segurança ElasticMapReduceEditors-Livy com as seguintes configurações:
    Tipo: Regra TCP personalizada
    Protocolo: TCP
    Intervalo de portas: 18888
    Destino: Insira o nome do seu grupo de segurança personalizado.
  8. Modifique a função de serviço dos Cadernos do Amazon EMR, EMR\ _Notebooks\ _DefaultRole para permitir a ação SecretsManager:getSecretValue.
  9. Crie um notebook Amazon EMR com as seguintes configurações de grupo de segurança:
    Na seção Grupos de segurança, selecione Escolher grupos de segurança.
    Para Grupos de segurança para instância principal, escolha ElasticMapReduceEditors-Livy.
    Para Grupos de segurança para instância de notebook, escolha seu grupo de segurança personalizado.
  10. Confirme se o status do repositório baseado em Git muda para Vinculado. Quando o status muda para Vinculado, você pode usar repositórios Git no seu notebook.
AWS OFICIAL
AWS OFICIALAtualizada há 6 meses