Come posso risolvere il ritardo di replica o il backlog sul mio server di origine Windows per Application Migration Service?

10 minuti di lettura
0

Rilevo un ritardo o un backlog nel mio server di origine Windows durante la replica dei dati con AWS Application Migration Service.

Breve descrizione

Di seguito sono riportati i fattori che contribuiscono al ritardo e al backlog delle repliche durante la replica dei dati da un server di origine a un server di destinazione:

  • Velocità di uplink di rete e disponibilità della larghezza di banda: La velocità di connessione di rete tra il server di origine e il server di replica potrebbe avere un impatto significativo sulle prestazioni di replica. Le connessioni lente potrebbero impedire il completamento del processo di replica. Inoltre, la larghezza di banda limitata limita la quantità di dati che è possibile replicare in un dato momento.
  • Modifiche nel disco durante la replica: Durante il processo di replica, il server di origine potrebbe continuare a scrivere nuovi dati sui propri dischi. Se c'è un forte picco nella quantità di nuovi dati che il server di origine sta scrivendo, i dati si accumulano e creano un notevole arretrato. L'AWS Replication Agent deve inviare questo backlog con la sincronizzazione iniziale. Più grande è il backlog, più tempo è necessario per completare la replica dei dati.
  • **Velocità di I/O dei dischi ** di storage: Durante il processo di replica, AWS Replication Agent legge i blocchi di storage dei dischi e trasmette i dati al server di replica. Tuttavia, un'elevata latenza di lettura sui dischi del server di origine potrebbe influire sulla velocità e sull'efficienza della replica dei dati. I dischi lenti causano ritardi e i dischi veloci migliorano la velocità di replica.
  • Caricamento sul server di origine: La contesa delle risorse sul server di origine potrebbe comportare un elevato utilizzo della CPU, un consumo di memoria, un'attesa di I/O o altri vincoli di risorse. Ad esempio, un elevato utilizzo della CPU potrebbe causare problemi di replica. Questo perché il sistema fatica ad allocare le risorse della CPU tra AWS Replication Agent e altri processi. Analogamente, l'elevato consumo di memoria potrebbe indurre il sistema a cambiare le pagine di memoria su disco. Ciò comporta un aumento dell'attesa di I/O e un rallentamento del processo di replica.
  • Risorse di replica sottodimensionate: Lo staging dei volumi di Amazon Elastic Block Store (Amazon EBS) con velocità di trasmissione effettiva e IOPS inferiori potrebbe causare un'elevata latenza di lettura e scrittura e un'elevata lunghezza della coda. Tutti questi problemi influiscono sulle prestazioni di replica. Inoltre, un tipo di istanza del server di replica con bassa velocità di trasmissione effettiva di rete e larghezza di banda di Amazon EBS comporta problemi di prestazioni di replica.

Risoluzione

Per determinare il motivo del ritardo, esegui innanzitutto dei controlli sul server di origine. Quindi, esegui i controlli sull'area di allestimento.

Controlli del server di origine

Verifica che il server di origine sia avviato e funzionante

Assicurati che il server di origine per la migrazione sia avviato e funzionante.

Verifica che i processi di AWS Replication Agent siano in esecuzione

Esegui il seguente comando da PowerShell per elencare i servizi AWS Replication Agent in esecuzione:

get-service | where-object name -like “*AWSR*”

L'output seguente mostra i servizi predefiniti in esecuzione. Verifica che il servizio AWS ReplicationService principale sia in esecuzione:

PS C:\Users\Administrator> get-service | where-object name -like “*AWSR*”

Status   Name               DisplayName
------   ----               -----------
Running  AwsReplicationD... AwsReplicationDriverLogger
Running  AwsReplicationL... AwsReplicationLogger
Stopped  AwsReplicationP... AwsReplicationPostConvertService
Running  AwsReplicationS... AwsReplicationService
Running  AwsReplicationV... AwsReplicationVolumeUpdaterService

In alternativa, premi Windows + R, digita services.msc e premi Invio. Verifica che ** ** AWSReplicationService sia in esecuzione.

Verifica le connessioni TCP attive

Verificare che siano state stabilite cinque connessioni TCP attive con il server di replica sulla porta TCP 1500.

Esegui il seguente comando:

C:\Users\Administrator>netstat -an | find "1500"

Controlla l'output dei comandi per le connessioni attive:

TCP    172.31.82.135:50929    <Replicator Instance IP>:1500    ESTABLISHED
TCP    172.31.82.135:50930    <Replicator Instance IP>:1500    ESTABLISHED
TCP    172.31.82.135:50931    <Replicator Instance IP>:1500    ESTABLISHED
TCP    172.31.82.135:50933    <Replicator Instance IP>:1500    ESTABLISHED
TCP    172.31.82.135:50934    <Replicator Instance IP>:1500    ESTABLISHED

Usa Windows Resource Monitor per verificare le prestazioni sul server di origine

AWS Replication Agent opera su un core della CPU alla volta. Se l'utilizzo della CPU è elevato nel core su cui è in esecuzione AWS Replication Agent, la replica dei dati rallenta. Per verificare l'utilizzo della CPU, completa i seguenti passaggi:

  1. Utilizza uno dei seguenti metodi per avviare Windows Resource Monitor:
  • Nella scheda Prestazioni del Task Manager, scegli ** Apri Resource Monitor**.
  • Nel Pannello di controllo, scegli Strumenti di amministrazione, Resource Monitor.
  • Esegui resmon.exe dalla riga di comando o da PowerShell.
  • Scegli l'icona di Windows, quindi inserisci resmon.exe.
  1. Verifica l'utilizzo della CPU del core della CPU su cui è in esecuzione AWS Replication Agent.
  • Se l'utilizzo della CPU è elevato su quel core, verifica quale processo sta consumando la maggior parte della CPU.
  • L'agente utilizza almeno il 5% della CPU. Assicurati che sia disponibile una quantità di CPU sufficiente per consentire all'agente di eseguire la replica dei dati.
  1. Controlla le prestazioni del disco sul server di origine.

Controlla le metriche di scrittura (B/sec) e Tempo di risposta.

Puoi verificare queste metriche in Attività del disco. Se la velocità di trasmissione effettiva sul disco di origine è bassa, l'agente legge e replica meno dati. Nota qualsiasi aumento delle metriche di lettura e scrittura su disco.

Nota: La larghezza di banda richiesta per il trasferimento dei dati replicati tramite la porta TCP 1500 si basa sulla velocità di scrittura del server di origine partecipante. È consigliabile disporre di una larghezza di banda pari almeno alla somma della velocità media di scrittura di tutte le macchine sorgente replicate.

  1. Controllate il server di origine per un picco nelle operazioni di scrittura.

Per verificare le operazioni di scrittura in Attività del disco, cerca Scrittura (B/sec).

Man mano che il carico di lavoro cambia, controlla periodicamente le prestazioni del disco per determinare il carico di I/O. Se la velocità di scrittura (MB/s) supera la quantità di velocità di trasmissione effettiva di rete fornita, viene visualizzato un ritardo di replica.

Nota: Per calcolare la larghezza di banda richiesta dal server di origine al server di replica, vedere Calcolo della larghezza di banda richiesta per la porta TCP 1500.

Se il server di origine richiede una scrittura intensiva e la velocità di scrittura supera la velocità di replica, il backlog continua a crescere.

Verifica la velocità di replica e la larghezza di banda disponibile dal server di origine alla sottorete dell'area di staging

Per informazioni su come eseguire un test di velocità, vedi Come posso eseguire un test di connettività e larghezza di banda SSL?

Verifica la presenza di un server di origine che è stato spento in modo non corretto

Se un server di origine viene spento in modo incorretto, AWS Replication Agent esegue nuovamente la scansione di tutti i dischi dopo il riavvio del server. L'AWS Replication Agent rilegge i dischi e il ritardo aumenta continuamente fino al completamento della nuova scansione. Per ulteriori informazioni, vedi Quali sistemi operativi Windows e Linux supportano la scansione non ripetuta al riavvio?

Per verificare come è stato spento il computer di origine, completa i seguenti passaggi:

  1. Premi Windows + R, quindi digita **eventvwr.msc ** e premi Invio.

  2. Nel Visualizzatore eventi, fate doppio clic su Registri di ** Windows ** per espanderlo.

  3. Fai clic con il tasto destro su Sistema.

  4. Scegli ** Filtra registro corrente**.

  5. Scegli la freccia del menu a discesa accanto a Sorgenti eventi, quindi scegli USER32.

  6. Nel <All Event IDs> campo, digitare 1074, quindi scegliere OK. Viene visualizzato un elenco di eventi di spegnimento (spegnimento) e riavvio del tipo di Tipo di Spegnimento nel Visualizzatore Eventi.

  7. Per visualizzare le date e gli orari di tutti gli arresti imprevisti del computer, digitare ** 6008** nel **<All Event IDs>**campo, quindi scegliere OK.

Verifica che la porta TCP 1500 non sia bloccata in uscita

  1. Assicurati che la porta TCP 1500 non sia bloccata in uscita dal server di origine al server di replica.

  2. È possibile eseguire un Telnet o TNC sull'indirizzo IP dell'istanza del replicatore, come illustrato negli esempi seguenti:

  • Da CMD: telnet <replication subnet IP address> 1500
  • Da PowerShell: TNC <replication subnet IP address> -porta 1500
  1. Assicurati che il firewall locale consenta la connettività dal server di origine al server di replica tramite la porta TCP 443. Per attivare la connettività sul firewall del sistema operativo, completa le seguenti azioni:
  • Sul server di origine, apri la console Windows Firewall.
  • Sulla console, scegli l'opzione Outbound Rules dall'albero.
  • Nella tabella Outbound Rules, selezionare la regola relativa alla connessione Porta remota - 1500. Verifica che lo stato Abilitato sia impostato su .
  • Se lo stato **Abilitato ** della regola è No, fai clic con il pulsante destro del mouse e seleziona Abilita regola.
  1. Per consentire il traffico sulla porta TCP 1500, assicurati che il firewall aziendale consenta questa connettività.

Nota: Puoi anche eseguire il test di velocità SSL o il test iperf. Per ulteriori informazioni, vedi Come posso eseguire un test di connettività e larghezza di banda SSL?

Verifica che la limitazione della larghezza di banda sia disattivata nelle impostazioni di replica sul server di origine

Disattiva la limitazione della larghezza di banda nelle impostazioni di replica del server di origine. La disattivazione della limitazione della larghezza di banda consente di mantenere una larghezza di banda sufficiente per il trasferimento dei dati dal server di origine alla sottorete dell'area di staging.

L'attivazione della limitazione della larghezza di banda nel server di origine comporta un ritardo di crescita costante o stagnante. Questo perché la limitazione limita la replica dei dati dal server di origine al server di replica.

Per verificare la limitazione della larghezza di banda, completa i seguenti passaggi:

  1. Aprire la console Application Migration Service.

  2. Scegli Impostazioni, quindi seleziona il modello di replica in Routing e limitazione dei dati.

  3. Se la larghezza di banda di rete Throttle è attivata, controlla il valore e confrontalo con la velocità di replica elencata. Per ulteriori informazioni, vedere la sezione precedente Verifica della velocità di replica e della larghezza di banda disponibile dal server di origine alla sottorete dell'area di staging.

Controlli delle risorse dell'area di staging

Verifica che la porta TCP 1500 non sia bloccata in ingresso

Assicurati che la porta TCP 1500 non sia bloccata in ingresso nei gruppi di sicurezza del server di replica.

Nota: Devi completare i seguenti passaggi nella console Amazon Elastic Compute Cloud (Amazon EC2).

  1. Apri la console Amazon EC2.

  2. Seleziona il gruppo di sicurezza collegato all'istanza del replicatore.

  3. Verifica che la porta TCP 1500 in entrata sia consentita nel gruppo di sicurezza collegato.

Controlla la quota delle istantanee nella regione di destinazione

Assicurati che il tuo account AWS non abbia raggiunto i limiti di quota delle istantanee nella regione in cui stai replicando i server di origine. Esegui il seguente comando AWS Command Line Interface (AWS CLI) per verificare se hai raggiunto la quota di snapshot nella regione. Nell'esempio seguente, sostituisci la regione con la tua regione di destinazione.

Nota: Se ricevi errori durante l'esecuzione dei comandi dell'interfaccia a riga di comando di AWS, assicurati di utilizzare la versione più recente di AWS CLI.

# aws service-quotas get-service-quota --service-code ebs --quota-code L-309BACF6 --region region --query "Quota.Value"  
# aws ec2 describe-snapshots --owner-ids self --region region --query "length(Snapshots)"

Informazioni correlate

Identificazione dei problemi di replica quando si utilizza AWS Application Migration Service

AWS UFFICIALE
AWS UFFICIALEAggiornata un anno fa