Salta al contenuto

Come posso visualizzare l'elenco degli URL che il Web Crawler fornito da Amazon Bedrock aggiunge all'origine dati?

2 minuti di lettura
0

Desidero visualizzare l'elenco degli URL che il Web Crawler aggiunge all'origine dati nella mia knowledge base Amazon Bedrock.

Breve descrizione

Per visualizzare gli URL che il Web Crawler aggiunge all'origine dati, devi aggiungere un'opzione di distribuzione dei log alla knowledge base per registrare i log dei processi di importazione. I log di importazione registrano gli URL che il Web Crawler aggiunge all'origine dati. Dopo aver completato un processo di importazione, utilizza Amazon CloudWatch Logs Insights per analizzare i dati di log.

Risoluzione

Completa i seguenti passaggi:

  1. Aggiorna la knowledge base per aggiungere CloudWatch Logs come opzione di distribuzione.
  2. Sincronizza l'origine dati del Web Crawler.
  3. Nella sezione Cronologia di sincronizzazione, seleziona l'origine dati di destinazione, quindi annota l'ID del processo di importazione.
  4. Apri la console CloudWatch, quindi seleziona un gruppo di log.
  5. Imposta l'intervallo di tempo dell'esecuzione del processo di sincronizzazione.
  6. Scegli Visualizza in Logs Insights, quindi inserisci la seguente query:
    fields event.document_location.web_location.url | filter @message like 'IngestionJobId' and event.status like 'INDEXED'
    Nota: sostituisci IngestionJobId con l'ID del tuo processo di importazione.
  7. Scegli Esegui query per visualizzare l'elenco degli URL.