Ir para o conteúdo

Como faço para melhorar os resultados da pesquisa e a precisão da recuperação nas bases de conhecimento da Amazon Bedrock?

3 minuto de leitura
0

Quero melhorar a precisão dos resultados da pesquisa em minhas bases de conhecimento da Amazon Bedrock.

Resolução

Use modelos básicos para analisar documentos

Quando os documentos são complexos, não estruturados ou contêm terminologia específica de um domínio, é uma prática recomendada usar modelos básicos para analisar documentos. Os modelos básicos melhoram a recuperação de dados complexos em documentos, como tabelas aninhadas, texto em imagens e representações gráficas de texto. Para personalizar a forma como o modelo básico analisa seus documentos, forneça instruções com base na estrutura, domínio ou caso de uso do documento.

Use estratégias avançadas de fragmentação

Use a fragmentação semântica ou a fragmentação hierárquica para melhorar o desempenho da Geração Aumentada via Recuperação (RAG).

Use a fragmentação semântica para documentos sem limites contextuais claros, como documentos legais ou manuais técnicos. A fragmentação semântica fornece extração e manipulação de informações mais precisas.

Observação: você incorre em custos adicionais ao usar a fragmentação semântica. O custo depende da quantidade de dados que você tem. Para obter informações sobre preços, consulte Preços do Amazon Bedrock.

Use a fragmentação hierárquica para documentos complexos com uma estrutura aninhada, como documentos técnicos ou trabalhos acadêmicos com formatação complexa e tabelas aninhadas. A fragmentação hierárquica permite que você recupere e navegue com eficácia em um documento grande. Use modelos básicos para analisar os dados primeiro e, em seguida, use a fragmentação hierárquica para melhorar a precisão das respostas geradas.

Para personalizar o processo de fragmentação para se alinhar aos requisitos da sua aplicação RAG, use uma função personalizada do AWS Lambda.

Filtre seus metadados

Use arquivos .csv para incluir metadados em uma fonte de dados. Para reduzir o número de arquivos necessários e melhorar seu gerenciamento de dados, use colunas para designar campos de conteúdo e campos de metadados. É uma prática recomendada usar esse atributo para grandes conjuntos de dados de arquivos .csv.

Adicione filtros aos campos ou atributos do documento para melhorar a relevância das respostas. Suas fontes de dados podem incluir atributos ou campos de metadados do documento para filtrar e especificar os campos a serem incorporados. Para obter mais informações, consulte As bases de conhecimento da Amazon Bedrock agora oferecem suporte à filtragem de metadados para melhorar a precisão da recuperação.

Personalize suas consultas

Modifique uma consulta complexa em subconsultas menores e mais gerenciáveis. Quando você usa a decomposição de consultas, o Amazon Bedrock executa várias consultas em sua base de conhecimento. Para modificar sua consulta, consulte a guia Modificações da consulta em Configurar e personalizar consultas e geração de respostas.

Por padrão, o Amazon Bedrock retorna até cinco resultados que correspondem a um fragmento de origem quando você consulta uma base de conhecimento. Para melhorar seus resultados de pesquisa, aumente o número de partes de origem que o Amazon Bedrock retorna. Para aumentar o número de blocos de origem, consulte a guia Número de blocos de origem em Configurar e personalizar consultas e geração de respostas.

Use a pesquisa híbrida

Para recursos de algoritmo de pesquisa múltipla, use a pesquisa híbrida. A pesquisa semântica fornece respostas com base no significado do texto. No entanto, ele não pode capturar todas as palavras-chave relevantes e depende da qualidade das palavras que você incorpora para representar o significado do texto. A pesquisa híbrida combina a pesquisa semântica com a pesquisa por palavra-chave para melhorar os resultados da pesquisa.

Use modelos reclassificadores

Use modelos de reclassificação para melhorar a relevância dos resultados que o Amazon Bedrock recupera.

AWS OFICIALAtualizada há um ano