내용으로 건너뛰기

Amazon Bedrock 지식 베이스에서 검색 결과 및 검색 정확도를 개선하려면 어떻게 해야 합니까?

3분 분량
0

Amazon Bedrock 지식 베이스에서 검색 결과 정확도를 개선하고 싶습니다.

해결 방법

파운데이션 모델을 사용하여 문서 구문 분석

문서가 복잡하거나 구조화되지 않았거나 도메인별 용어를 포함한 경우 파운데이션 모델을 사용하여 문서를 구문 분석하는 것이 가장 좋습니다. 파운데이션 모델은 중첩된 테이블, 이미지 내 텍스트, 텍스트의 그래픽 표현 등 문서 내의 복잡한 데이터를 검색하는 기능을 향상합니다. 파운데이션 모델에서 문서를 구문 분석하는 방법을 사용자 지정하려면 문서 구조, 도메인 또는 사용 사례에 따라 지침을 제공하십시오.

고급 청킹 전략 사용

시맨틱 청킹 또는 계층적 청크를 사용하여 검색 증강 생성(RAG) 성능을 향상합니다.

법률 문서나 기술 매뉴얼과 같이 명확한 컨텍스트 경계가 없는 문서에는 시맨틱 청크를 사용하십시오. 시맨틱 청킹은 보다 정확한 정보 추출 및 조작을 제공합니다.

참고: 시맨틱 청킹을 사용할 경우 추가 비용이 발생합니다. 비용은 보유한 데이터의 양에 따라 달라집니다. 요금에 대한 자세한 내용은 Amazon Bedrock 요금을 참조하십시오.

기술 문서나 복잡한 서식과 중첩된 테이블이 있는 학술 논문과 같이 중첩 구조를 갖춘 복잡한 문서에는 계층적 청크를 사용하십시오. 계층적 청크를 통해 대용량 문서를 효과적으로 검색하고 탐색할 수 있습니다. 먼저 파운데이션 모델을 사용하여 데이터를 구문 분석한 다음, 계층적 청킹을 사용하여 생성된 응답의 정확도를 개선합니다.

청크 프로세스를 RAG 애플리케이션 요구 사항에 맞게 사용자 지정하려면 사용자 지정 AWS Lambda 함수를 사용하십시오.

메타데이터 필터링

.csv 파일을 사용하면 데이터 소스에 메타데이터를 포함할 수 있습니다. 필요한 파일 수를 줄이고 데이터 관리를 개선하려면 열을 사용하여 콘텐츠 필드와 메타데이터 필드를 지정합니다. 대용량 .csv 파일 데이터 세트에는 이 기능을 사용하는 것이 가장 좋습니다.

문서 필드 또는 속성에 필터를 추가하여 응답의 관련성을 개선합니다. 데이터 소스에는 포함할 필드를 필터링하고 지정하기 위해 문서 메타데이터 속성 또는 필드가 포함될 수 있습니다. 자세한 내용은 Amazon Bedrock 지식 베이스는 이제 검색 정확도 개선을 위한 메타데이터 필터링을 지원합니다를 참조하십시오.

쿼리 사용자 지정

복잡한 쿼리를 더 작고 관리하기 쉬운 하위 쿼리로 수정합니다. 쿼리 분해를 사용하는 경우 Amazon Bedrock이 지식 베이스에서 여러 쿼리를 실행합니다. 쿼리를 수정하려면 쿼리 및 응답 생성 구성 및 사용자 지정쿼리 수정 탭을 참조하십시오.

기본적으로 Amazon Bedrock은 지식 베이스를 쿼리할 때 소스 청크에 해당하는 최대 5개의 결과를 반환합니다. 검색 결과를 개선하려면 Amazon Bedrock이 반환하는 소스 청크 수를 늘리십시오. 소스 청크 수를 늘리려면 쿼리 및 응답 생성 구성 및 사용자 지정소스 청크 수 탭을 참조하십시오.

하이브리드 검색 사용

다중 검색 알고리즘 기능의 경우 하이브리드 검색을 사용하십시오. 시맨틱 검색은 텍스트의 의미를 기반으로 답변을 제공합니다. 그러나 모든 관련 키워드를 캡처할 수는 없으며, 텍스트 의미를 나타내기 위해 삽입한 단어의 품질에 의존합니다. 하이브리드 검색은 시맨틱 검색과 키워드 검색을 결합하여 검색 결과를 개선합니다.

리랭커 모델 사용

리랭커 모델을 사용하여 Amazon Bedrock에서 검색하는 결과의 관련성을 개선하십시오.

AWS 공식업데이트됨 일 년 전