쿠키 기본 설정 선택

당사는 사이트와 서비스를 제공하는 데 필요한 필수 쿠키 및 유사한 도구를 사용합니다. 고객이 사이트를 어떻게 사용하는지 파악하고 개선할 수 있도록 성능 쿠키를 사용해 익명의 통계를 수집합니다. 필수 쿠키는 비활성화할 수 없지만 '사용자 지정' 또는 ‘거부’를 클릭하여 성능 쿠키를 거부할 수 있습니다.

사용자가 동의하는 경우 AWS와 승인된 제3자도 쿠키를 사용하여 유용한 사이트 기능을 제공하고, 사용자의 기본 설정을 기억하고, 관련 광고를 비롯한 관련 콘텐츠를 표시합니다. 필수가 아닌 모든 쿠키를 수락하거나 거부하려면 ‘수락’ 또는 ‘거부’를 클릭하세요. 더 자세한 내용을 선택하려면 ‘사용자 정의’를 클릭하세요.

인덱스에 사용자 지정 동의어 추가

포커스 모드
인덱스에 사용자 지정 동의어 추가 - Amazon Kendra

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

인덱스에 사용자 지정 동의어를 추가하려면 동의어를 사전 파일에 지정합니다. 동의어를 Amazon Kendra 사용하여에 비즈니스별 또는 특수 용어를 포함할 수 있습니다. 와 같은 일반 영어 동의어leader, head는에 내장되어 Amazon Kendra 있으므로 하이픈을 사용하는 일반 동의어를 포함하여 사전 파일에 포함해서는 안 됩니다. Amazon Kendra 는 응답 유형 및QUESTION_ANSWER/또는 ANSWER 응답 유형을 포함하는 모든 DOCUMENT 응답 유형에 대한 동의어를 지원합니다. Amazon Kendra 현재는 중지어로 플래그가 지정된 동의어 추가를 지원하지 않습니다. 향후 릴리스에 포함될 예정입니다.

Amazon Kendra 는 동의어 간 상관관계를 생성합니다. 예를 들어, 동의어 페어를 사용하면 Dynamo가와 Dynamo, Amazon DynamoDB Amazon Kendra 상호 연관됩니다 Amazon DynamoDB. “dynamo란 무엇인가?”라는 쿼리 그런 다음는 "What is Amazon DynamoDB?"와 같은 문서를 반환합니다. 동의어를 사용하면 상관관계를 더 쉽게 선택할 Amazon Kendra 수 있습니다.

사전 파일은 Amazon S3 버킷에 저장된 텍스트 파일입니다. 인덱스에 사전 추가을 참조하세요.

사전 파일은 Solr 동의어 형식을 사용합니다. Amazon Kendra 에는 인덱스당 사전 수에 대한 제한이 있습니다. 할당량을 참조하세요.

다음과 같은 상황에서 동의어가 유용할 수 있습니다.

  • NLP, Natural Language Processing 같이 전통적인 영어 동의어가 아닌 특수 용어.

  • 복잡한 의미적 연관성을 지닌 고유 명사. 이러한 명사는 일반 대중이 이해하기 어려운 명사입니다. 예를 들어 기계 학습에서는 이러한 명사들을 이해할 수 없습니다. cost, loss, model performance

  • 다양한 형태의 제품 이름, 예: Elastic Compute Cloud, EC2.

  • 도메인별 또는 비즈니스별 용어, 예: 제품 이름. 예: Route53, DNS.

다음과 같은 시나리오에서는 동의어를 사용하지 마세요.

  • 일반적인 영어 동의어, 예: leader, head. 이러한 동의어는 특정 도메인에만 국한되지 않으므로 이러한 시나리오에서 동의어를 사용하면 의도하지 않은 결과가 발생할 수 있습니다.

  • 다음과 같은 서체 오류, teh => the.

  • 명사의 복수형과 소유격, 형용사의 비교형과 최상위형, 동사의 과거형, 과거분사, 진행형 동사와 같은 형태학적 변형. 비교 형용사와 최상위 형용사의 한 예는 다음과 같습니다. good, better, best.

  • 유니그램(한 단어)은 WHO 같은 단어를 뜻합니다. 유니그램 불용어는 사전에서 허용되지 않으며 검색에서 제외됩니다. 예를 들어, WHO => World Health Organization은 거부됩니다. 그러나 W.H.O.는 동의어 용어로 사용할 수 있으며, 불용어는 여러 단어로 된 동의어의 일부로 사용할 수 있습니다. 예를 들어, of는 허용되지 않지만 United States of America는 허용됩니다.

사용자 지정 동의어를 사용하면 비즈니스별 동의어를 포함하도록 쿼리를 확장하여 비즈니스별 용어에 Amazon Kendra대한 이해를 쉽게 개선할 수 있습니다. 동의어를 사용하면 검색 정확도가 향상될 수 있지만 이에 맞게 최적화하려면 동의어가 대기 시간에 어떤 영향을 미치는지 이해하는 것이 중요합니다.

동의어에 대한 일반적인 규칙은 쿼리에서 동의어와 일치하고 확장되는 용어가 많을수록 지연 시간에 미치는 영향이 커진다는 것입니다. 지연 시간에 영향을 미치는 다른 요인으로는 인덱싱된 문서의 평균 크기, 인덱스의 크기, 검색 결과에 대한 필터링, Amazon Kendra 인덱스에 대한 전체 로드 등이 있습니다. 어떤 동의어와도 일치하지 않는 쿼리는 영향을 받지 않습니다.

동의어가 지연 시간에 미치는 영향에 대한 일반 지침:

사용 사례 지연 시간 증가*
각각 3~5단어의 일반적인 자연어 또는 키워드 쿼리 15% 미만
쿼리 용어 1개가 동의어 3개로 확장
약 500,000 건의 문서(문서당 평균 10.48KB의 텍스트 추출) 또는 30,000개의 FAQ/질문 쌍으로 구성된 인덱스

*성능은 인덱스의 특정 동의어 사용 및 구성에 따라 달라집니다. 특정 사용 사례에 맞는 더 정확한 벤치마크를 얻으려면 검색 성능을 테스트하는 것이 가장 좋습니다.

사전이 크고 용어 확장률이 높으며 지연 시간 증가가 허용 범위 내에 있지 않은 경우 다음 중 하나 또는 두 가지를 모두 시도해 볼 수 있습니다.

  • 사전을 다듬어 확장률(용어당 동의어 수)을 줄이세요.

  • 용어의 전체 적용 범위(사전의 줄 수)를 줄이세요.

또는 프로비저닝 용량(가상 스토리지 단위)을 늘려 지연 시간 증가를 상쇄할 수 있습니다.

프라이버시사이트 이용 약관쿠키 기본 설정
© 2025, Amazon Web Services, Inc. 또는 계열사. All rights reserved.