SharePoint 커넥터 V1.0 - Amazon Kendra

기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

SharePoint 커넥터 V1.0

SharePoint는 웹 콘텐츠를 사용자 지정하고 페이지, 사이트, 문서 라이브러리 및 목록을 만드는 데 사용할 수 있는 공동 웹 사이트 구축 서비스입니다. SharePoint 사용자인 경우 Amazon Kendra 를 사용하여 SharePoint 데이터 소스를 인덱싱할 수 있습니다.

참고

SharePoint 커넥터 V1.0 / SharePointConfiguration API는 2023년에 종료되었습니다. SharePoint 커넥터 V2.0 / TemplateConfiguration API로 마이그레이션하거나 이를 사용하는 것이 좋습니다.

Amazon Kendra SharePoint 데이터 소스 커넥터 문제 해결은 섹션을 참조하세요데이터 소스 문제 해결.

지원 기능

  • 필드 매핑

  • 사용자 액세스 제어

  • 포함/제외 필터

  • 변경 로그

  • Virtual Private Cloud(VPC)

사전 조건

Amazon Kendra 를 사용하여 SharePoint 데이터 소스를 인덱싱하려면 먼저 SharePoint 및 AWS 계정에서 이러한 변경 사항을 적용합니다.

AWS Secrets Manager 보안 암호에 안전하게 저장하는 인증 자격 증명을 제공해야 합니다.

참고

보안 인증 정보와 보안 암호를 정기적으로 새로 고치거나 교체하는 것이 좋습니다. 보안을 위해 필요한 액세스 수준만 제공하세요. 데이터 소스, 커넥터 버전 1.0 및 2.0(해당하는 경우) 간에 보안 인증 정보와 보안 암호를 재사용하지 않는 것이 좋습니다.

SharePoint에서 다음을 확인하세요.

  • 인덱싱하려는 SharePoint 사이트의 URL을 확인합니다.

  • SharePoint Online의 경우:

    • 사이트 관리 권한이 있는 사용자 이름과 암호가 포함된 기본 보안 인증 정보를 기록해 두었습니다.

    • 선택 사항: 사용자 이름, 암호, 클라이언트 ID 및 클라이언트 보안 암호를 포함한 OAuth 2.0 보안 인증을 생성했습니다.

    • 관리자 사용자를 사용하여 Azure 포털에서 보안 기본값을 비활성화했습니다. Azure Portal에서 보안 기본 설정을 관리하는 방법에 대한 자세한 내용은 보안 기본값을 활성화/비활성화하는 방법에 대한 Microsoft 설명서를 참조하세요.

  • SharePoint Server의 경우:

    • SharePoint Server 도메인 이름(Active Directory의 NetBIOS 이름)을 기록해 두었습니다. 이 정보를 SharePoint 기본 인증 사용자 이름 및 암호와 함께 사용하여 SharePoint Server를 Amazon Kendra에 연결할 수 있습니다.

    참고

    SharePoint Server를 사용하고 사용자 컨텍스트에 따른 필터링을 위해 액세스 제어 목록(ACL)을 이메일 형식으로 변환해야 하는 경우 LDAP 서버 URL 및 LDAP 검색 기반을 제공하세요. 또는 디렉터리 도메인 재정의를 사용할 수도 있습니다. LDAP 서버 URL은 전체 도메인 이름과 포트 번호입니다(예: ldap: //example.com:389). LDAP 검색 기반은 도메인 컨트롤러 'example'과 'com'입니다. 디렉터리 도메인 재정의를 사용하면 LDAP 서버 URL 및 LDAP 검색 기반을 사용하는 대신 이메일 도메인을 사용할 수 있습니다. 예를 들어 username@example.com의 이메일 도메인은 'example.com'입니다. 도메인 확인이 염려되지 않고 단순히 이메일 도메인만 사용하려는 경우 이 재정의를 사용할 수 있습니다.

  • SharePoint 계정에 다음과 같은 권한을 추가했습니다.

    SharePoint 목록의 경우

    • 항목 열기 - 서버측 파일 처리기를 사용하여 문서 소스를 확인합니다.

    • 애플리케이션 페이지 보기 - 양식, 보기 및 애플리케이션 페이지를 볼 수 있습니다. 목록을 열거합니다.

    • 항목 보기 - 목록의 항목과 문서 라이브러리의 문서를 볼 수 있습니다.

    • 버전 보기 - 목록 항목 또는 문서의 이전 버전을 볼 수 있습니다.

    SharePoint 웹 사이트의 경우

    • 디렉터리 찾아보기 - SharePoint Designer 및 Web DAV 인터페이스를 사용하여 웹 사이트의 파일 및 폴더를 열거합니다.

    • 사용자 정보 찾아보기 - 웹 사이트 사용자에 대한 정보를 볼 수 있습니다.

    • 권한 열거 - 웹 사이트, 목록, 폴더, 문서 또는 목록 항목에 대한 권한을 열거합니다.

    • 열기 - 웹 사이트, 목록 또는 폴더를 열어 컨테이너 내의 항목에 접근합니다.

    • 클라이언트 통합 기능 사용 - SOAP, WebDAV, 클라이언트 객체 모델 또는 SharePoint Designer 인터페이스를 사용하여 웹 사이트에 액세스합니다.

    • 원격 인터페이스 사용 - 클라이언트 애플리케이션을 시작하는 기능을 사용합니다.

    • 페이지 보기 - 웹 사이트에서 페이지를 봅니다.

  • SharePoint 및 동일한 인덱스에 사용할 다른 여러 데이터 소스에서 각 문서가 고유한지 확인했습니다. 인덱스에 사용하려는 각 데이터 소스에는 데이터 소스 전체에서 동일한 문서가 포함되어서는 안 됩니다. 문서 ID는 인덱스 전체에 적용되며 인덱스별로 고유해야 합니다.

에서 다음 사항을 확인해야 AWS 계정합니다.

  • Amazon Kendra 인덱스를 생성하고 API를 사용하는 경우 인덱스 ID를 기록했습니다.

  • 데이터 소스에 대한 IAM 역할을 생성하고 API를 사용하는 경우 IAM 역할의 ARN을 기록했습니다.

    참고

    인증 유형과 자격 증명을 변경하는 경우 올바른 AWS Secrets Manager 보안 암호 ID에 액세스하도록 IAM 역할을 업데이트해야 합니다.

  • SharePoint 보안 인증 정보를 AWS Secrets Manager 보안 암호에 저장했고 API를 사용하는 경우 보안 암호의 ARN을 기록했습니다.

    참고

    보안 인증 정보와 보안 암호를 정기적으로 새로 고치거나 교체하는 것이 좋습니다. 보안을 위해 필요한 액세스 수준만 제공하세요. 데이터 소스, 커넥터 버전 1.0 및 2.0(해당하는 경우) 간에 보안 인증 정보와 보안 암호를 재사용하지 않는 것이 좋습니다.

기존 IAM 역할이나 보안 암호가 없는 경우 SharePoint 데이터 소스를 연결할 때 콘솔을 사용하여 새 IAM 역할 및 Secrets Manager 보안 암호를 생성할 수 있습니다 Amazon Kendra. API를 사용하는 경우 기존 IAM 역할 및 Secrets Manager 보안 암호의 ARN과 인덱스 ID를 제공해야 합니다.

연결 지침

SharePoint 데이터 소스 Amazon Kendra 에 연결하려면가 Amazon Kendra 데이터에 액세스할 수 있도록 SharePoint 자격 증명의 세부 정보를 제공해야 합니다. 용 SharePoint를 아직 구성하지 않은 경우 섹션을 Amazon Kendra 참조하세요사전 조건.

Console

SharePoint Amazon Kendra 에 연결하려면

  1. AWS Management Console에 로그인하고 Amazon Kendra 콘솔을 엽니다.

  2. 왼쪽 탐색 창에서 인덱스를 선택한 다음 인덱스 목록에서 사용할 인덱스를 선택합니다.

    참고

    인덱스 설정에서 사용자 액세스 제어 설정을 구성하거나 편집할 수 있습니다.

  3. 시작하기 페이지에서 데이터 소스 추가를 선택합니다.

  4. 데이터 소스 추가 페이지에서 SharePoint 커넥터 v1.0을 선택한 다음 데이터 소스 추가를 선택합니다.

  5. 데이터 소스 세부 정보 지정 페이지에서 다음 정보를 입력합니다.

    1. 이름 및 설명에서 데이터 소스 이름에 데이터 소스의 이름을 입력합니다. 하이픈은 포함할 수 있지만 공백은 포함할 수 없습니다.

    2. (선택 사항) 설명 - 데이터 소스에 대한 선택적 설명을 입력합니다.

    3. 기본 언어 - 문서를 인덱스로 필터링할 언어를 선택합니다. 달리 지정하지 않는 한, 언어는 영어로 기본 설정됩니다. 문서 메타데이터에 지정된 언어가 선택한 언어보다 우선합니다.

    4. 태그에서 새 태그 추가 - 리소스를 검색 및 필터링하거나 AWS 비용을 추적하는 선택적 태그를 포함합니다.

    5. Next(다음)를 선택합니다.

  6. 액세스 및 보안 정의 페이지에서 다음 정보를 입력합니다.

    1. 호스팅 방법의 경우 - SharePoint OnlineSharePoint Server 중에서 선택합니다.

      1. SharePoint Online의 경우 - SharePoint 리포지토리와 관련된 사이트 URL을 입력합니다.

      2. SharePoint Server - SharePoint 버전을 선택하려면 SharePoint 리포지토리와 관련된 사이트 URLs을 입력하고 SSL 인증서 위치의 Amazon S3 경로를 입력합니다.

    2. (SharePoint Server만 해당) 웹 프록시의 경우 - 내부 SharePoint 인스턴스의 호스트 이름포트 번호를 입력합니다. 포트 번호는 0에서 65535 사이의 숫자 값이어야 합니다.

    3. 인증의 경우 - 사용 사례에 따라 다음 옵션 중에서 선택하세요.

      1. SharePoint Online의 경우 - 기본 인증OAuth 2.0 인증 중에서 선택합니다.

      2. SharePoint Server의 경우 - 없음, LDAP수동 중에서 선택합니다.

    4. AWS Secrets Manager 보안 암호의 경우 - 기존 보안 암호를 선택하거나 새 Secrets Manager 보안 암호를 생성하여 SharePoint 인증 자격 증명을 저장합니다. 새 암호를 만들기로 선택하면 AWS Secrets Manager 보안 암호 창이 열립니다. 보안 암호 이름을 입력해야 합니다. 'AmazonKendra-SharePoint-'라는 접두사가 보안 암호 이름에 자동으로 추가됩니다.

    5. AWS Secrets Manager 보안 암호 생성 창에 다음 기타 정보를 입력합니다.

      1. 사용 사례에 따라 다음 SharePoint Cloud 인증 옵션 중에서 선택합니다.

        1. 기본 인증 - SharePoint 계정 사용자 이름을 사용자 이름으로 입력하고 SharePoint 계정 암호를 암호로 입력합니다.

        2. OAuth 2.0 인증 - SharePoint 계정 사용자 이름을 사용자 이름으로, SharePoint 계정 암호를 암호로, 자동 생성된 고유한 SharePoint ID를 클라이언트 ID로, SharePoint와 Amazon Kendra 에서 모두 사용하는 공유 보안 암호 문자열을 클라이언트 보안 암호로 입력합니다.

      2. 사용 사례에 따라 다음 SharePoint Server 인증 옵션 중에서 선택합니다.

        1. 없음 - SharePoint 계정 사용자 이름을 사용자 이름으로, SharePoint 계정 암호를 암호로, 그리고 서버 도메인 이름을 입력합니다.

        2. LDAP - SharePoint 계정 사용자 이름을 사용자 이름으로, SharePoint 계정 암호를 암호로, LDAP 서버 엔드포인트(프로토콜 및 포트 번호 포함, 예:ldap://example.com:389), 그리고 LDAP 검색 기준(예: dc=example, dc=com)을 입력합니다.

        3. 수동 - SharePoint 계정 사용자 이름을 사용자 이름으로, SharePoint 계정 암호를 암호로, 그리고 이메일 도메인 재정의(디렉터리 사용자 또는 그룹의 이메일 도메인)를 입력합니다.

      3. 저장(Save)을 선택합니다.

    6. Virtual Private Cloud(VPC) - 서브넷VPC 보안 그룹도 추가해야 합니다.

      참고

      SharePoint Server를 사용하는 경우 VPC를 사용해야 합니다. 다른 SharePoint 버전에서는 Amazon VPC 가 선택 사항입니다.

    7. IAM 역할 - 기존 IAM 역할을 선택하거나 새 IAM 역할을 생성하여 리포지토리 자격 증명 및 인덱스 콘텐츠에 액세스합니다.

      참고

      IAM 인덱스에 사용되는 역할은 데이터 소스에 사용할 수 없습니다. 기존 역할을 인덱스나 FAQ에 사용하는지 확실하지 않은 경우 새 역할 생성을 선택하여 오류를 방지하세요.

    8. Next(다음)를 선택합니다.

  7. 동기화 설정 구성 페이지에 다음 정보를 입력합니다.

    1. 변경 로그 사용 - 모든 파일을 동기화하는 대신 인덱스를 업데이트하려면 선택합니다.

    2. 첨부 파일 크롤링 - 첨부 파일을 크롤링하려면 선택합니다.

    3. 로컬 그룹 매핑 사용 - 문서가 제대로 필터링되었는지 확인하려면 선택합니다.

    4. 추가 구성 - 정규 표현식 패턴을 추가하여 특정 파일을 포함하거나 제외합니다. 최대 100개의 패턴을 추가할 수 있습니다.

    5. 동기화 실행 일정빈도 - Amazon Kendra 가 데이터 소스와 동기화할 빈도를 선택합니다.

    6. Next(다음)를 선택합니다.

  8. 필드 매핑 설정 페이지에 다음 정보를 입력합니다.

    1. Amazon Kendra 기본 필드 매핑 - 인덱스에 매핑하려는 Amazon Kendra 생성된 기본 데이터 소스 필드 중에서 선택합니다.

    2. 사용자 지정 필드 매핑 - 사용자 지정 데이터 소스 필드를 추가하여 매핑할 인덱스 필드 이름과 필드 데이터 유형을 만듭니다.

    3. Next(다음)를 선택합니다.

  9. 검토 및 생성 페이지에서 입력한 정보가 정확한지 확인한 다음 데이터 소스 추가를 선택합니다. 이 페이지에서 정보를 편집하도록 선택할 수도 있습니다. 데이터 소스가 성공적으로 추가된 후 데이터 소스 페이지에 데이터 소스가 표시됩니다.

API

SharePoint Amazon Kendra 에 연결하려면

SharePointConfiguration API를 사용하여 다음을 지정해야 합니다.

  • SharePoint 버전 - SharePoint를 구성할 때 사용하는 SharePoint 버전을 지정합니다. SharePoint Server 2013, SharePoint Server 2016, SharePoint Server 2019 또는 SharePoint Online 중에서 무엇을 사용하든 상관 없습니다.

  • 보안 암호 Amazon 리소스 이름(ARN) - SharePoint 계정에서 생성한 인증 자격 증명이 포함된 Secrets Manager 보안 암호의 Amazon 리소스 이름(ARN)을 제공합니다. 보안 암호는 JSON 구조에 저장됩니다.

    SharePoint Online 기본 인증의 경우 보안 암호에 포함되어야 하는 최소 JSON 구조는 다음과 같습니다.

    { "userName": "user name", "password": "password" }

    SharePoint Online OAuth 2.0 인증의 경우 보안 암호에 포함되어야 하는 최소 JSON 구조는 다음과 같습니다.

    { "userName": "SharePoint account user name"", "password": "SharePoint account password", "clientId": "SharePoint auto-generated unique client id", "clientSecret": "secret string shared by Amazon Kendra and SharePoint to authorize communications" }

    SharePoint Server 기본 인증의 경우 보안 암호에 포함되어야 하는 최소 JSON 구조는 다음과 같습니다.

    { "userName": "user name", "password": "password", "domain": "server domain name" }

    SharePoint Server LDAP 인증의 경우 (사용자 컨텍스트에 따른 필터링을 위해 액세스 제어 목록(ACL)을 이메일 형식으로 변환해야 하는 경우 보안 암호에 LDAP 서버 URL 및 LDAP 검색 기반을 포함할 수 있음) 보안 암호에 포함해야 하는 최소 JSON 구조는 다음과 같습니다.

    { "userName": "user name", "password": "password", "domain": "server domain name" "ldapServerUrl": "ldap://example.com:389", "ldapSearchBase": "dc=example,dc=com" }

    SharePoint Server 수동 인증의 경우 보안 암호에 포함되어야 하는 최소 JSON 구조는 다음과 같습니다.

    { "userName": "user name", "password": "password", "domain": "server domain name", "emailDomainOverride": "example.com" }
  • IAM 역할 -를 호출CreateDataSource하여 Secrets Manager 보안 암호에 액세스할 수 있는 권한을 IAM 역할에 제공하고 SharePoint 커넥터 및에 필요한 퍼블릭 APIs를 호출할 RoleArn 때 지정합니다 Amazon Kendra. 자세한 내용은 SharePoint 데이터 소스에 대한IAM 역할을 참조하세요.

  • Amazon VPC - SharePoint Server를 사용하는 경우 데이터 소스 구성의 일부로 VpcConfiguration를 지정하세요. VPC Amazon Kendra 를 사용하도록 구성을 참조하세요.

다음 선택적 기능도 추가할 수 있습니다.

  • 웹 프록시 - 웹 프록시를 통해 SharePoint 사이트 URL에 연결할지 여부입니다. 이 옵션은 SharePoint Server에만 사용할 수 있습니다.

  • 덱싱 목록 -가 첨부 파일의 콘텐츠를 SharePoint 목록 항목에 인덱싱해야 Amazon Kendra 하는지 여부입니다.

  • 변경 로그 - Amazon Kendra 가 SharePoint 데이터 소스 변경 로그 메커니즘을 사용하여 인덱스에서 문서를 업데이트해야 하는지 여부를 결정합니다.

    참고

    Amazon Kendra 가 모든 문서를 스캔하지 않도록 하려면 변경 로그를 사용하세요. 변경 로그가 큰 경우 SharePoint 데이터 소스의 문서를 스캔하는 데 걸리는 시간이 변경 로그를 처리하는 데 걸리는 시간보다 Amazon Kendra 적을 수 있습니다. SharePoint 데이터 소스를 인덱스와 처음으로 동기화하는 경우 모든 문서가 스캔됩니다.

  • 포함 및 제외 필터 - 특정 콘텐츠를 포함할지 또는 제외할지 여부를 지정할 수 있습니다.

    참고

    대부분의 데이터 소스는 필터라고 하는 포함 또는 제외 패턴인 정규 표현식 패턴을 사용합니다. 포함 필터를 지정하는 경우 포함 필터와 일치하는 콘텐츠만 인덱싱됩니다. 포함 필터와 일치하지 않는 문서는 인덱싱되지 않습니다. 포함 및 제외 필터를 지정하는 경우 제외 필터와 일치하는 문서는 포함 필터와 일치하더라도 인덱싱되지 않습니다.

  • 필드 매핑 - SharePoint 데이터 소스 필드를 Amazon Kendra 인덱스 필드에 매핑하기로 선택합니다. 자세한 내용을 알아보려면 데이터 소스 필드 매핑을 참조하세요.

    참고

    가 문서를 Amazon Kendra 검색하려면 문서 본문 필드 또는 문서에 해당하는 문서 본문이 필요합니다. 데이터 소스의 문서 본문 필드 이름을 인덱스 필드 이름에 매핑해야 합니다_document_body. 다른 모든 필드는 선택 사항입니다.

  • 사용자 컨텍스트 필터링 및 액세스 제어 -Amazon Kendra 문서에 대한 ACL이 있는 경우 문서의 ACL(액세스 제어 목록)을 크롤링합니다. ACL 정보는 검색 결과를 문서에 대한 사용자 또는 그룹의 액세스 권한을 기준으로 필터링하는 데 사용됩니다. 자세한 내용은 사용자 컨텍스트 필터링을 참조하세요.

자세히 알아보기

SharePoint 데이터 소스 Amazon Kendra 와 통합하는 방법에 대한 자세한 내용은 다음을 참조하세요.