本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
SharePoint 连接器 V2.0
SharePoint 是一项协作建站服务,可用于自定义 Web 内容以及创建页面、站点、文档库和列表。您可以使用索 Amazon Kendra 引您的 SharePoint 数据源。
Amazon Kendra 目前支持 SharePoint 在线版和 SharePoint服务器版(2013 年、2016 年、2019 年和订阅版)。
注意
SharePoint 连接器 V1.0/ SharePointConfiguration API 已于 2023 年结束。我们建议迁移到或使用 SharePoint 连接器 V2.0/ TemplateConfiguration API。
要对 Amazon Kendra SharePoint 数据源连接器进行故障排除,请参阅数据来源故障排除。
支持的特征
Amazon Kendra SharePoint 数据源连接器支持以下功能:
-
字段映射
-
用户访问控制
-
包含/排除筛选条件
-
完整内容和增量内容同步
-
虚拟私有云 (VPC)
先决条件
在使用索 Amazon Kendra 引 SharePoint 数据源之前,请在 SharePoint 和 AWS 帐户中进行这些更改。
您需要提供身份验证凭证,这些凭据可以安全地存储在 AWS Secrets Manager 密钥中。
注意
我们建议您定期刷新或轮换您的凭证和密码。为了安全起见,请仅提供必要的访问权限级别。我们建议不要跨数据来源以及连接器版本 1.0 和 2.0(如果适用)重复使用凭证和密钥。
在 “在 SharePoint 线” 中,请确保你有:
-
已复制您的 SharePoint 实例URLs。URL您输入的主机格式为
https://yourdomain.sharepoint.com/sites/mysite
。 您URL必须以开头https
并包含sharepoint.com
。 -
已复制您的 SharePoint 实例的域名URL。
-
已记下您的基本身份验证凭据,其中包含用户名和密码,具有连接到 On SharePoint line 的站点管理员权限。
-
使用管理用户在 Azure 门户中停用安全默认值。有关在 Azure 门户中管理安全默认设置的更多信息,请参阅 Microsoft 关于如何启用/禁用安全默认设置的文档
。 -
已在您的 SharePoint账户中停用多因素身份验证 (MFA),这样就不会阻止 Amazon Kendra 它抓取您的内容。 SharePoint
-
如果使用基本身份验证以外的身份验证类型:已复制 SharePoint 实例的租户 ID。有关如何查找租户 ID 的详细信息,请参阅查找您的 Microsoft 365 租户 ID
。 -
如果你需要使用 Microsoft Entra 迁移到云用户身份验证,请参阅微软关于云身份验证的文档
。 -
对于 OAuth 2.0 身份验证和 OAuth 2.0 刷新令牌身份验证:记下您的基本身份验证凭据,其中包含用于连接到 On SharePoint line 的用户名和密码以及注册 SharePoint 到 Azure AD 后生成的客户端 ID 和客户端密钥。
-
如果您不使用 ACL,请添加以下权限:
Microsoft Graph SharePoint -
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
AllSites.Read(委托)-读取所有网站集中的项目
注意
Note.Read.All 和 Sites.Read.All 只有在你想抓取 Documents 时才是必填的。 OneNote
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个API权限,你需要通过 Microsoft Graph 明确设置每个网站的访问权限API。有关更多信息,请参阅 Microsoft 在 “站点” 上发布的博客。所选权限。
-
-
如果您正在使用 ACL,请添加以下权限:
Microsoft Graph SharePoint -
Group.Member.Read.All(应用程序)- 读取所有组成员资格
-
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
网站。 FullControl.All(委托)-需要检索ACLs文档
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
User.Read.All(应用程序)- 读取所有用户的完整个人资料
-
AllSites.Read(委托)-读取所有网站集中的项目
注意
GroupMember只有激活 Identity Crawler 时,才需要.Read.All 和 User.Read.All。
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个API权限,你需要通过 Microsoft Graph 明确设置每个网站的访问权限API。有关更多信息,请参阅 Microsoft 在 “站点” 上发布的博客。所选权限。
-
-
-
对于 Azure AD 仅限应用程序的身份验证:私钥和您在向 Azure AD 注册 SharePoint 后生成的客户端 ID。还要注意 X.509 证书。
-
如果您不使用 ACL,请添加以下权限:
SharePoint -
Sites.Read.All(应用程序)-需要访问所有网站集中的项目和列表
注意
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个API权限,你需要通过 Microsoft Graph 明确设置每个网站的访问权限API。有关更多信息,请参阅 Microsoft 在 “站点” 上发布的博客。所选权限。
-
-
如果您正在使用 ACL,请添加以下权限:
SharePoint -
网站。 FullControl.All(应用程序)-需要检索ACLs文档
注意
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个API权限,你需要通过 Microsoft Graph 明确设置每个网站的访问权限API。有关更多信息,请参阅 Microsoft 在 “站点” 上发布的博客。所选权限。
-
-
-
对于 SharePoint 仅限应用程序的身份验证:记下在授予 “仅限 SharePoint 应用程序” 权限时生成的客户端 ID 和客户端密钥,以及向 Azure AD 注册 SharePoint 应用程序时生成的客户端 ID 和客户端密钥。 SharePoint
注意
SharePoint SharePoint 2013 版本不支持仅限应用程序的身份验证。
-
(可选)如果您正在搜索 OneNote文档并使用 Id entity Crawler,请添加以下权限:
Microsoft Graph -
GroupMember.Read.All(应用程序)-读取所有群组成员资格
-
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
User.Read.All(应用程序)- 读取所有用户的完整个人资料
-
注意
使用基本身份验证和仅限 SharePoint应用程序的身份验证来抓取实体不需要任何API权限。
-
在 SharePoint Server 中,请确保你有:
-
已复制您的 SharePoint 实例URLs和您的域名 SharePoint URLs。URL您输入的主机格式为
https://yourcompany/sites/mysite
。 你URL必须从开始https
。注意
(本地/服务器) Amazon Kendra 会检查中 AWS Secrets Manager 包含的端点信息是否与数据源配置详细信息中指定的端点信息相同。这有助于防止出现混淆代理人问题,这是一个安全问题,即用户无权执行操作,但可以将 Amazon Kendra 作为代理来访问配置的密钥和执行操作。如果以后更改端点信息,则必须创建一个新密钥来同步此信息。
-
已在您的 SharePoint账户中停用多因素身份验证 (MFA),这样就不会阻止 Amazon Kendra 它抓取您的内容。 SharePoint
-
如果使用SharePoint 仅限应用程序的身份验证进行访问控制:
-
已复制您在站点级别注册 “仅限应用程序” 时生成的 SharePoint 客户端 ID。客户端 ID 格式为 ClientId @ TenantId。例如,
ffa956f3-8f89-44e7-b0e4-49670756342c@888d0b57-69f1-4fb8-957f-e1f0bedf82fe
. -
已复制您在站点级别注册 “仅限应用程序” 时生成的 SharePoint 客户端密钥。
注意:由于只有在注册 SharePoint 服务器进行仅限应用程序身份验证时,才会为单个站点生成客户端IDs和客户端密钥,URL因此仅支持一个站点进行仅 SharePoint 应用程序身份验证。
注意
SharePoint SharePoint 2013 版本不支持仅限应用程序的身份验证。
-
-
如果使用带有自定义域名的电子邮件 ID 进行访问控制:
-
记下了您的自定义电子邮件域名值,例如:”
amazon.com
".
-
-
如果使用带有IDP授权域名的电子邮件 ID,请复制您的:
-
LDAP服务器端点(LDAP服务器端点,包括协议和端口号)。例如:
ldap://example.com:389
. -
LDAP搜索库(LDAP用户的搜索库)。例如:
CN=Users,DC=sharepoint,DC=com
. -
LDAP用户名和LDAP密码。
-
-
要么是已配置的NTLM身份验证凭据,要么是配置的包含用户名(SharePoint 帐户用户名)和密码(SharePoint 帐户密码)的 Kerberos 身份验证凭据。
在你的 AWS 账户,请确保你有:
-
已创建 Amazon Kendra 索引,如果使用API,则记下索引 ID。
-
为您的数据源@@ 创建了一个 IAM 角色,如果使用,请API记下该角色ARN的 IAM 角色。
注意
如果您更改了身份验证类型和证书,则必须更新您的 IAM 角色才能访问正确的 AWS Secrets Manager 密钥 ID。
-
将您的 SharePoint 身份验证凭据存储在 AWS Secrets Manager 密钥中,如果使用API,则记下该密钥ARN的内容。
注意
我们建议您定期刷新或轮换您的凭证和密码。为了安全起见,请仅提供必要的访问权限级别。我们建议不要跨数据来源以及连接器版本 1.0 和 2.0(如果适用)重复使用凭证和密钥。
如果您没有现有的 IAM 角色或密钥,则可以在将 SharePoint 数据源连接到时使用控制台创建新的 IAM 角色和 Secrets Manager 密钥 Amazon Kendra。如果您使用的是API,则必须提供现有 IAM 角色和 Secrets Manager 密钥以及索引 ID。ARN
连接说明
要 Amazon Kendra 连接到您的 SharePoint 数据源,您必须提供 SharePoint 凭据的详细信息, Amazon Kendra 以便访问您的数据。如果您尚未进行配置, SharePoint 请参 Amazon Kendra 阅先决条件。
注意
-
连接器仅支持文件实体的自定义字段映射。
-
对于所有 SharePoint 服务器版本,ACL令牌必须为小写。对于包含域名发件IDP人和带有自定义域名的电子邮件 ID 的电子邮件ACL,例如:
user@sharepoint2019.com
。 对于具有域的域\ 用户ACL,例如:sharepoint2013\user
. -
连接器不支持 SharePoint 2013 年的更改日志模式/ 新内容或修改内容同步。
-
如果实体名称中包含字
%
符,则由于API限制,连接器将跳过这些文件。 -
OneNote 只能由连接器使用租户 ID 进行抓取,并激活了 OAuth 2.0、OAuth 2.0 刷新令牌或仅限 SharePoint 应用程序的身份验证 SharePoint 。
-
连接器仅使用 OneNote 文档的默认名称抓取文档的第一部分,即使文档已重命名也是如此。
-
连接器会抓取 SharePoint 2019 年、 SharePoint在线版和订阅版中的链接,前提是除了链接之外还选择 “页面” 和 “文件” 作为要抓取的实体。
-
如果选择链接作为要抓取的实体,则连接器会在 SharePoint SharePoint 2013 年和 2016 年抓取链接。
-
仅当列表数据也被选为要爬取的实体时,连接器才会爬取列表附件和评论。
-
仅当事件也被选为要爬取的实体时,连接器才会爬取事件附件。
-
对于 SharePoint 在线版本,ACL令牌将使用小写。例如,如果用户主体名称是
MaryMajor@domain.com
在 Azure 门户中, SharePoint 连接器中的ACL令牌将是marymajor@domain.com
. -
在 Identity Crawler f or O SharePoint nline 和 Server 中,如果要抓取嵌套群组,则必须激活本地和 AD 组抓取。
-
如果你使用的是 O SharePoint nline,并且 Azure 门户中的用户主体名称是大写和小写的组合,则 SharePoint API内部会将其转换为小写。因此, Amazon Kendra SharePoint 连接器设置ACL为小写。