本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
SharePoint 连接器 V2.0
SharePoint 是一项协作建站服务,可用于自定义 Web 内容以及创建页面、站点、文档库和列表。您可以使用 … Amazon Kendra 为您的 SharePoint 数据源编制索引。
Amazon Kendra 目前支持 SharePoint 在线版和 SharePoint服务器版(2013 年、2016 年、2019 年和订阅版)。
注意
对 SharePoint 连接器 V1.0/的支持计划 SharePointConfiguration API于 2023 年结束。我们建议迁移到或使用 SharePoint 连接器 V2.0/ TemplateConfiguration API。
用于对您进行故障排除 Amazon Kendra SharePoint 数据源连接器,请参阅数据来源故障排除。
支持的特征
Amazon Kendra SharePoint 数据源连接器支持以下功能:
-
字段映射
-
用户访问控制
-
包含/排除筛选条件
-
完整内容和增量内容同步
-
虚拟私有云 (VPC)
先决条件
在你可以使用之前 Amazon Kendra 要索引您的 SharePoint 数据源,请在 SharePoint 和中进行这些更改 AWS 账户。
您需要提供身份验证凭证,这些凭据可以安全地存储在 AWS Secrets Manager 秘密。
注意
我们建议您定期刷新或轮换您的凭证和密码。为了安全起见,请仅提供必要的访问权限级别。我们建议不要跨数据来源以及连接器版本 1.0 和 2.0(如果适用)重复使用凭证和密钥。
在 “在 SharePoint 线” 中,请确保你有:
-
已复制您的 SharePoint 实例URLs。URL您输入的主机格式为
https://yourdomain.sharepoint.com/sites/mysite
。 您URL必须以开头https
并包含sharepoint.com
。 -
已复制您的 SharePoint 实例的域名URL。
-
已记下您的基本身份验证凭据,其中包含用户名和密码,具有连接到 On SharePoint line 的站点管理员权限。
-
使用管理用户在 Azure 门户中停用安全默认值。有关在 Azure 门户中管理安全默认设置的更多信息,请参阅 Microsoft 关于如何启用/禁用安全默认设置的文档
。 -
已在您的 SharePoint账户中停用多因素身份验证 (MFA),这样 Amazon Kendra 不会被阻止抓取您的 SharePoint 内容。
-
如果使用基本身份验证以外的身份验证类型:已复制 SharePoint 实例的租户 ID。有关如何查找租户 ID 的详细信息,请参阅查找您的 Microsoft 365 租户 ID
。 -
如果你需要使用 Microsoft Entra 迁移到云用户身份验证,请参阅微软关于云身份验证的文档
。 -
对于 OAuth 2.0 身份验证和 OAuth 2.0 刷新令牌身份验证:记下您的基本身份验证凭据,其中包含用于连接到 On SharePoint line 的用户名和密码以及注册 SharePoint 到 Azure AD 后生成的客户端 ID 和客户端密钥。
-
如果您不使用 ACL,请添加以下权限:
Microsoft Graph SharePoint -
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
AllSites.Read(委托)-读取所有网站集中的项目
注意
Note.Read.All 和 Sites.Read.All 只有在你想抓取 Documents 时才是必填的。 OneNote
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个API权限,你需要通过 Microsoft Graph 明确设置每个网站的访问权限API。有关更多信息,请参阅 Microsoft 在 “站点” 上发布的博客。所选权限。
-
-
如果您正在使用 ACL,请添加以下权限:
Microsoft Graph SharePoint -
Group.Member.Read.All(应用程序)- 读取所有组成员资格
-
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
网站。 FullControl.All(已授权)-需要检索ACLs文档
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
User.Read.All(应用程序)- 读取所有用户的完整个人资料
-
AllSites.Read(委托)-读取所有网站集中的项目
注意
GroupMember只有激活 Identity Crawler 时,才需要.Read.All 和 User.Read.All。
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个API权限,你需要通过 Microsoft Graph 明确设置每个网站的访问权限API。有关更多信息,请参阅 Microsoft 在 “站点” 上发布的博客。所选权限。
-
-
-
对于 Azure AD 仅限应用程序的身份验证:私钥和注册 SharePoint 到 Azure AD 后生成的客户端 ID。还要注意 X.509 证书。
-
如果您不使用 ACL,请添加以下权限:
SharePoint -
Sites.Read.All(应用程序)-需要访问所有网站集中的项目和列表
注意
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个API权限,你需要通过 Microsoft Graph 明确设置每个网站的访问权限API。有关更多信息,请参阅 Microsoft 在 “站点” 上发布的博客。所选权限。
-
-
如果您正在使用 ACL,请添加以下权限:
SharePoint -
网站。 FullControl.All(应用程序)-检索文档所必需ACLs的
注意
如果您想抓取特定的网站,则权限可以仅限于特定的网站,而不是域中所有可用的网站。您可以配置 “站点”。选定(应用程序)权限。有了这个API权限,你需要通过 Microsoft Graph 明确设置每个网站的访问权限API。有关更多信息,请参阅 Microsoft 在 “站点” 上发布的博客。所选权限。
-
-
-
对于 SharePoint 仅限应用程序的身份验证:记下在授予 “仅限 SharePoint 应用程序” 权限时生成的客户端 ID 和客户端密钥,以及向 Azure AD 注册 SharePoint 应用程序时生成的客户端 ID 和客户端密钥。 SharePoint
注意
SharePoint SharePoint 2013 版本不支持仅限应用程序的身份验证。
-
(可选)如果您正在搜索 OneNote文档并使用 Id entity Crawler,请添加以下权限:
Microsoft Graph -
GroupMember.Read.All(应用程序)-读取所有群组成员资格
-
Notes.Read.All(应用程序)-阅读所有笔记本 OneNote
-
Sites.Read.All(应用程序)- 读取所有网站集合的项目
-
User.Read.All(应用程序)- 读取所有用户的完整个人资料
-
注意
使用基本身份验证和仅限 SharePoint应用程序的身份验证来抓取实体不需要任何API权限。
-
在 SharePoint Server 中,请确保你有:
-
已复制您的 SharePoint 实例URLs和您的域名 SharePoint URLs。URL您输入的主机格式为
https://yourcompany/sites/mysite
。 你URL必须从开始https
。注意
(本地/服务器) Amazon Kendra 检查端点信息是否包含在 AWS Secrets Manager 与您的数据源配置详细信息中指定的端点信息相同。这有助于防止混乱的副手问题,这是一个安全问题,即用户无权执行操作但使用 Amazon Kendra 作为代理访问配置的密钥并执行操作。如果以后更改端点信息,则必须创建一个新密钥来同步此信息。
-
已在您的 SharePoint账户中停用多因素身份验证 (MFA),这样 Amazon Kendra 不会被阻止抓取您的 SharePoint 内容。
-
如果使用SharePoint 仅限应用程序的身份验证进行访问控制:
-
已复制您在站点级别注册 “仅限应用程序” 时生成的 SharePoint 客户端 ID。客户端 ID 格式为 ClientId @ TenantId。例如,
ffa956f3-8f89-44e7-b0e4-49670756342c@888d0b57-69f1-4fb8-957f-e1f0bedf82fe
. -
已复制您在站点级别注册 “仅限应用程序” 时生成的 SharePoint 客户端密钥。
注意:由于只有在注册 SharePoint 服务器进行仅限应用程序身份验证时,才会为单个站点生成客户端IDs和客户端密钥,URL因此仅支持一个站点进行仅 SharePoint 应用程序身份验证。
注意
SharePoint SharePoint 2013 版本不支持仅限应用程序的身份验证。
-
-
如果使用带有自定义域名的电子邮件 ID 进行访问控制:
-
记下了您的自定义电子邮件域名值,例如:”
amazon.com
".
-
-
如果使用带有IDP授权域名的电子邮件 ID,请复制您的:
-
LDAP服务器端点(LDAP服务器端点,包括协议和端口号)。例如:
ldap://example.com:389
. -
LDAP搜索库(LDAP用户的搜索库)。例如:
CN=Users,DC=sharepoint,DC=com
. -
LDAP用户名和LDAP密码。
-
-
要么是已配置的NTLM身份验证凭据,要么是配置的包含用户名(SharePoint 帐户用户名)和密码(SharePoint 帐户密码)的 Kerberos 身份验证凭据。
在你的 AWS 账户,请确保你有:
-
创建了一个 Amazon Kendra 索引,如果使用API,则记下索引 ID。
-
创建了一个 IAM 您的数据源的角色,如果使用API,则注ARN明了 IAM 角色。
注意
如果您更改了身份验证类型和凭证,则必须更新您的 IAM 角色可以访问正确的 AWS Secrets Manager 秘密身份证。
-
将您的 SharePoint 身份验证凭证存储在 AWS Secrets Manager secret,如果使用API,则记下该秘密ARN的内容。
注意
我们建议您定期刷新或轮换您的凭证和密码。为了安全起见,请仅提供必要的访问权限级别。我们建议不要跨数据来源以及连接器版本 1.0 和 2.0(如果适用)重复使用凭证和密钥。
如果你没有现有 IAM 角色或密钥,你可以使用控制台创建新的 IAM 角色和 Secrets Manager 将 SharePoint 数据源连接到 secret Amazon Kendra。 如果您使用的是API,则必须提供现有ARN的 IAM 角色和 Secrets Manager 密钥和索引 ID。
连接说明
要连接 Amazon Kendra 对于您的 SharePoint 数据源,您必须提供 SharePoint 凭据的详细信息,以便 Amazon Kendra 可以访问您的数据。如果您尚未 SharePoint 配置 Amazon Kendra 见先决条件 。
注意
-
连接器仅支持文件实体的自定义字段映射。
-
对于所有 SharePoint 服务器版本,ACL令牌必须为小写。对于包含域名发件IDP人和带有自定义域名的电子邮件 ID 的电子邮件ACL,例如:
user@sharepoint2019.com
。 对于具有域的域\ 用户ACL,例如:sharepoint2013\user
. -
连接器不支持 SharePoint 2013 年的更改日志模式/ 新内容或修改内容同步。
-
如果实体名称中包含字
%
符,则由于API限制,连接器将跳过这些文件。 -
OneNote 只能由连接器使用租户 ID 进行抓取,并激活了 OAuth 2.0、OAuth 2.0 刷新令牌或仅限 SharePoint 应用程序的身份验证 SharePoint 。
-
连接器仅使用 OneNote 文档的默认名称抓取文档的第一部分,即使文档已重命名也是如此。
-
连接器会抓取 SharePoint 2019 年、 SharePoint在线版和订阅版中的链接,前提是除了链接之外还选择 “页面” 和 “文件” 作为要抓取的实体。
-
如果选择链接作为要抓取的实体,则连接器会在 SharePoint SharePoint 2013 年和 2016 年抓取链接。
-
仅当列表数据也被选为要爬取的实体时,连接器才会爬取列表附件和评论。
-
仅当事件也被选为要爬取的实体时,连接器才会爬取事件附件。
-
对于 SharePoint 在线版本,ACL令牌将使用小写。例如,如果用户主体名称是
MaryMajor@domain.com
在 Azure 门户中, SharePoint 连接器中的ACL令牌将是marymajor@domain.com
. -
在适用于 SharePoint 在线和服务器的 Ident ity Crawler 中,如果要抓取嵌套群组,则必须激活本地和 AD 组抓取。
-
如果你使用的是 O SharePoint nline,并且 Azure 门户中的用户主体名称是大写和小写的组合,则 SharePoint API内部会将其转换为小写。正因为如此, Amazon Kendra SharePoint 连接器套装ACL为小写。