亚马逊 SageMaker JumpStart 行业:金融 - Amazon SageMaker

本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。

亚马逊 SageMaker JumpStart 行业:金融

使用 “ SageMaker JumpStart 行业:财务解决方案”、“模型” 和 “示例笔记本”,通过精心策划的一步式解决方案和以行业为重点的机器学习 (ML) 问题的示例笔记本来了解 SageMaker 特性和功能。笔记本还介绍了如何使用 SageMaker JumpStart 行业 Python SDK 来增强行业文本数据和微调预训练模型。

亚马逊 SageMaker JumpStart 行业 Python SDK

SageMaker Runtime 通过其名为 Industry Python 的客户端库 JumpStart 提供了用于整理行业数据集和微调预训练模型的处理工具。 SageMaker JumpStart SDK有关详细API文档以及有关处理和增强行业文本数据集以提高 state-of-the-art 模型性能的更多信息,请参阅 Industry Python SDK 开源文档。SDK SageMaker JumpStart SageMaker JumpStart

亚马逊 SageMaker JumpStart 行业:财务解决方案

SageMaker JumpStart 行业:Financial 提供以下解决方案笔记本:

  • 企业信用评级预测

本 SageMaker JumpStart 行业:金融解决方案为文本增强型企业信用评级模型提供了模板。它展示了如何根据数字特征(在本例中为奥特曼著名的5个财务比率)与SEC申报中的文本相结合来建立模型,以改善信用评级的预测。除了 5 个 Altman 比率之外,您还可以根据需要添加更多变量或设置自定义变量。本解决方案笔记本展示了 Indu SageMaker JumpStart stry Python 如何SDK帮助处理SEC文件中文本的自然语言处理 (NLP) 评分。此外,该解决方案还演示了如何使用增强的数据集训练模型以实现 best-in-class 模型、将模型部署到生产 SageMaker 端点以及如何实时接收改进的预测。

  • 基于图形的信用评分

传统上,信用评级是通过使用财务报表数据和市场数据的模型生成的,这些数据仅为表格数据(数字和类别)。该解决方案使用SEC申报构建了一个由公司组成的网络,并展示了如何使用带有表格数据的公司关系网络来生成准确的评级预测。该解决方案演示了一种方法,使用公司关联数据,将基于表格的传统信用评分模型(已在评级行业中使用了数十年),扩展到网络上的机器学习模型类别。

注意

解决方案笔记本仅用于演示目的。不应将其作为财务或投资建议。

您可以通过 Studio Classic 中的 SageMaker JumpStart 页面找到这些金融服务解决方案。

重要

截至 2023 年 11 月 30 日,之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新后的 Studio 体验的信息,请参阅亚马逊 SageMaker Studio

注意

SageMaker JumpStart 行业:财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录SageMaker 控制台,然后启动 SageMaker Studio Classic。有关如何查找解决方案卡片的更多信息,请参阅上一个主题SageMaker JumpStart

亚马逊 SageMaker JumpStart 行业:财务模型

SageMaker JumpStart 行业:Financial 提供了以下经过预训练的稳健优化方法 BERT (RoBERTa) 模型

  • 财务文本嵌入(R oBERTa SEC-Base)

  • R oBERTa-SEC-WIKI-Base

  • R oBERTa-SEC-大号

  • R oBERTa-SEC-WIKI-大号

R oBERTa-SEC Base和R oBERTa SEC-Large模型是基于 Gluon的 NLP R oBERTa 模型的文本嵌入模型,并根据标准普尔500指数2010年十年(从2010年到2019年)的 SEC 10-K/10-Q报告进行了预训练。除此之外, SageMaker JumpStart Industry:Financial还提供了另外两个R oBERTa 变体,R oBERTa SEC--WIKI-Base和R WIKI--oBERTa SEC-Lar SEC ge,它们是根据维基百科的文件和常用文本进行预训练的。

导航到 “文本模型” 节点,选择 “浏览所有文本模型”,然后筛选 “机器学习任务文本嵌入”,即可在中找到这些模型。 SageMaker JumpStart 选择所选模型后,您可以访问任何对应的笔记本。配对的笔记本将引导您了解如何针对多模态数据集上的特定分类任务对预训练模型进行微调,Industry Python 增强了这些任务。 SageMaker JumpStart SDK

注意

模型笔记本仅用于演示目的。不应将其作为财务或投资建议。

以下屏幕截图显示了 Studio Classic 上通过 SageMaker JumpStart 页面提供的预训练模型卡。

Studio Classic SageMaker JumpStart 页面提供的预训练模型卡片。
注意

SageMaker JumpStart 行业:财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录SageMaker 控制台,然后启动 SageMaker Studio Classic。有关如何查找模型卡片的更多信息,请参阅上一个主题,网址为SageMaker JumpStart

Amazon SageMaker JumpStart 行业:财务示例笔记本

SageMaker JumpStart Industry: Financial 提供了以下示例笔记本来演示以行业为重点的机器学习问题的解决方案:

注意

示例笔记本仅用于演示目的。不应将其作为财务或投资建议。

注意

SageMaker JumpStart 行业:财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录SageMaker 控制台,然后启动 SageMaker Studio Classic。有关如何查找示例笔记本的更多信息,请参阅上一个主题,网址为SageMaker JumpStart

要预览示例笔记本的内容,请参阅教程-SageMaker JumpStart 行业财务 Python SDK 文档

亚马逊 SageMaker JumpStart 行业:金融博客文章

有关使用 “ SageMaker JumpStart 行业:财务解决方案”、模型、示例等的详细应用SDK,请参阅以下博客文章:

亚马逊 SageMaker JumpStart 行业:金融相关研究

有关 “ SageMaker JumpStart 工业:金融解决方案” 的研究,请参阅以下论文:

亚马逊 SageMaker JumpStart 行业:其他财务资源

有关其他文档和教程,请参阅以下资源: