本文属于机器翻译版本。若本译文内容与英语原文存在差异,则一律以英文原文为准。
亚马逊 SageMaker JumpStart 行业:金融
使用 “ SageMaker JumpStart 行业:财务解决方案”、“模型” 和 “示例笔记本”,通过精心策划的一步式解决方案和以行业为重点的机器学习 (ML) 问题的示例笔记本来了解 SageMaker 特性和功能。笔记本还介绍了如何使用 SageMaker JumpStart 行业 Python SDK 来增强行业文本数据和微调预训练模型。
主题
亚马逊 SageMaker JumpStart 行业 Python SDK
SageMaker Runtime 通过其名为 Industry Python 的客户端库 JumpStart 提供了用于整理行业数据集和微调预训练模型的处理工具。 SageMaker JumpStart SDK有关详细API文档以及有关处理和增强行业文本数据集以提高 state-of-the-art 模型性能的更多信息,请参阅 Industry Python SDK 开源文档
亚马逊 SageMaker JumpStart 行业:财务解决方案
SageMaker JumpStart 行业:Financial 提供以下解决方案笔记本:
-
企业信用评级预测
本 SageMaker JumpStart 行业:金融解决方案为文本增强型企业信用评级模型提供了模板。它展示了如何根据数字特征(在本例中为奥特曼著名的5个财务比率)与SEC申报中的文本相结合来建立模型,以改善信用评级的预测。除了 5 个 Altman 比率之外,您还可以根据需要添加更多变量或设置自定义变量。本解决方案笔记本展示了 Indu SageMaker JumpStart stry Python 如何SDK帮助处理SEC文件中文本的自然语言处理 (NLP) 评分。此外,该解决方案还演示了如何使用增强的数据集训练模型以实现 best-in-class 模型、将模型部署到生产 SageMaker 端点以及如何实时接收改进的预测。
-
基于图形的信用评分
传统上,信用评级是通过使用财务报表数据和市场数据的模型生成的,这些数据仅为表格数据(数字和类别)。该解决方案使用SEC申报
注意
解决方案笔记本仅用于演示目的。不应将其作为财务或投资建议。
您可以通过 Studio Classic 中的 SageMaker JumpStart 页面找到这些金融服务解决方案。
重要
截至 2023 年 11 月 30 日,之前的亚马逊 SageMaker Studio 体验现在被命名为 Amazon St SageMaker udio Classic。以下部分专门介绍如何使用 Studio Classic 应用程序。有关使用更新后的 Studio 体验的信息,请参阅亚马逊 SageMaker Studio。
注意
SageMaker JumpStart 行业:财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录SageMaker 控制台
亚马逊 SageMaker JumpStart 行业:财务模型
SageMaker JumpStart 行业:Financial 提供了以下经过预训练的稳健优化方法 BERT (RoBERTa) 模型
-
财务文本嵌入(R oBERTa SEC-Base)
-
R oBERTa-SEC-WIKI-Base
-
R oBERTa-SEC-大号
-
R oBERTa-SEC-WIKI-大号
R oBERTa-SEC Base和R oBERTa SEC-Large模型是基于 Gluon的 NLP R oBERTa 模型的
导航到 “文本模型” 节点,选择 “浏览所有文本模型”,然后筛选 “机器学习任务文本嵌入”,即可在中找到这些模型。 SageMaker JumpStart 选择所选模型后,您可以访问任何对应的笔记本。配对的笔记本将引导您了解如何针对多模态数据集上的特定分类任务对预训练模型进行微调,Industry Python 增强了这些任务。 SageMaker JumpStart SDK
注意
模型笔记本仅用于演示目的。不应将其作为财务或投资建议。
以下屏幕截图显示了 Studio Classic 上通过 SageMaker JumpStart 页面提供的预训练模型卡。
注意
SageMaker JumpStart 行业:财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录SageMaker 控制台
Amazon SageMaker JumpStart 行业:财务示例笔记本
SageMaker JumpStart Industry: Financial 提供了以下示例笔记本来演示以行业为重点的机器学习问题的解决方案:
-
财务 TabText 数据构建 — 此示例介绍如何使用 SageMaker JumpStart 行业 Python SDK 来处理SEC申报,例如基于分NLP数类型及其相应单词列表的文本摘要和评分文本。要预览本笔记本的内容,请参阅从SEC申报和NLP分数中简单构造多模态数据集
。 -
基于 TabText 数据的多模态机器学习 — 此示例说明如何将不同类型的数据集合并到一个名为多模态机器学习的数据框中 TabText 并执行多模态机器学习。要预览本笔记本的内容,请参阅 M achine Learning on a TabText DataFrame — 基于薪资保护计划的示例
。 -
对SEC申报数据进行多类别机器学习 — 此示例说明如何根据多类分类任务的SEC申报整理的多模式 (TabText) 数据集训练 AutoGluon NLP模型。根据文本列将 SEC 10K/Q申报归类为行业代码。MDNA
注意
示例笔记本仅用于演示目的。不应将其作为财务或投资建议。
注意
SageMaker JumpStart 行业:财务解决方案、模型卡和示例笔记本只能通过 SageMaker Studio Classic 托管和运行。登录SageMaker 控制台
要预览示例笔记本的内容,请参阅教程-SageMaker JumpStart 行业财务
亚马逊 SageMaker JumpStart 行业:金融博客文章
有关使用 “ SageMaker JumpStart 行业:财务解决方案”、模型、示例等的详细应用SDK,请参阅以下博客文章:
亚马逊 SageMaker JumpStart 行业:金融相关研究
有关 “ SageMaker JumpStart 工业:金融解决方案” 的研究,请参阅以下论文:
亚马逊 SageMaker JumpStart 行业:其他财务资源
有关其他文档和教程,请参阅以下资源: