本文為英文版的機器翻譯版本,如內容有任何歧義或不一致之處,概以英文版為準。
Amazon SageMaker JumpStart 行業:金融
使用產 SageMaker JumpStart 業:財務解決方案、模型和範例筆記本,透過精心策劃的單步驟解決方案和以產業為重點的機器學習 (ML) 問題的範例筆記本,瞭解 SageMaker 功能和功能。這些筆記本也會逐步介紹如何使用 SageMaker JumpStart 工業 Python SDK 來增強產業文字資料,以及微調預先訓練的模型。
主題
Amazon SageMaker JumpStart 行業 Python SDK
SageMaker 執行階段 JumpStart 提供用於策劃產業資料集的處理工具,並透過其稱 SageMaker JumpStart 為工業 Python 的用戶端程式庫微調預先訓練的模型。SDK如需詳細的文API件SDK,以及若要進一步瞭解如何處理和增強產業文字資料集以改善 state-of-the-art 模型的效能 SageMaker JumpStart,請參閱SageMaker JumpStart產業 Python SDK 開放原始碼文件
Amazon SageMaker JumpStart 行業:金融解決方
SageMaker JumpStart 產業:金融提供下列解決方案筆記型電腦:
-
企業信用評等預測
這個 SageMaker JumpStart 行業:財務解決方案為文本增強的企業信用評級模型提供了一個模板。它展示了如何根據數字特徵(在這種情況下為 Altman 著名的 5 財務比率)與文SEC件中的文本相結合的模型,以實現信用評級的預測的改善。除了 5 個 Altman 比率之外,您還可以視需要新增更多變數或設定自訂變數。此解決方案筆記本展示了工 SageMaker JumpStart 業 Python 如何SDK幫助處理文SEC件中文本的自然語言處理(NLP)評分。此外,該解決方案示範如何使用增強型資料集來訓練模型以實現 best-in-class 模型、將模型部署到 SageMaker 端點進行生產,以及即時接收改進的預測。
-
以圖形為基礎的信用評分
傳統上使用財務報表資料和市場資料的模型產生信用評等,其僅為表格式 (數值和分類)。該解決方案使用SEC文件
注意
解決方案筆記本僅供示範用途。不應視為財務或投資建議。
您可以通過工作室經典 SageMaker JumpStart 頁面找到這些金融服務解決方案。
重要
截至 2023 年 11 月 30 日,以前的 Amazon SageMaker 工作室體驗現在被命名為 Amazon SageMaker 工作室經典。下面的部分是特定於使用 Studio 傳統版應用程序。如需使用更新後的 Studio 體驗的相關資訊,請參閱Amazon SageMaker Studio。
注意
SageMaker JumpStart 產業:財務解決方案、模型卡和範例筆記本只能透過 SageMaker Studio Classic 託管和執行。登入SageMaker 主控台
Amazon SageMaker JumpStart 產業:財務模型
SageMaker JumpStart 產業:金融提供以下預先訓練的強大優化BERT方法(RoBERTa)模
-
財務文字嵌入 (R oBERTa SEC-基底)
-
的 R oBERTa--SEC-WIKI 基地
-
的 R oBERTa-SEC 大
-
的 R oBERTa-SEC--WIKI 大
R oBERTa-SEC 基礎和 R-oBERTa SEC-大型模型是基於膠子的 R 模型的文本嵌入oBERTa 模型,並在 NLP
您可以導覽至「文字模型」節點,選擇「瀏覽所有文字模型」,然後篩選「ML 工作文字嵌入」,來在 SageMaker JumpStart 中找到這些模型。選取您選擇的型號後,可存取任何對應的筆記本。配對的筆記本將引導您瞭解如何針對多模態資料集上的特定分類工作進行微調預先訓練的模型,這些工作由業界 SageMaker JumpStart Python 增強。SDK
注意
模型筆記僅供示範用途。不應被視為財務或投資建議。
下面的屏幕截圖顯示了通過工作室經典 SageMaker JumpStart 頁面提供的預先訓練的模型卡。
注意
SageMaker JumpStart 產業:財務解決方案、模型卡和範例筆記本只能透過 SageMaker Studio Classic 託管和執行。登入SageMaker 主控台
Amazon SageMaker JumpStart 行業:金融示例筆記本
SageMaker JumpStart 產業:Financial 提供下列範例筆記型電腦,展示針對以產業為重點的機器學習問題
-
財務 TabText 數據構建 — 此示例介紹如何使用 SageMaker JumpStart 行業 Python SDK 處理SEC文件,例如根據分數類型及其對應單詞列表的文本摘要和評NLP分文本。若要預覽此筆記本的內容,請參閱從SEC檔案和NLP分數簡單建構多模式資料集
。 -
TabText 資料上的多模式 ML — 此範例說明如何將不同類型的資料集合併到稱為單一資料框, TabText 並執行多模態 ML。若要預覽此筆記本的內容,請參閱 TabText 資料框架上的 Machine Learning — 以薪資保護計畫為基礎的範例
。 -
SEC檔案資料上的多類別 ML — 此範例顯示如何透過針對多類別分類工作的SEC檔案策劃的多 AutoGluon NLP模式 (TabText) 資料集來訓練模型。根據「MDNA文字」欄,將 SEC 10K/Q 檔案分類為產業代碼
。
注意
範例筆記本僅供示範用途。不應被視為財務或投資建議。
注意
SageMaker JumpStart 產業:財務解決方案、模型卡和範例筆記本只能透過 SageMaker Studio Classic 託管和執行。登入SageMaker 主控台
若要預覽範例筆記本的內容,請參閱SageMaker JumpStart 產業 Python SDK 文件中的教學課程 — 財務
Amazon SageMaker JumpStart 行業:金融博客文章
如需使用 SageMaker JumpStart 產業的完整應用:財務解決方案、模型、範例和SDK,請參閱下列部落格文章:
Amazon SageMaker JumpStart 行業:金融相關研究
有關「 SageMaker JumpStart 產業:金融解決方案」的研究,請參閱下列論文:
Amazon SageMaker JumpStart 產業:財務額外資源
如需其他文件和教學課程,請參閱以下資源: