リリースノート - Amazon SageMaker

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

リリースノート

Data Wrangler は、新しい機能やバグ修正で定期的に更新されます。Studio Classic で使用している Data Wrangler のバージョンをアップグレードするには、「」の手順に従いますStudio Classic アプリケーションをシャットダウンして更新する

リリースノート

8/31/2023

新しい機能:

データセット全体に対して Data Quality and Insights レポートを作成できるようになりました。詳細については、「データとデータ品質に関するインサイトを取得する」を参照してください。

5/20/2023

新しい機能:

Salesforce Data Cloud からデータをインポートできるようになりました。詳細については、「Salesforce データクラウドからデータをインポートする」を参照してください。

4/18/2023

新しい機能:

Amazon Personalize が解釈できる形式でデータを取得できるようになりました。詳細については、「Amazon Personalize のマップ列」を参照してください。

3/1/2023

新しい機能:

Hive を使用して Amazon からデータをインポートできるようになりましたEMR。詳細については、「Amazon からデータをインポートする EMR」を参照してください。

12/10/2022

新しい機能:

Data Wrangler フローを推論エンドポイントにエクスポートできるようになりました。詳細については、「推論エンドポイントへのエクスポート」を参照してください。

新しい機能:

インタラクティブなノートブックウィジェットをデータ準備に使用できるようになりました。詳細については、「Amazon SageMaker Studio Classic ノートブックでインタラクティブデータ準備ウィジェットを使用して Data Insights を取得する」を参照してください。

新しい機能:

SaaS プラットフォームからデータをインポートできるようになりました。詳細については、「Software as a Service (SaaS) プラットフォームからのデータのインポート」を参照してください。

10/12/2022

新しい機能:

さまざまなデータセットのデータフローを再利用できるようになりました。詳細については、「異なるデータセットのデータフローの再利用」を参照してください。

10/05/2022

新しい機能:

プリンシパルコンポーネント分析 (PCA) を変換として使用できるようになりました。詳細については、「データセット内の次元を減らす」を参照してください。

10/05/2022

新しい機能:

Data Wrangler フローのパラメータを再調整できるようになりました。詳細については、「[Export] (エクスポート)」を参照してください。

10/03/2022

新しい機能:

Data Wrangler フローからモデルをデプロイできるようになりました。詳細については、「データフローでモデルを自動的にトレーニングする」を参照してください。

9/20/2022

新しい機能:

Athena でデータ保持期間を設定できるようになりました。詳細については、「Athena からデータをインポートする」を参照してください。

6/9/2022

新しい機能:

Amazon SageMaker Autopilot を使用して、Data Wrangler フローから直接モデルをトレーニングできるようになりました。詳細については、「データフローでモデルを自動的にトレーニングする」を参照してください。

5/6/2022

新しい機能:

追加の m5 および r5 インスタンスを使用できるようになりました。詳細については、「インスタンス」を参照してください。

4/27/2022

新しい機能:

4/1/2022

新しい機能:

Databricks をデータソースとして使用できるようになりました。詳細については、「Databricks からデータをインポートする (JDBC)」を参照してください。

2/2/2022

新しい機能:

  • デスティネーションノードを使用してエクスポートできるようになりました。詳細については、「[Export] (エクスポート)」を参照してください

  • ORC および JSON ファイルをインポートできます。ファイルタイプの詳細については、「[Import](インポート)」を参照してください。

  • Data Wrangler で SMOTE変換の使用がサポートされるようになりました。詳細については、「バランスデータ」を参照してください。

  • Data Wrangler は、カテゴリデータの類似度エンコーディングをサポートするようになりました。詳細については、「類似度エンコード」を参照してください。

  • Data Wrangler でJSONデータのネスト解除がサポートされるようになりました。詳細については、「JSON データのネスト解除」を参照してください。

  • Data Wrangler では、配列の値を別の列に拡張できるようになりました。詳細については、「配列の分解」を参照してください。

  • Data Wrangler は、問題が発生したときのサービスチームへの連絡をサポートするようになりました。詳細については、「トラブルシューティング」を参照してください。

  • Data Wrangler は、データフローのステップの編集と削除をサポートします。詳細については、「データフローからステップを削除する」および「Data Wrangler フローのステップを編集する」を参照してください。

  • 複数の列で変換を実行できるようになりました。詳細については、「データを変換する」を参照してください。

  • Data Wrangler はコスト配分タグをサポートするようになりました。詳細については、「コスト配分タグの使用」を参照してください。

10/16/2021

新しい機能:

Data Wrangler は Athena ワークグループをサポートするようになりました。詳細については、「Athena からデータをインポートする」を参照してください。

10/6/2021

新しい機能:

Data Wrangler は時系列データの変換をサポートするようになりました。詳細については、「時系列を変換する」を参照してください。

7/15/2021

新しい機能:

  • Snowflake と Data Wrangler がサポートされるようになりました。Snowflake は Data Wrangler でデータソースとして使用できます。

  • でカスタムフィールド区切り文字のサポートを追加しましたCSV。カンマ、コロン、セミコロン、パイプ (|)、タブがサポートされるようになりました。

  • 結果を直接 Amazon S3 にエクスポートできるようになりました。

  • 分散拡大要因、主成分分析、Lasso 特徴選択という新しい多重共線性アナライザーが追加されました。

機能強化

  • 重複するラベルでは分析チャートを搭載できなくなりました。

バグ修正

  • ワンホットエンコーダーは空の文字列を適切に処理します。

  • データフレームの列名にドットが含まれていると発生するクラッシュが修正されました。

4/26/2021

機能強化

  • 分散処理ジョブのサポートが追加されました。処理ジョブの実行時に複数のインスタンスを使用できます。

  • Data Wrangler の処理ジョブは、推定される結果サイズが 1 ギガバイト未満の場合、小さな出力を自動的に結合するようになりました。

  • Feature Store ノートブック: Feature Store の取り込みパフォーマンスが改善されました。

  • Data Wrangler の処理ジョブは、今後のリリースで 1.x を権限のあるコンテナタグとして使用するようになりました。

バグ修正

  • ファセットヒストグラムのレンダリングの問題が修正されました。

  • ベクトル型の列をサポートするように、処理ジョブへのエクスポートが修正されました。

  • 正規表現 (regex) に 1 つ以上含まれる場合、最初にキャプチャされたグループを返すように Extract using regex 演算子が修正されました。

2/8/2021

新しい機能

  • Data Wrangler フローは複数のインスタンスをサポートします。

  • 2.20.0 を使用する SageMaker SDKように Data Wrangler ジョブノートブックへのエクスポートを更新しました。

  • 2.20.0 を使用する SageMaker SDKようにパイプラインへのエクスポートノートブックを更新しました。

  • パイプラインへのエクスポートノートブックを更新し、オプションのステップとしてXGBoostトレーニング例を追加しました。

機能強化:

  • パフォーマンスを向上させるために、1 つのフィールドに複数の行を含むCSVファイルのインポートはサポートされなくなりました。

バグ修正

  • クイックモデルにおける型の推論の問題が修正されました。

  • バイアスレポートのバイアスメトリクスのバグが修正されました。

  • [Feature Text] (テキストを特徴化) 変換が、欠落値のある列で動作するように修正されました。

  • 配列のような列を含むデータセットで動作するように、ヒストグラムと散布図の組み込みビジュアライゼーションが修正されました。

  • クエリ実行 ID の有効期限が切れた場合、Athena クエリが再実行されるようになりました。