翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
SageMaker スマートふるい分け Python SDKリファレンス
このページでは、トレーニングスクリプトに SageMaker スマートふるい分けを適用するために必要な Python モジュールのリファレンスを提供します。
SageMaker スマートふるい分け設定モジュール
class
smart_sifting.sift_config.sift_configs.RelativeProbabilisticSiftConfig()
SageMaker スマートふるい分け設定クラス。
パラメータ
-
beta_value
(浮動小数点) – ベータ (定数) 値。これは、損失値履歴の損失のパーセンタイルに基づいて、トレーニング用のサンプルを選択する確率を計算するために使用されます。ベータ値を下げると、篩過されるデータの割合が低くなり、それを上げると篩過されるデータの割合が高くなります。ベータ値には、正の値以外は最小値または最大値はありません。次のリファレンステーブルは、 に関するレートをふるい分けるための情報を示していますbeta_value
。beta_value
保持されるデータの割合 (%) 除外されたデータの割合 (%) 0.1 90.91 9.01 0.25 80 20 0.5 66.67 33.33 1 50 50 2 33.33 66.67 3 25 75 10 9.09 90.92 100 0.99 99.01 -
loss_history_length
(int) – 相対しきい値損失ベースのサンプリング用に保存する以前のトレーニング損失の数。 -
loss_based_sift_config
(dict またはLossConfig
オブジェクト) — SageMaker スマートふるい分け損失インターフェイス設定を返すLossConfig
オブジェクトを指定します。
class
smart_sifting.sift_config.sift_configs.LossConfig()
クラス の loss_based_sift_config
パラメータの設定RelativeProbabilisticSiftConfig
クラス。
パラメータ
-
sift_config
(dict またはSiftingBaseConfig
オブジェクト) — ふるい分けベース設定ディクショナリを返すSiftingBaseConfig
オブジェクトを指定します。
class
smart_sifting.sift_config.sift_configs.SiftingBaseConfig()
の sift_config
パラメータの設定クラスLossConfig
。
パラメータ
-
sift_delay
(int) – ふるい分けを開始する前に待機するトレーニングステップの数。モデル内のすべてのレイヤーがトレーニングデータを十分に把握した後、ふるい分けを開始することをお勧めします。デフォルト値は1000
です。 -
repeat_delay_per_epoch
(bool) – エポックごとにふるい分けを遅らせるかどうかを指定します。デフォルト値はFalse
です。
SageMaker スマートふるい分けデータバッチ変換モジュール
class
smart_sifting.data_model.data_model_interface.SiftingBatchTransform
バッチ変換の実行方法を定義するための SageMaker スマートふるい分け Python モジュール。これを使用して、トレーニングデータのデータ形式を SiftingBatch
形式に変換するバッチ変換クラスを設定できます。 SageMaker スマートふるい分けは、この形式のデータをふるい分けバッチにサイフトして蓄積できます。
class
smart_sifting.data_model.data_model_interface.SiftingBatch
ふるい分けと蓄積が可能なバッチデータ型を定義するインターフェイス。
class
smart_sifting.data_model.list_batch.ListBatch
ふるい分け用のリストバッチを追跡するためのモジュール。
class
smart_sifting.data_model.tensor_batch.TensorBatch
ふるい分け用のテンソルバッチを追跡するためのモジュール。
SageMaker スマートふるい分け損失実装モジュール
class
smart_sifting.loss.abstract_sift_loss_module.Loss
SageMaker スマートふるい分けインターフェイスを PyTorchベースのモデルの損失関数に登録するためのラッパーモジュール。
SageMaker スマートふるい分けデータローダーラッパーモジュール
class
smart_sifting.dataloader.sift_dataloader.SiftingDataloader
スマート SageMaker ふるい分けインターフェイスを PyTorchベースのモデルのデータローダーに登録するためのラッパーモジュール。
Main Sifting Dataloader イテレータは、sift 設定に基づいて、データローダーからトレーニングサンプルをふるい分けます。
パラメータ
-
sift_config
(dict またはRelativeProbabilisticSiftConfig
オブジェクト) –RelativeProbabilisticSiftConfig
オブジェクト。 -
orig_dataloader
( PyTorch DataLoader オブジェクト) — ラップする PyTorch Dataloader オブジェクトを指定します。 -
batch_transforms
(SiftingBatchTransform
オブジェクト) – (オプション) データ形式が SageMaker スマートふるい分けライブラリのデフォルト変換でサポートされていない場合は、SiftingBatchTransform
モジュールを使用してバッチ変換クラスを作成する必要があります。このパラメータは、バッチ変換クラスを渡すために使用されます。このクラスはSiftingDataloader
、 SageMaker スマートふるい分けアルゴリズムが受け入れることができる形式にデータを変換するために使用されます。 -
model
( PyTorch モデルオブジェクト) – 元の PyTorchモデル -
loss_impl
( のふるい分け損失関数smart_sifting.loss.abstract_sift_loss_module.Loss
) –Loss
モジュールで設定され、損失関数をラップするふるい分け PyTorch 損失関数。 -
log_batch_data
(bool) – バッチデータをログに記録するかどうかを指定します。に設定するとTrue
、 SageMaker スマートふるい分けは、保持またはふるい分けされたバッチの詳細を記録します。パイロットトレーニングジョブでのみオンにすることをお勧めします。ログ記録がオンになると、サンプルは にロードGPUされCPU、 に転送されます。これによりオーバーヘッドが発生します。デフォルト値はFalse
です。