データフローステップを編集する - Amazon SageMaker AI

翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。

データフローステップを編集する

Amazon SageMaker Canvas では、データフロー内の個々のステップを編集して、新しいデータフローを作成せずにデータセットを変換できます。次のページでは、結合および連結のステップとデータソースのステップを編集する方法について説明します。

結合および連結のステップを編集する

データフロー内では、結合ステップと連結ステップを柔軟に編集できます。データ処理ワークフローに必要な調整を行い、データフロー全体をやり直すことなく、データを適切に組み合わせて変換できます。

データフローの結合または連結ステップを編集するには、次の手順を実行します。

  1. データフローを開きます。

  2. 編集する結合ノードまたは連結ノードの横にあるプラスアイコン () を選択します。

  3. コンテキストメニューから [編集] を選択します。

  4. サイドパネルが開き、結合または連結の詳細を編集できるようになります。結合のタイプなどの、ステップフィールドを変更します。データノードを交換し、結合または連結する別のノードを選択するには、ノードの横にある削除アイコンを選択して、データフロービューで、変換に含める新しいノードを選択します。

    注記

    編集プロセス中にノードを交換する場合は、結合または連結操作の前に発生するステップのみを選択できます。左ノードと右ノードのどちらでも交換できますが、一度に交換できるノードは 1 つだけです。さらに、ソースノードを置き換え先として選択することはできません。

  5. [プレビュー] を選択して、結合操作の結果を表示します。

  6. [更新] を選択して変更を保存します。

データフローが更新されているはずです。

データソースステップを編集または置換する

元のデータに適用された変換とデータフローステップを削除せずに、データソースまたはデータセットを変更する必要が生じることがあります。Data Wrangler 内では、データフローのステップを維持しながら、データソース設定を編集または置換できます。データソースを編集するときは、サンプリングサイズや方法、高度な設定などのインポート設定を変更できます。また、同じスキーマを持つファイルを追加することもできます。あるいは、Amazon Athena などのクエリベースのデータソースの場合には、クエリを編集できます。データソースを置換する場合は、新しいデータのスキーマが元のデータと一致する限り、別のデータセットを選択するか、別のデータソースからデータを完全にインポートできます。

データソース設定を編集するには、次の操作を行います。

  1. Canvas アプリケーションで、[Data Wrangler] ページに移動します。

  2. データフローを選択して表示します。

  3. データフローステップを示す [データフロー] タブで、編集する [ソース] ノードを見つけます。

  4. [ソース] ノードの横にある省略記号アイコンを選択します。

  5. コンテキストメニューから [編集] を選択します。

  6. Amazon S3 データソースとローカルアップロードでは、元のデータと同じスキーマを持つファイルをさらに選択またはアップロードできます。Amazon Athena などのクエリベースのデータソースでは、ビジュアルクエリビルダーで異なるテーブルを削除して選択することも、SQL クエリを直接編集することもできます。終了したら、[次へ] を選択します。

  7. [インポート設定] で、必要な変更を加えます。

  8. 完了したら、[変更を保存] を選択します。

これでデータソースが更新されるはずです。

データソースを置換するには、以下を実行します。

  1. Canvas アプリケーションで、[Data Wrangler] ページに移動します。

  2. データフローを選択して表示します。

  3. データフローステップを示す [データフロー] タブで、編集する [ソース] ノードを見つけます。

  4. [ソース] ノードの横にある省略記号アイコンを選択します。

  5. コンテキストメニューから、[置換] を選択します 。

  6. データフローエクスペリエンスを作成して、別のデータソースとデータを選択します。

  7. データを選択し、ソースノードを更新する準備ができたら、[保存] を選択します。

これで、ソースノードがデータフロー内で更新されます。