翻訳は機械翻訳により提供されています。提供された翻訳内容と英語版の間で齟齬、不一致または矛盾がある場合、英語版が優先します。
データフローステップを編集する
Amazon SageMaker Canvas では、データフロー内の個々のステップを編集して、新しいデータフローを作成せずにデータセットを変換できます。次のページでは、結合および連結のステップとデータソースのステップを編集する方法について説明します。
結合および連結のステップを編集する
データフロー内では、結合ステップと連結ステップを柔軟に編集できます。データ処理ワークフローに必要な調整を行い、データフロー全体をやり直すことなく、データを適切に組み合わせて変換できます。
データフローの結合または連結ステップを編集するには、次の手順を実行します。
-
データフローを開きます。
-
編集する結合ノードまたは連結ノードの横にあるプラスアイコン (+) を選択します。
-
コンテキストメニューから [編集] を選択します。
-
サイドパネルが開き、結合または連結の詳細を編集できるようになります。結合のタイプなどの、ステップフィールドを変更します。データノードを交換し、結合または連結する別のノードを選択するには、ノードの横にある削除アイコンを選択して、データフロービューで、変換に含める新しいノードを選択します。
注記
編集プロセス中にノードを交換する場合は、結合または連結操作の前に発生するステップのみを選択できます。左ノードと右ノードのどちらでも交換できますが、一度に交換できるノードは 1 つだけです。さらに、ソースノードを置き換え先として選択することはできません。
-
[プレビュー] を選択して、結合操作の結果を表示します。
-
[更新] を選択して変更を保存します。
データフローが更新されているはずです。
データソースステップを編集または置換する
元のデータに適用された変換とデータフローステップを削除せずに、データソースまたはデータセットを変更する必要が生じることがあります。Data Wrangler 内では、データフローのステップを維持しながら、データソース設定を編集または置換できます。データソースを編集するときは、サンプリングサイズや方法、高度な設定などのインポート設定を変更できます。また、同じスキーマを持つファイルを追加することもできます。あるいは、Amazon Athena などのクエリベースのデータソースの場合には、クエリを編集できます。データソースを置換する場合は、新しいデータのスキーマが元のデータと一致する限り、別のデータセットを選択するか、別のデータソースからデータを完全にインポートできます。
データソース設定を編集するには、次の操作を行います。
-
Canvas アプリケーションで、[Data Wrangler] ページに移動します。
-
データフローを選択して表示します。
-
データフローステップを示す [データフロー] タブで、編集する [ソース] ノードを見つけます。
-
[ソース] ノードの横にある省略記号アイコンを選択します。
-
コンテキストメニューから [編集] を選択します。
-
Amazon S3 データソースとローカルアップロードでは、元のデータと同じスキーマを持つファイルをさらに選択またはアップロードできます。Amazon Athena などのクエリベースのデータソースでは、ビジュアルクエリビルダーで異なるテーブルを削除して選択することも、SQL クエリを直接編集することもできます。終了したら、[次へ] を選択します。
-
[インポート設定] で、必要な変更を加えます。
-
完了したら、[変更を保存] を選択します。
これでデータソースが更新されるはずです。
データソースを置換するには、以下を実行します。
-
Canvas アプリケーションで、[Data Wrangler] ページに移動します。
-
データフローを選択して表示します。
-
データフローステップを示す [データフロー] タブで、編集する [ソース] ノードを見つけます。
-
[ソース] ノードの横にある省略記号アイコンを選択します。
-
コンテキストメニューから、[置換] を選択します 。
-
データフローエクスペリエンスを作成して、別のデータソースとデータを選択します。
-
データを選択し、ソースノードを更新する準備ができたら、[保存] を選択します。
これで、ソースノードがデータフロー内で更新されます。