기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.

# 데이터 세트 생성
<a name="creating-data-sets"></a>

 Amazon Quick의 새 데이터 소스 또는 기존 데이터 소스에서 데이터 세트를 생성할 수 있습니다. 다양한 데이터베이스 데이터 소스를 사용하여 Amazon Quick에 데이터를 제공할 수 있습니다. 여기에는 Amazon RDS 인스턴스와 Amazon Redshift 클러스터가 포함됩니다. 또한 조직, Amazon EC2 또는 유사한 환경의 MariaDB, Microsoft SQL Server, MySQL, Oracle 및 PostgreSQL 인스턴스도 포함됩니다.

**Topics**
+ [새 데이터 소스를 사용하여 데이터 세트 생성](creating-data-sets-new.md)
+ [기존 데이터 소스를 사용하여 데이터 세트 생성](create-a-data-set-existing.md)
+ [Amazon Quick에서 기존 데이터 세트를 사용하여 데이터 세트 생성](create-a-dataset-existing-dataset.md)

# 새 데이터 소스를 사용하여 데이터 세트 생성
<a name="creating-data-sets-new"></a>

Amazon RDS, Amazon Redshift 또는 Amazon EC2와 같은 AWS 서비스를 기반으로 데이터 세트를 생성하는 경우 해당 소스의 데이터를 사용할 때 데이터 전송 요금이 적용될 수 있습니다. 이러한 요금은 해당 AWS 리소스가 Amazon Quick 계정에 대해 AWS 리전 선택한 홈에 있는지 여부에 따라 달라질 수도 있습니다. 요금에 대한 자세한 내용은 해당 서비스에 대한 요금 페이지를 참조하십시오.

새 데이터베이스 데이터 세트를 생성하는 경우 테이블을 한 개만 선택하거나, 여러 테이블을 조인하거나, SQL 쿼리를 만들어 원하는 데이터를 검색할 수 있습니다. 또한 데이터 세트가 직접 쿼리를 사용하거나 [SPICE](spice.md)에 데이터를 저장할지 여부를 변경할 수도 있습니다.

**데이터세트 생성**

1. 데이터 세트를 생성하려면 **데이터 페이지에서 새 데이터 세트를** 선택합니다. **** 그런 다음 기존 데이터 세트 또는 데이터 소스를 기반으로 데이터 세트를 생성하거나 새 데이터 소스에 연결해 해당 데이터 소스를 기반으로 데이터 세트를 생성할 수 있습니다.

1. 데이터 소스에 연결 정보를 제공합니다.
   + 로컬 텍스트 또는 Microsoft Excel 파일의 경우 간단하게 파일 위치를 식별하여 파일을 업로드할 수 있습니다.
   + Amazon S3의 경우 사용하려는 파일 또는 버킷을 식별하는 매니페스트와 대상 파일에 대한 가져오기 설정을 제공해야 합니다.
   + Amazon Athena의 경우 AWS 계정에 대한 모든 Athena 데이터베이스가 반환됩니다. 추가 자격 증명은 필요하지 않습니다.
   + Salesforce의 경우 연결에 사용할 자격 증명을 제공합니다.
   + Amazon Redshift, Amazon RDS, Amazon EC2 또는 기타 데이터베이스 데이터 소스의 경우 데이터를 호스팅하는 서버 및 데이터베이스에 대한 정보를 제공합니다. 또한 해당 데이터베이스 인스턴스에 대해 유효한 보안 인증 정보를 제공합니다.

# 데이터베이스에서 데이터 세트 생성
<a name="create-a-database-data-set"></a>

다음 절차는 데이터베이스 데이터 소스에 연결하고 데이터 세트를 생성하는 방법을 안내합니다. Amazon Quick 계정이 자동 검색한 AWS 데이터 소스에서 데이터 세트를 생성하려면를 사용합니다[자동 검색된 Amazon Redshift 클러스터 또는 Amazon RDS 인스턴스에서 데이터 세트 생성](#create-a-data-set-autodiscovered). 다른 데이터베이스 데이터 소스에서 데이터 세트를 생성하려면 [자동으로 검색되지 않은 데이터베이스를 사용하여 데이터 세트 생성](#create-a-data-set-database)을(를) 사용하십시오.

## 자동 검색된 Amazon Redshift 클러스터 또는 Amazon RDS 인스턴스에서 데이터 세트 생성
<a name="create-a-data-set-autodiscovered"></a>

자동 검색된 AWS 데이터 소스에 연결하려면 다음 절차에 따르십시오.

**자동 검색된 AWS 데이터 소스에 대한 연결을 생성하려면**

1. 대상 테이블 또는 쿼리가 데이터 소스 할당량을 초과하지 않도록 [데이터 소스 할당량](data-source-limits.md)을(를) 확인합니다.

1. 사용하려는 데이터베이스 자격 증명이 [필수 권한](required-permissions.md)에 설명된 대로 적절한 권한이 있는지 확인합니다.

1. 의 지침에 따라 Amazon Quick Access용 클러스터 또는 인스턴스를 구성했는지 확인합니다[네트워크 및 데이터베이스 구성 요구 사항](configure-access.md).

1. Amazon 빠른 시작 페이지에서 **데이터를** 선택합니다.

1. **생성을 ** 선택한 다음 **새 데이터 세트를** 선택합니다.

1. 연결하려는 AWS 서비스에 따라 **RDS** 또는 **Redshift 자동 검색** 아이콘을 선택합니다.

1. 다음과 같이 데이터 원본의 연결 정보를 입력합니다.
   + **Data source name(데이터 소스 이름)**에 데이터 소스의 이름을 입력합니다.
   + **인스턴스 ID**에서 연결할 인스턴스 또는 클러스터의 이름을 선택합니다.
   + [**Database name**]은 [**Instance ID**] 클러스터 또는 인스턴스에 대한 기본 데이터베이스를 표시합니다. 해당 클러스터 또는 인스턴스에서 다른 데이터베이스를 사용하려면 해당 이름을 입력합니다.
   + **사용자 이름**에 다음을 수행할 수 있는 권한이 있는 사용자 계정의 사용자 이름을 입력합니다.
     + 대상 데이터베이스에 액세스합니다.
     + 사용하려는 해당 데이터베이스의 테이블을 읽습니다(`SELECT` 문 수행).
   + **암호**에 입력한 계정의 암호를 입력합니다.

1. [**Validate connection**]을 선택하여 연결 정보가 올바른지 확인합니다.

1. 연결이 확인되면 [**Create data source**]를 선택합니다. 그렇지 않은 경우 연결 정보를 수정하고 다시 확인합니다.
**참고**  
Amazon Quick은 Secure Sockets Layer(SSL)를 사용하여 Amazon RDS 인스턴스 및 Amazon Redshift 클러스터에 대한 연결을 자동으로 보호합니다. 이 기능을 활성화하는 데 어떤 조치도 필요하지 않습니다.

1. 다음 중 하나를 선택합니다.
   + **사용자 지정 SQL**

     다음 화면에서 **사용자 지정 SQL 사용** 옵션으로 쿼리 작성을 선택합니다. 이렇게 하면 쿼리 이름과 SQL을 입력할 수 있는 **Enter custom SQL query(사용자 지정 SQL 쿼리 입력)**라는 이름의 화면이 열립니다. 최상의 결과를 얻으려면 SQL 편집기에 쿼리를 작성한 다음 이 창에 붙여 넣습니다. 이름과 쿼리를 입력한 후 **데이터 편집/미리 보기**나 **쿼리 확인**을 선택할 수 있습니다. **데이터 편집/미리 보기**를 선택하면 즉시 데이터를 준비할 수 있습니다. **쿼리 확인**을 선택하면 SQL에 오류가 없는지 확인할 수 있습니다.
   + **테이블 선택**

     특정 테이블에 연결하려면, **스키마: 테이블 세트 포함**에서 **선택**을 선택한 다음 스키마를 선택합니다. 데이터베이스에 단일 스키마만 있는 몇몇 경우, 해당 스키마가 자동으로 선택되고 스키마 선택 옵션이 표시되지 않습니다.

     분석을 만들기 전에 데이터를 준비하려면 [**Edit/Preview data**]를 선택하여 데이터 준비를 엽니다. 테이블을 더 많이 조인하려면 이 옵션을 사용합니다.

     그렇지 않으면 테이블을 선택한 다음 **선택**을 선택합니다.

1. 다음 옵션 중 하나를 선택하세요.
   + 분석을 생성하기 전에 데이터를 준비합니다. 이렇게 하려면 **Edit/Preview data(데이터 편집/미리 보기)**를 선택하여 선택한 테이블에 대한 데이터 준비를 엽니다. 데이터 준비에 대한 자세한 내용은 [데이터 세트 준비 예제](preparing-data-sets.md) 단원을 참조하십시오.
   + 테이블 데이터를 있는 그대로 사용하여 데이터 세트 및 분석을 생성하고 성능 향상을 위해 데이터 세트 데이터를 SPICE(으)로 가져옵니다(권장). 이렇게 하려면 테이블 크기와 SPICE 표시기를 확인하여 충분한 용량이 있는지 확인합니다.

     SPICE 용량이 충분하면 더 빠른 분석을 위해 SPICE로 가져오기를 선택한 다음 시각화를 사용하여 분석을 생성합니다.
**참고**  
SPICE를 사용하고 싶지만 공간이 부족한 경우 **데이터 편집/미리 보기**를 선택합니다. 데이터 준비 시 데이터 세트에서 필드를 제거하여 크기를 줄일 수 있습니다. 필터를 적용하거나 반환되는 행 또는 열 수를 줄이는 SQL 쿼리를 작성할 수도 있습니다. 데이터 준비에 대한 자세한 내용은 [데이터 세트 준비 예제](preparing-data-sets.md) 단원을 참조하십시오.
   + 테이블 데이터를 있는 그대로 사용하여 데이터 세트 및 분석을 생성하고 데이터베이스에서 직접 데이터를 쿼리할 수 있도록 하려면, **데이터 직접 쿼리** 옵션을 선택합니다. 그런 다음 **Visualize(시각화)**를 선택하여 분석을 생성합니다.

## 자동으로 검색되지 않은 데이터베이스를 사용하여 데이터 세트 생성
<a name="create-a-data-set-database"></a>

자동으로 검색된 Amazon Redshift 클러스터 또는 Amazon RDS 인스턴스 이외의 다른 데이터베이스에 연결하려면 다음 절차에 따르십시오. 이러한 데이터베이스에는 Amazon Redshift 클러스터와 다른에 AWS 리전 있거나 다른 AWS 계정과 연결된 Amazon RDS 인스턴스가 포함됩니다. 또한 온프레미스, Amazon EC2 또는 다른 액세스 가능한 환경의 MariaDB, Microsoft SQL Server, MySQL, Oracle 및 PostgreSQL 인스턴스도 포함됩니다.

**자동 검색된 Amazon Redshift 클러스터 또는 RDS 인스턴스가 아닌 데이터베이스에 대한 연결 생성하기**

1. 대상 테이블 또는 쿼리가 데이터 소스 할당량을 초과하지 않도록 [데이터 소스 할당량](data-source-limits.md)을(를) 확인합니다.

1. 사용하려는 데이터베이스 자격 증명이 [필수 권한](required-permissions.md)에 설명된 대로 적절한 권한이 있는지 확인합니다.

1. 의 지침에 따라 Amazon Quick Access용 클러스터 또는 인스턴스를 구성했는지 확인합니다[네트워크 및 데이터베이스 구성 요구 사항](configure-access.md).

1. Amazon 빠른 시작 페이지에서 **데이터 관리를** 선택합니다.

1. **생성을 ** 선택한 다음 **새 데이터 세트를** 선택합니다.

1. 다른의 Amazon **Redshift 클러스터에 연결하거나 다른 계정과 연결하려면 Redshift 수동** 연결 아이콘을 선택합니다. AWS 리전 AWS 또는 해당 데이터베이스 관리 시스템 아이콘을 선택하여 Amazon Aurora, MariaDB, Microsoft SQL Server, MySQL, Oracle 또는 PostgreSQL의 인스턴스에 연결합니다.

1. 다음과 같이 데이터 원본의 연결 정보를 입력합니다.
   + **Data source name(데이터 소스 이름)**에 데이터 소스의 이름을 입력합니다.
   + **Database server(데이터베이스 서버)**에 다음 값 중 하나를 입력합니다.
     + Amazon Redshift 클러스터 또는 Amazon RDS 인스턴스의 경우, 포트 번호 없이 클러스터 또는 인스턴스의 엔드포인트를 입력합니다. 예를 들어, 엔드포인트 값이 `clustername.1234abcd.us-west-2.redshift.amazonaws.com:1234`인 경우 `clustername.1234abcd.us-west-2.redshift.amazonaws.com`을(를) 입력합니다. AWS 콘솔의 클러스터 또는 인스턴스 세부 정보 페이지의 **엔드포인트** 필드에서 엔드포인트 값을 가져올 수 있습니다.
     + MariaDB, Microsoft SQL Server, MySQL, Oracle 또는 PostgreSQL의 Amazon EC2 인스턴스에는 퍼블릭 DNS 주소를 입력합니다. Amazon EC2 콘솔의 인스턴스 세부 정보 창의 **퍼블릭 DNS** 필드에서 퍼블릭 DNS 값을 가져올 수 있습니다.
     + MariaDB, Microsoft SQL Server, MySQL, Oracle 또는 PostgreSQL의 비 Amazon EC2 인스턴스에는 데이터베이스 서버의 호스트 이름 또는 퍼블릭 IP 주소를 입력합니다. 안전한 연결을 위해 Secure Sockets Layer(SSL)을 사용하는 경우(권장), SSL 인증서에 필요한 정보와 일치하는 호스트 이름을 입력해야 할 수 있습니다. 수락되는 인증서 목록은 [Amazon Quick SSL 및 CA 인증서](configure-access.md#ca-certificates) 단원을 참조하십시오.
   + **포트**에 클러스터 또는 인스턴스가 연결에 사용하는 포트를 입력합니다.
   + **데이터베이스 이름**에 사용할 데이터베이스의 이름을 입력합니다.
   + **사용자 이름**에 다음을 수행할 수 있는 권한이 있는 사용자 계정의 사용자 이름을 입력합니다.
     + 대상 데이터베이스에 액세스합니다.
     + 사용하려는 해당 데이터베이스의 테이블을 읽습니다(`SELECT` 문 수행).
   + **암호**에 입력한 계정과 연결된 암호를 입력합니다.

1. (선택 사항) Amazon Redshift 클러스터 이외에 다른 것에 연결 중이거나 보안 연결을 원하지 않는 경우 **SSL 활성화**를 선택 취소해야 합니다. 하지만, 비보안 연결은 변조될 가능성이 있으므로 *이 항목을 선택한 상태로 두는 것이 좋습니다*.

   대상 인스턴스가 SSL을 사용하는 방법에 대한 자세한 내용은 대상 데이터베이스 관리 시스템에 대한 문서를 참조하십시오. Amazon Quick은 자체 서명된 SSL 인증서를 유효한 것으로 수락하지 않습니다. 수락되는 인증서 목록은 [Amazon Quick SSL 및 CA 인증서](configure-access.md#ca-certificates) 단원을 참조하십시오.

   Amazon Quick은 SSL을 사용하여 Amazon Redshift 클러스터에 대한 연결을 자동으로 보호합니다. 이 기능을 활성화하는 데 어떤 조치도 필요하지 않습니다.

   Presto 및 Apache Spark와 같은 일부 데이터베이스는 Amazon Quick이 연결하기 전에 추가 요구 사항을 충족해야 합니다. 자세한 내용은 [Presto를 사용하여 데이터 소스 생성](create-a-data-source-presto.md) 또는 [Apache Spark를 사용하여 데이터 소스 생성](create-a-data-source-spark.md) 단원을 참조하십시오.

1. (선택 사항) [**Validate connection**]을 선택하여 연결 정보가 올바른지 확인합니다.

1. 연결이 확인되면 [**Create data source**]를 선택합니다. 그렇지 않은 경우 연결 정보를 수정하고 다시 확인합니다.

1. 다음 중 하나를 선택합니다.
   + **사용자 지정 SQL**

     다음 화면에서 **사용자 지정 SQL 사용** 옵션으로 쿼리 작성을 선택합니다. 이렇게 하면 쿼리 이름과 SQL을 입력할 수 있는 **Enter custom SQL query(사용자 지정 SQL 쿼리 입력)**라는 이름의 화면이 열립니다. 최상의 결과를 얻으려면 SQL 편집기에 쿼리를 작성한 다음 이 창에 붙여 넣습니다. 이름과 쿼리를 입력한 후 **데이터 편집/미리 보기**나 **쿼리 확인**을 선택할 수 있습니다. **데이터 편집/미리 보기**를 선택하면 즉시 데이터를 준비할 수 있습니다. **쿼리 확인**을 선택하면 SQL에 오류가 없는지 확인할 수 있습니다.
   + **테이블 선택**

     특정 테이블에 연결하려면, **스키마: 테이블 세트 포함**에서 **선택**을 선택한 다음 스키마를 선택합니다. 데이터베이스에 단일 스키마만 있는 몇몇 경우, 해당 스키마가 자동으로 선택되고 스키마 선택 옵션이 표시되지 않습니다.

     분석을 만들기 전에 데이터를 준비하려면 [**Edit/Preview data**]를 선택하여 데이터 준비를 엽니다. 테이블을 더 많이 조인하려면 이 옵션을 사용합니다.

     그렇지 않으면 테이블을 선택한 다음 **선택**을 선택합니다.

1. 다음 옵션 중 하나를 선택하세요.
   + 분석을 생성하기 전에 데이터를 준비합니다. 이렇게 하려면 **Edit/Preview data(데이터 편집/미리 보기)**를 선택하여 선택한 테이블에 대한 데이터 준비를 엽니다. 데이터 준비에 대한 자세한 내용은 [데이터 세트 준비 예제](preparing-data-sets.md) 단원을 참조하십시오.
   + 테이블 데이터를 있는 그대로 사용하여 데이터 세트 및 분석을 생성하고 성능 향상을 위해 데이터 세트 데이터를 SPICE(으)로 가져옵니다(권장). 이렇게 하려면 테이블 크기와 SPICE 표시기를 확인하여 충분한 공간이 있는지 확인합니다.

     SPICE 용량이 충분하면 더 빠른 분석을 위해 SPICE로 가져오기를 선택한 다음 시각화를 사용하여 분석을 생성합니다.
**참고**  
SPICE를 사용하고 싶지만 공간이 부족한 경우 **데이터 편집/미리 보기**를 선택합니다. 데이터 준비 시 데이터 세트에서 필드를 제거하여 크기를 줄일 수 있습니다. 필터를 적용하거나 반환되는 행 또는 열 수를 줄이는 SQL 쿼리를 작성할 수도 있습니다. 데이터 준비에 대한 자세한 내용은 [데이터 세트 준비 예제](preparing-data-sets.md) 단원을 참조하십시오.
   + 테이블 데이터를 있는 그대로 사용하여 데이터 세트 및 분석을 생성하고 데이터베이스에서 직접 데이터를 쿼리합니다. 이렇게 하려면 **Directly query your data(데이터 직접 쿼리)** 옵션을 선택합니다. 그런 다음 **Visualize(시각화)**를 선택하여 분석을 생성합니다.

# 기존 데이터 소스를 사용하여 데이터 세트 생성
<a name="create-a-data-set-existing"></a>

Salesforce, AWS 데이터 스토어 또는 기타 데이터베이스 데이터 소스에 처음 연결한 후 Amazon Quick은 연결 정보를 저장합니다. **데이터 세트 생성** 페이지의 **기존 데이터 소스에서 생성** 섹션에 데이터 소스가 추가됩니다. 이러한 기존 데이터 소스를 사용하여 연결 정보를 다시 지정하지 않고 새 데이터 세트를 생성할 수 있습니다.

## 기존 Amazon S3 데이터 소스를 사용하여 데이터 세트 생성
<a name="create-a-data-set-existing-s3"></a>

기존 Amazon S3 데이터 소스를 사용하여 데이터 세트를 생성하려면 다음 절차에 따르십시오.

**기존 S3 데이터 소스를 사용하여 데이터 세트 생성하기**

1. Amazon 빠른 시작 페이지에서 **데이터를** 선택합니다.

1. **생성을** 선택한 다음 **새 데이터 세트를** 선택합니다.

1. 사용할 Amazon S3 데이터 소스를 선택합니다.

1. 데이터 세트를 만들기 전에 데이터를 준비하려면 **데이터 편집/미리 보기**를 선택합니다. 데이터를 있는 그대로 사용하여 분석을 생성하려면 **Visualize(시각화)**를 선택합니다.

## 기존 Amazon Athena 데이터 소스를 사용하여 데이터 세트 생성
<a name="create-a-data-set-existing-athena"></a>

기존 Amazon Athena 데이터 소스를 사용하여 데이터 세트를 생성하려면 다음 절차를 따르십시오.

**기존 Athena 연결 프로필에서 데이터 세트 생성하기**

1. Amazon 빠른 시작 페이지에서 **데이터를** 선택합니다.

1. **생성을 ** 선택한 다음 **새 데이터 세트를** 선택합니다.

   사용하려는 기존 데이터 소스의 연결 프로필 아이콘을 선택합니다. 연결 프로필에는 데이터 소스 아이콘과 연결을 만든 사람이 제공한 이름이 레이블로 표시됩니다.

1. **데이터 세트 생성**을 선택합니다.

   Amazon Quick은 Athena 작업 그룹만을 기반으로이 데이터 소스에 대한 연결 프로파일을 생성합니다. 데이터베이스와 테이블은 저장되지 않습니다.

1. **테이블 선택** 화면에서 다음 중 하나를 수행하십시오.
   + SQL 쿼리를 작성하려면 **사용자 지정 SQL 사용**을 선택합니다.
   + 데이터베이스와 테이블을 선택하려면 먼저 데이터베이스 목록에서 **데이터베이스**를 선택합니다. 그런 다음, 데이터베이스에 대해 나타나는 목록에서 테이블을 선택합니다.

## 기존 Salesforce 데이터 소스를 사용하여 데이터 세트 생성
<a name="create-a-data-set-existing-salesforce"></a>

기존 Salesforce 데이터 소스를 사용하여 데이터 세트를 생성하려면 다음 절차에 따르십시오.

**기존 Salesforce 데이터 소스를 사용하여 데이터 세트를 생성하기**

1. Amazon 빠른 시작 페이지에서 **데이터를** 선택합니다.

1. **생성을 ** 선택한 다음 **새 데이터 세트를** 선택합니다.

1. 사용할 Salesforce 데이터 소스를 선택합니다.

1. [**Create Data Set**]를 선택합니다.

1. 다음 중 하나를 선택합니다.
   + **사용자 지정 SQL**

     다음 화면에서 **사용자 지정 SQL 사용** 옵션으로 쿼리 작성을 선택합니다. 이렇게 하면 쿼리 이름과 SQL을 입력할 수 있는 **Enter custom SQL query(사용자 지정 SQL 쿼리 입력)**라는 이름의 화면이 열립니다. 최상의 결과를 얻으려면 SQL 편집기에 쿼리를 작성한 다음 이 창에 붙여 넣습니다. 이름과 쿼리를 입력한 후 **데이터 편집/미리 보기**나 **쿼리 확인**을 선택할 수 있습니다. **데이터 편집/미리 보기**를 선택하면 즉시 데이터를 준비할 수 있습니다. **쿼리 확인**을 선택하면 SQL에 오류가 없는지 확인할 수 있습니다.
   + **테이블 선택**

     특정 테이블에 연결하려면 **데이터 요소: 데이터 포함**에서 **선택**을 선택한 다음 **보고** 또는 **객체**를 선택합니다.

     분석을 만들기 전에 데이터를 준비하려면 [**Edit/Preview data**]를 선택하여 데이터 준비를 엽니다. 테이블을 더 많이 조인하려면 이 옵션을 사용합니다.

     그렇지 않으면 테이블을 선택한 다음 **선택**을 선택합니다.

1. 다음 화면에서 다음 옵션 중 하나를 선택합니다.
   + 데이터를 원본 그대로 사용하여 데이터 세트와 분석을 만들려면 **시각화**를 선택합니다.
**참고**  
[SPICE](spice.md) 용량이 부족한 경우 [**Edit/Preview data**]를 선택합니다. 데이터 준비 중에 데이터 세트에서 필드를 지워 크기를 줄이거나, 반환되는 행의 수를 줄이는 필터를 적용할 수 있습니다. 데이터 준비에 대한 자세한 내용은 [데이터 세트 준비 예제](preparing-data-sets.md) 단원을 참조하십시오.
   + 분석을 만들기 전에 데이터를 준비하려면 [**Edit/Preview data**]를 선택하여, 선택한 보고서나 객체의 데이터 준비를 엽니다. 데이터 준비에 대한 자세한 내용은 [데이터 세트 준비 예제](preparing-data-sets.md) 단원을 참조하십시오.

## 기존 데이터베이스 데이터 소스를 사용하여 데이터 세트 생성
<a name="create-a-data-set-existing-database"></a>

기존 데이터베이스 데이터 소스를 사용하여 데이터 세트를 생성하려면 다음 절차에 따르십시오.

**기존 데이터베이스 데이터 소스를 사용하여 데이터 세트 생성하기**

1. Amazon 빠른 시작 페이지에서 **데이터를** 선택합니다.

1. **생성을** 선택한 다음 **새 데이터 세트를** 선택합니다.

1. 사용할 데이터베이스 데이터 소스를 선택한 다음 **데이터 세트 생성을** 선택합니다.

1. 다음 중 하나를 선택합니다.
   + **사용자 지정 SQL**

     다음 화면에서 **사용자 지정 SQL 사용** 옵션으로 쿼리 작성을 선택합니다. 이렇게 하면 쿼리 이름과 SQL을 입력할 수 있는 **Enter custom SQL query(사용자 지정 SQL 쿼리 입력)**라는 이름의 화면이 열립니다. 최상의 결과를 얻으려면 SQL 편집기에 쿼리를 작성한 다음 이 창에 붙여 넣습니다. 이름과 쿼리를 입력한 후 **데이터 편집/미리 보기**나 **쿼리 확인**을 선택할 수 있습니다. **데이터 편집/미리 보기**를 선택하면 즉시 데이터를 준비할 수 있습니다. **쿼리 확인**을 선택하면 SQL에 오류가 없는지 확인할 수 있습니다.
   + **테이블 선택**

     특정 테이블에 연결하려면, **스키마: 테이블 세트 포함**에서 **선택**을 선택한 다음 스키마를 선택합니다. 데이터베이스에 단일 스키마만 있는 몇몇 경우, 해당 스키마가 자동으로 선택되고 스키마 선택 옵션이 표시되지 않습니다.

     분석을 만들기 전에 데이터를 준비하려면 [**Edit/Preview data**]를 선택하여 데이터 준비를 엽니다. 테이블을 더 많이 조인하려면 이 옵션을 사용합니다.

     그렇지 않으면 테이블을 선택한 다음 **선택**을 선택합니다.

1. 다음 옵션 중 하나를 선택하세요.
   + 분석을 생성하기 전에 데이터를 준비합니다. 이렇게 하려면 **Edit/Preview data(데이터 편집/미리 보기)**를 선택하여 선택한 테이블에 대한 데이터 준비를 엽니다. 데이터 준비에 대한 자세한 내용은 [데이터 세트 준비 예제](preparing-data-sets.md) 단원을 참조하십시오.
   + 테이블 데이터를 있는 그대로 사용하여 데이터 세트 및 분석을 생성하고 성능 향상을 위해 데이터 세트 데이터를 [SPICE](spice.md)(으)로 가져옵니다(권장). 이렇게 하려면 SPICE 표시기를 확인하여 충분한 공간이 있는지 확인합니다.

     SPICE 용량이 충분하면 더 빠른 분석을 위해 SPICE로 가져오기를 선택한 다음 시각화를 사용하여 분석을 생성합니다.
**참고**  
SPICE를 사용하고 싶지만 공간이 부족한 경우 **데이터 편집/미리 보기**를 선택합니다. 데이터 준비 시 데이터 세트에서 필드를 제거하여 크기를 줄일 수 있습니다. 필터를 적용하거나 반환되는 행 또는 열 수를 줄이는 SQL 쿼리를 작성할 수도 있습니다. 데이터 준비에 대한 자세한 내용은 [데이터 세트 준비 예제](preparing-data-sets.md) 단원을 참조하십시오.
   + 테이블 데이터를 있는 그대로 사용하여 데이터 세트 및 분석을 생성하고 데이터베이스에서 직접 데이터를 쿼리합니다. 이렇게 하려면 **Directly query your data(데이터 직접 쿼리)** 옵션을 선택합니다. 그런 다음 **Visualize(시각화)**를 선택하여 분석을 생성합니다.

# Amazon Quick에서 기존 데이터 세트를 사용하여 데이터 세트 생성
<a name="create-a-dataset-existing-dataset"></a>

Amazon Quick에서 데이터 세트를 생성한 후 이를 소스로 사용하여 추가 데이터 세트를 생성할 수 있습니다. 이렇게 하면 상위 데이터 세트에 포함된 모든 데이터 준비(예: 조인 또는 계산된 필드)가 보관됩니다. 새 데이터 조인 및 데이터 필터링과 같은 추가 준비를 새 하위 데이터 세트의 데이터에 추가할 수 있습니다. 또한 하위 데이터 세트에 대한 자체 데이터 새로 고침 일정을 설정하고 이를 사용하는 대시보드 및 분석을 추적할 수 있습니다.

RLS 규칙이 소스로 활성화된 데이터 세트를 사용하여 만든 하위 데이터 세트는 상위 데이터 세트의 RLS 규칙을 상속합니다. 더 큰 상위 데이터 세트에서 하위 데이터 세트를 만드는 사용자는 상위 데이터 세트에서 액세스할 수 있는 데이터만 볼 수 있습니다. 그런 다음 상속된 RLS 규칙 외에도 새 하위 데이터 세트에 더 많은 RLS 규칙을 추가하여 새 데이터 세트에 있는 데이터에 액세스할 수 있는 사용자를 추가로 관리할 수 있습니다. Direct Query에서 RLS 규칙을 활성화한 데이터 세트에서만 하위 데이터 세트를 만들 수 있습니다.

기존 Quick 데이터 세트에서 데이터 세트를 생성하면 다음과 같은 이점이 있습니다.
+ **데이터 세트의 중앙 관리** - 데이터 엔지니어는 조직 내 여러 팀의 요구에 맞게 쉽게 확장할 수 있습니다. 이를 위해 조직의 주요 데이터 모델을 설명하는 몇 가지 범용 데이터 세트를 개발하고 유지 관리할 수 있습니다.
+ **데이터 소스 관리 감소** - 비즈니스 분석가(BAs)는 데이터베이스 액세스를 요청하고, 데이터베이스 자격 증명을 관리하고, 올바른 테이블을 찾고, 빠른 데이터 새로 고침 일정을 관리하는 데 많은 시간과 노력을 소비하는 경우가 많습니다. 기존 데이터 세트를 기반으로 새 데이터 세트를 구축하면 BA가 데이터베이스의 원시 데이터로 처음부터 시작할 필요가 없습니다. 큐레이션된 데이터로 시작할 수 있습니다.
+ **사전 정의된 주요 지표** - 데이터 엔지니어는 기존 데이터 세트에서 데이터 세트를 생성하여 회사의 여러 조직 전반에서 중요한 데이터 정의를 중앙에서 정의하고 유지할 수 있습니다. 매출 성장과 순 한계 수익률을 예로 들 수 있습니다. 이 기능을 사용하면 데이터 엔지니어가 해당 정의의 변경 내용을 배포할 수도 있습니다. 이 접근 방식을 통해 비즈니스 분석가는 올바른 데이터를 보다 빠르고 안정적으로 시각화하는 작업을 시작할 수 있습니다.
+ **데이터를 사용자 지정하는 유연성** - 기존 데이터 세트에서 데이터 세트를 생성함으로써 비즈니스 분석가는 자신의 비즈니스 요구 사항에 맞게 데이터 세트를 보다 유연하게 사용자 지정할 수 있습니다. 이를 통해 다른 팀의 데이터가 손상될 염려를 피할 수 있습니다.

예를 들어 데이터 엔지니어 5명으로 구성된 전자 상거래 중앙 팀의 일원이라고 가정해 보겠습니다. 팀과 함께 데이터베이스의 판매, 주문, 취소 및 반품 데이터에 액세스할 수 있습니다. 스키마를 통해 다른 차원 테이블 18개를 조인하여 빠른 데이터 세트를 생성했습니다. 팀에서 만든 주요 지표는 계산된 필드인 주문 제품 판매(OPS)입니다. 정의는 다음과 같습니다. OPS = 제품 수량 x 가격.

귀사의 팀은 8개국의 10개 팀에 소속된 100명 이상의 비즈니스 분석가에게 서비스를 제공합니다. 이들은 쿠폰 팀, 아웃바운드 마케팅 팀, 모바일 플랫폼 팀, 추천 팀입니다. 이 모든 팀은 OPS 지표를 기반으로 자체 비즈니스 라인을 분석합니다.

수백 개의 연결되지 않은 데이터 세트를 수동으로 만들고 유지 관리하는 대신, 팀은 데이터 세트를 재사용하여 조직 전체의 팀을 위한 여러 수준의 데이터 세트를 만듭니다. 이렇게 하면 데이터 관리가 중앙 집중화되고 각 팀이 각자의 필요에 맞게 데이터를 사용자 지정할 수 있습니다. 이와 동시에 지표 정의 업데이트와 같은 데이터 업데이트가 동기화되고 행 수준 및 열 수준의 보안이 유지됩니다. 예를 들어, 조직의 개별 팀이 중앙화된 데이터 세트를 사용할 수 있습니다. 그런 다음 팀별 데이터와 결합하여 새 데이터세트를 만들고 그 위에 분석을 구축할 수 있습니다.

주요 OPS 지표를 사용하는 것 외에도 조직의 다른 팀은 사용자가 만든 중앙 집중식 데이터 세트의 열 메타데이터를 재사용할 수 있습니다. 예를 들어 데이터 엔지니어링 팀은 이름, 설명, 데이터 유형 및 폴더와 같은 메타데이터를 중앙 집중식 데이터 세트에 정의할 수 있습니다. 이후의 모든 팀에서 이 데이터를 사용할 수 있습니다.

**참고**  
Amazon Quick은 단일 데이터 세트에서 최대 2개의 추가 데이터 세트 수준 생성을 지원합니다.  
예를 들어 상위 데이터 세트에서 하위 데이터 세트를 생성한 다음 총 3개의 데이터 세트 수준에 대한 최하위 데이터 세트를 생성할 수 있습니다.

## 기존 데이터 세트에서 데이터 세트 생성
<a name="create-a-dataset-existing-dataset-how-to"></a>

기존 데이터 세트에서 데이터 세트를 생성하려면 다음 절차를 따르십시오.

**기존 데이터 세트에서 데이터 세트 생성하기**

1. 빠른 시작 페이지의 왼쪽 창에서 **데이터를** 선택합니다.

1. **생성을** 선택한 다음 새 데이터 세트를 생성하는 데 사용할 데이터 세트를 선택합니다.

1. 해당 데이터 세트에 대해 열리는 페이지에서 **분석에 사용**의 드롭다운 메뉴를 선택한 다음 **데이터 세트에서 사용**을 선택합니다.

   데이터 준비 페이지가 열리고 계산된 필드, 조인, 보안 설정을 비롯한 상위 데이터 세트의 모든 항목이 미리 로드됩니다.

1. 표시되는 데이터 준비 페이지에서 왼쪽 하단의 **쿼리 모드**에서 데이터 세트에 원본 상위 데이터 세트의 변경 사항 및 업데이트를 가져오는 방법을 선택합니다. 다음과 같은 옵션을 선택할 수 있습니다.
   + **직접 쿼리** - 기본 쿼리 모드입니다. 이 옵션을 선택하면 관련 데이터 세트, 분석 또는 대시보드를 열 때 이 데이터 세트의 데이터가 자동으로 새로 고쳐집니다. 단, 다음 제한 사항이 적용됩니다.
     + 상위 데이터 세트에서 직접 쿼리를 허용하는 경우 하위 데이터 세트에서 직접 쿼리 모드를 사용할 수 있습니다.
     + 조인에 상위 데이터 세트가 여러 개 있는 경우 모든 부모가 동일한 기본 데이터 소스에서 가져온 경우에만 하위 데이터 세트에 대한 직접 쿼리 모드를 선택할 수 있습니다. 동일한 Amazon Redshift 연결을 예로 들 수 있습니다.
     + 단일 SPICE 상위 데이터 세트에 대해 직접 쿼리가 지원됩니다. 조인의 여러 SPICE 상위 데이터 세트에는 지원되지 않습니다.
   + **SPICE** - 이 옵션을 선택하면 새 데이터 세트가 상위 데이터 세트와 동기화되도록 일정을 설정할 수 있습니다. 데이터 세트의 SPICE 새로 고침 일정 만들기에 대한 자세한 내용은 [SPICE 데이터 새로 고침](refreshing-imported-data.md)을(를) 참조하십시오.

1. (선택 사항) 분석을 위해 데이터를 준비합니다. 데이터 준비에 대한 자세한 내용은 [Amazon Quick Sight에서 데이터 준비](preparing-data.md)을(를) 참조하십시오.

1. (선택 사항) 행 수준 또는 열 수준 보안(RLS/CLS)을 설정하여 데이터 세트에 대한 액세스를 제한합니다. ELS 설정에 대한 자세한 내용은 [사용자 기반 규칙과 함께 행 수준 보안을 사용하여 데이터세트 액세스 제한사용자 기반 규칙 사용](restrict-access-to-a-data-set-using-row-level-security.md)을(를) 참조하십시오. CLS 설정에 대한 자세한 내용은 [열 수준 보안을 사용하여 데이터세트에 대한 액세스 제한](restrict-access-to-a-data-set-using-column-level-security.md)을(를) 참조하십시오.
**참고**  
하위 데이터 세트에만 RLS/CLS를 설정할 수 있습니다. 상위 데이터 세트의 RLS/CLS는 지원되지 않습니다.

1. 작업을 마치면 **저장 및 게시**를 선택하여 변경 내용을 저장하고 새 하위 데이터 세트를 게시합니다. 또는 **게시 및 시각화**를 선택하여 새 하위 데이터 세트를 게시하고 데이터 시각화를 시작합니다.

# 다른 사람이 데이터 세트에서 새 데이터 세트를 만들지 못하도록 제한하기
<a name="restrict-create-dataset"></a>

Amazon Quick에서 데이터 세트를 생성할 때 다른 사용자가 이를 다른 데이터 세트의 소스로 사용하지 못하도록 할 수 있습니다. 다른 사람이 이 데이터를 사용하여 데이터세트를 생성할 수 있는지 여부를 지정할 수 있습니다. 또는 직접 쿼리 데이터 세트 또는 SPICE 데이터 세트와 같이 다른 사람이 내 데이터 세트에서 만들 수 있거나 만들 수 없는 데이터 세트의 유형을 지정할 수 있습니다.

다음 절차를 사용하여 다른 사람이 데이터 세트에서 새 데이터 세트를 만들지 못하도록 제한하는 방법을 알아보세요.

**다른 사람이 데이터 세트에서 새 데이터 세트를 만드는 것을 제한하기**

1. 빠른 시작 페이지의 왼쪽 창에서 **데이터를** 선택합니다.

1. **생성을** 선택한 다음 새 데이터 세트 생성을 제한할 데이터 세트를 선택합니다.

1. 해당 데이터 세트에 대해 열리는 페이지에서 **데이터 세트 편집**을 선택합니다.

1. 표시되는 데이터 준비 페이지에서 오른쪽 상단의 **관리**를 선택한 다음 **속성**을 선택합니다.

1. 표시되는 **데이터 세트 속성** 창에서 다음 옵션 중 하나를 선택합니다.
   + 다른 사용자가 이 데이터 세트로 새 데이터 세트를 만들지 못하도록 제한하려면 **이 데이터 세트에서 새 데이터 세트를 만들 수 있도록 허용**을 끄세요.

     새 데이터 세트를 만들 수 있는 경우 토글이 파란색으로 표시됩니다. 새 데이터 세트를 만들 수 없는 경우 회색으로 표시됩니다.
   + 다른 사람이 직접 쿼리 데이터 세트를 만들지 못하도록 제한하려면 **직접 쿼리 허용**을 선택 해제하세요.
   + 다른 사람이 데이터 세트 SPICE 사본을 만들지 못하도록 제한하려면 **SPICE 사본 허용**을 선택 해제하세요.

     SPICE 데이터 세트에 관한 자세한 내용은 [SPICE로 데이터 가져오기](spice.md)을(를) 참조하십시오.

1. 창을 닫습니다.