기계 번역으로 제공되는 번역입니다. 제공된 번역과 원본 영어의 내용이 상충하는 경우에는 영어 버전이 우선합니다.
대규모 데이터 마이그레이션의 첫 번째 단계에서는 조직 전체에서 다양한 정보를 수집해야 합니다.
이 정보는 마이그레이션 프로세스를 생성하는 데 도움이 됩니다. 대규모 마이그레이션의 경우 소스에서 대상 스토리지로 작업(파도로 수행)을 분할하기 위한 여러 전송 및 절차를 포함할 수 있습니다.
마이그레이션하려는 이유 이해
마이그레이션을 시작하기 전에 데이터를 마이그레이션 AWS하는 이유를 명확하게 이해해야 합니다. 이를 통해 기한 준수, 리소스 관리, 팀 간 조정과 같은 일반적인 마이그레이션 문제를 해결할 수 있습니다.
마이그레이션 동기를 결정하는 데 도움이 필요한 경우 다음 질문에 답하세요.
-
온프레미스 스토리지 공간을 확보하고 있나요?
-
하드웨어 지원 계약 기한을 충족하고 있습니까?
-
데이터 센터 종료에 해당하나요?
-
마이그레이션 타임라인은 어떻게 됩니까?
-
다른 클라우드 스토리지에서 데이터를 전송하고 있습니까?
-
부분 또는 전체 데이터 세트를 마이그레이션하고 있습니까?
-
데이터 아카이브용인가요?
-
애플리케이션 또는 사용자가이 데이터에 정기적으로 액세스해야 합니까?
물류 파악
스토리지 환경, 마이그레이션 및 조직에 대한 몇 가지 기본 물류를 다룹니다.
-
현재 데이터 스토리지 인프라를 기본적으로 이해합니다.
-
DataSync 에이전트가 필요한지 확인합니다. 예를 들어 온프레미스 스토리지에서 전송하는 경우 에이전트가 필요합니다.
-
에이전트가 필요한 경우 에이전트 요구 사항을 이해해야 합니다.
-
에이전트는 VMware ESXi, Linux 커널 기반 가상 머신(KVM) 및 Microsoft Hyper-V 하이퍼바이저에서 가상 머신(VM)으로 실행할 수 있습니다. 에이전트를 내에서 Amazon EC2 인스턴스로 배포할 수도 있습니다 AWS.
-
대규모 마이그레이션은 일반적으로 메모리 집약적입니다. 에이전트에 충분한 RAM이 있는지 확인합니다.
-
-
마이그레이션에 관여해야 하는 리더십, 네트워킹, 스토리지 및 IT 부서의 주요 이해관계자를 식별합니다. 여기에는 다음이 포함됩니다.
-
프로젝트와 그 결과를 전담하는 단일 스레드 리더를 찾습니다.
-
마이그레이션하려는 데이터의 소유권 및 분류를 담당하는 사람을 결정합니다.
-
소스를 관리하는 사람과 마이그레이션하려는 AWS 스토리지 서비스를 관리할 사용자를 식별합니다.
-
데이터가 들어오면 누가 데이터에 대한 다른 프로세스를 생성하고 관리할지 알아봅니다 AWS.
-
-
부서 간 통신 채널을 설정합니다.
-
비상 상황에 대한 롤백 계획을 생성합니다.
-
파도, 검증 및 전환 절차를 포함한 전체 마이그레이션 프로세스를 문서화합니다. 이를 전체 마이그레이션의 실행서로 사용합니다. 마이그레이션을 계획하고 구현할 때이 프로세스를 업데이트합니다.
마이그레이션하려는 데이터 검토
스토리지 및 애플리케이션 팀과 협력하여 마이그레이션 중인 데이터의 특성을 분석합니다. 이 정보는 DataSync로 실행할 수 있는 마이그레이션 전략을 결정하는 데 도움이 됩니다.
데이터 사용 패턴 확인
-
자주 수정하여 적극적으로 사용되는 데이터의 경우 비즈니스 운영이 중단되지 않도록 여러 번의 증분 전송을 계획합니다.
-
아카이브로 간주될 수 있는 읽기 전용 데이터의 경우 웨이브를 계획할 필요가 없을 수 있습니다.
-
데이터 사용 패턴이 혼합되어 있는 경우 이러한 다양한 데이터 세트를 별도로 마이그레이션하는 웨이브를 계획합니다. 예를 들어 아카이브 데이터에 대해 웨이브가 하나 있을 수 있으며 나머지 웨이브는 활성 데이터 마이그레이션 전용입니다.
데이터 구조 및 레이아웃 식별
-
데이터가 기간(년, 월, 일) 또는 기타 패턴별로 구성되어 있는지 확인합니다.
-
이 조직 구조를 사용하여 마이그레이션 웨이브를 계획합니다. 예를 들어 한 번의 웨이브 중에 1년 분량의 아카이브 데이터를 마이그레이션할 수 있습니다.
공유 및 폴더 문서화
-
공유 및 폴더 인벤토리를 생성합니다(각각에 대한 파일 또는 객체 수 포함).
-
활성 데이터 세트가 있는 공유 및 폴더를 식별합니다. 마이그레이션 중에 증분 전송이 필요할 수 있습니다.
-
DataSync 할당량을 검토합니다. 이렇게 하면 DataSync를 구성할 때 데이터 세트를 분할하는 방법을 계획하는 데 도움이 될 수 있습니다.
파일 크기 분석
-
더 작은 파일(KB)에 비해 더 큰 파일(MB 또는 GB)을 사용하는 전송에서 더 높은 데이터 처리량을 예상합니다.
-
더 작은 파일을 많이 사용하는 경우 스토리지 시스템에서 더 많은 메타데이터 작업을 수행하고 데이터 처리량을 줄일 수 있습니다. DataSync는 소스 및 대상 위치를 비교하고 확인할 때 이러한 작업을 수행합니다.
스토리지 요구 사항 식별
호환되는 AWS 스토리지 서비스를 선택하여 데이터를 마이그레이션하려면 소스 스토리지 시스템의 특성과 성능을 평가해야 합니다.
또한이 정보는 마이그레이션 중에 비즈니스 운영에 미치는 영향을 최소화하기 위해 전송을 예약하는 데 도움이 될 수 있습니다.
소스 스토리지 지원 결정
DataSync는 NFS, SMB, HDFS 및 S3 호환 객체 스토리지 클라이언트를 통해 액세스할 수 있는 다양한 스토리지 시스템과 함께 작동할 수 있습니다.
다른 클라우드 스토리지에서 마이그레이션하는 경우 DataSync가 해당 공급자와 함께 작동할 수 있는지 확인합니다. 지원되는 소스 위치 목록은 섹션을 참조하세요. AWS DataSync를 통해 데이터를 어디로 전송할 수 있나요?
메타데이터 보존 요구 사항 검토
DataSync는 전송 중에 파일 또는 객체 메타데이터를 보존할 수 있습니다. 메타데이터를 보존하는 방법은 전송 위치와 해당 위치에서 유사한 유형의 메타데이터를 사용하는지 여부에 따라 달라집니다.
DataSync는 경우에 따라 NTFS 임의 액세스 목록(DACLs)과 같은 파일 메타데이터를 보존하기 위한 추가 권한이 필요합니다.
자세한 내용은 DataSync가 파일 및 객체 메타데이터를 처리하는 방법 이해 단원을 참조하십시오.
소스 스토리지에서 성능 지표 수집
소스 스토리지의 평균 및 피크 워크로드 중에 기준 IOPS 및 디스크 처리량을 측정합니다. 데이터를 전송하면 소스 스토리지 시스템과 대상 스토리지 시스템 모두에 I/O 오버헤드가 추가됩니다.
이 성능 데이터를 스토리지 시스템의 사양과 비교하여 사용 가능한 성능 리소스를 결정합니다.
대상 AWS 스토리지 서비스 선택
이 시점에서 AWS 는 스토리지 서비스가 데이터에 어떤 의미가 있는지 알고 있을 수 있습니다. 그렇지 않은 경우 데이터 사용 패턴과 스토리지 성능은 결정할 때 고려해야 할 몇 가지 영역입니다. 예를 들어 아카이브 데이터가 있고 활성 데이터에 대해 Amazon FSx 또는 Amazon EFS가 있는 경우 Amazon S3를 고려할 수 있습니다. FSx EFS
데이터에 적합한 객체 또는 파일 기반 스토리지를 결정하는 데 도움이 되도록 AWS 스토리지 서비스 선택을 참조하세요.
네트워크 요구 사항 결정
DataSync로 데이터를 마이그레이션하려면 소스 스토리지, 에이전트 및 간에 네트워크 연결을 설정해야 합니다 AWS. 또한 충분한 네트워크 대역폭과 인프라를 계획해야 합니다.
네트워크 엔지니어 및 스토리지 관리자와 협력하여 다음 네트워크 요구 사항을 수집합니다.
사용 가능한 네트워크 대역폭 평가
전송 속도 및 전체 마이그레이션 시간에 사용할 수 있는 네트워크 대역폭 요인입니다. 온프레미스 스토리지 시스템에서 전송하는 경우 다음을 수행합니다.
-
네트워크 팀과 협력하여 평균 및 최대 대역폭 사용률을 결정합니다.
-
데이터를 전송할 수 있는 기간을 식별하고 일상적인 작업이 중단되지 않도록 합니다. 그러면 마이그레이션 파도와 전환이 언제 발생하는지 알 수 있습니다.
DataSync가 사용하는 대역폭의 양을 제어할 수 있습니다. 자세한 내용은 AWS DataSync 태스크의 대역폭 제한 설정 단원을 참조하십시오.
다른 클라우드 스토리지로부터의 전송은 일반적으로 퍼블릭 인터넷을 통해 이루어지므로 이러한 전송에는 일반적으로 대역폭 제한 및 고려 사항이 적습니다.
네트워크를에 연결하기 위한 옵션 고려 AWS
DataSync 전송을 위한 네트워크 연결을 설정하려면 다음 옵션을 고려하세요.
-
AWS Direct Connect - DataSync와 함께 Direct Connect를 사용하기 위한 아키텍처 및 라우팅 예제를 검토합니다. Amazon CloudWatch를 사용하여 Direct Connect 활동을 모니터링할 수 있습니다.
-
VPN - 터널당 최대 1.25Gbps의 처리량을 AWS Site-to-Site VPN 제공합니다.
-
퍼블릭 인터넷 - 네트워크 사용 데이터에 대해 인터넷 서비스 공급자에게 문의하세요.
에이전트 통신을 위한 서비스 엔드포인트 선택
DataSync 에이전트는 서비스 엔드포인트를 사용하여 DataSync 서비스와 통신합니다. 사용하는 엔드포인트 유형은 네트워크에 대해에 연결하는 방법에 따라 달라집니다 AWS.
충분한 네트워크 인프라 계획
생성한 모든 전송 작업에 대해 DataSync는 데이터 전송을 위한 네트워크 인프라를 자동으로 생성하고 관리합니다. 이 인프라를 네트워크 인터페이스 또는 탄력적 네트워크 인터페이스라고 하며, 이는 가상 네트워크 카드를 나타내는 Amazon Virtual Private Cloud(VPC)의 논리적 네트워킹 구성 요소입니다. 자세한 내용은 Amazon EC2 사용 설명서를 참조하세요.
각 네트워크 인터페이스는 대상 VPC 서브넷에서 단일 IP 주소를 사용합니다. 마이그레이션에 충분한 네트워크 인프라가 있는지 확인하려면 다음을 수행합니다.
-
DataSync가 DataSync 대상 위치에 대해 생성할 네트워크 인터페이스 수를 기록해 둡니다.
-
서브넷에 DataSync 작업을 위한 충분한 IP 주소가 있는지 확인합니다. 예를 들어 에이전트를 사용하는 태스크에는 4개의 IP 주소가 필요합니다. 마이그레이션을 위해 4개의 태스크를 생성하는 경우 서브넷에 사용 가능한 IP 주소가 16개 필요합니다.