마이그레이션하려는 이유 이해 물류 파악 마이그레이션하려는 데이터 검토 스토리지 요구 사항 식별 네트워크 요구 사항 확인

마이그레이션을 위한 요구 사항 수집

대규모 데이터 마이그레이션의 첫 번째 단계에서는 조직 전체에서 다양한 정보를 수집해야 합니다.

이 정보는 마이그레이션 프로세스를 생성하는 데 도움이 되며, 대규모 마이그레이션의 경우 이는 소스에서 대상 스토리지로 작업(여러 웨이브에 걸쳐 수행)을 전환하기 위한 여러 전송 및 절차를 포함할 수 있습니다.

마이그레이션하려는 이유 이해

마이그레이션을 시작하려면 먼저 데이터를 마이그레이션 AWS하는 이유를 명확하게 이해해야 합니다. 이를 통해 기한 준수, 리소스 관리, 팀 간 조정과 같은 일반적인 마이그레이션 문제를 해결할 수 있습니다.

마이그레이션 동기를 확인하는 데 도움이 필요한 경우 다음 질문에 답하세요.

온프레미스 스토리지 공간을 확보하고 있나요?
하드웨어 지원 계약 기한을 충족하고 있나요?
데이터 센터 종료를 위한 것인가요?
마이그레이션 타임라인은 어떻게 되나요?
다른 클라우드 스토리지에서 데이터를 전송하고 있나요?
부분 또는 전체 데이터세트를 마이그레이션하고 있나요?
데이터 아카이브를 위한 것인가요?
애플리케이션 또는 사용자가 이 데이터에 정기적으로 액세스해야 하나요?

물류 파악

스토리지 환경, 마이그레이션, 조직에 대한 몇 가지 기본 물류를 다룹니다.

현재 데이터 스토리지 인프라에 대한 기본적인 사항을 이해합니다.
DataSync 에이전트가 필요한지 확인합니다. 예를 들어 온프레미스 스토리지에서 전송하는 경우 에이전트가 필요합니다.
에이전트가 필요한 경우 에이전트 요구 사항을 이해해야 합니다.
- 에이전트는 VMware ESXi의 가상 머신(VM), Linux 커널 기반 가상 머신(KVM), Microsoft Hyper-V 하이퍼바이저로 실행할 수 있습니다. 또한 에이전트를 AWS내에서 Amazon EC2 인스턴스로 배포할 수 있습니다.
- 대규모 마이그레이션은 일반적으로 메모리 집약적입니다. 에이전트에 충분한 RAM이 있는지 확인합니다.
마이그레이션에 참여해야 하는 리더십, 네트워킹, 스토리지, IT 부서의 주요 이해관계자를 파악합니다. 여기에는 다음이 포함됩니다.
- 프로젝트와 그 결과를 전담하는 단일 스레드 리더를 찾습니다.
- 마이그레이션하는 데이터의 소유권 및 분류를 담당하는 사용자를 파악합니다.
- 소스를 관리하는 사용자와 마이그레이션하려는 AWS 스토리지 서비스를 관리할 사용자를 식별합니다.
- 데이터가 들어오면 누가 데이터에 대한 다른 프로세스를 생성하고 관리할지 알아봅니다 AWS.
부서 간 통신 채널을 설정합니다.
비상 상황에 대한 롤백 계획을 생성합니다.
웨이브, 검증, 전환 절차 등 전체 마이그레이션 프로세스를 문서화합니다. 이를 전체 마이그레이션의 런북으로 사용합니다. 마이그레이션을 계획하고 구현할 때 이 프로세스를 업데이트합니다.

마이그레이션하려는 데이터 검토

스토리지 및 애플리케이션 팀과 협력하여 마이그레이션 중인 데이터의 특성을 분석합니다. 이 정보는 DataSync로 실행할 수 있는 마이그레이션 전략을 확인하는 데 도움이 됩니다.

데이터 사용 패턴 확인

자주 수정하며 적극적으로 사용하는 데이터의 경우 비즈니스 운영이 중단되지 않도록 여러 웨이브에 걸쳐 증분 전송을 계획합니다.
아카이브용으로 간주될 수 있는 읽기 전용 데이터의 경우 여러 웨이브에 걸쳐 진행하도록 계획할 필요가 없을 수 있습니다.
데이터 사용 패턴이 혼합된 경우 이러한 서로 다른 데이터세트를 별도로 마이그레이션하는 웨이브를 계획합니다. 예를 들어 아카이브 데이터에 하나의 웨이브를 계획하고, 나머지 단계는 활성 데이터 마이그레이션만을 위해 계획할 수 있습니다.

데이터 구조 및 레이아웃 식별

데이터가 기간(년, 월, 일) 또는 기타 패턴별로 구성되어 있는지 확인합니다.
이 조직 구조를 사용하여 마이그레이션 웨이브를 계획합니다. 예를 들어 하나의 웨이브로 1년 분량의 아카이브 데이터를 마이그레이션할 수 있습니다.

공유 및 폴더 문서화

공유 및 폴더 인벤토리를 생성합니다(각 인벤토리에 대한 파일 또는 객체 수 포함).
활성 데이터세트가 있는 공유 및 폴더를 식별합니다. 마이그레이션 과정에서 증분 전송이 필요할 수 있습니다.
DataSync 할당량을 검토합니다. 이는 DataSync 구성 시 데이터세트 분할 방법을 계획하는 데 도움이 될 수 있습니다.

파일 크기 분석

더 큰 파일(MB 또는 GB)을 전송하는 경우 더 작은 파일(KB)을 전송할 때에 비해 데이터 처리량이 더 높을 것으로 예상됩니다.
더 작은 파일을 많이 사용하는 경우 스토리지 시스템에 더 많은 메타데이터 작업이 필요하고 데이터 처리량이 더 낮을 것으로 예상됩니다. DataSync는 소스 및 대상 위치를 비교하고 확인할 때 이러한 작업을 수행합니다.

스토리지 요구 사항 식별

호환되는 AWS 스토리지 서비스를 선택하여 데이터를 마이그레이션하려면 소스 스토리지 시스템의 특성과 성능을 평가해야 합니다.

또한 이 정보는 마이그레이션 과정에서 비즈니스 운영에 미치는 영향을 최소화하기 위해 전송을 예약하는 데 도움이 될 수 있습니다.

소스 스토리지 지원 확인

DataSync는 NFS, SMB, HDFS, S3 호환 객체 스토리지 클라이언트를 통해 액세스할 수 있는 다양한 스토리지 시스템에서 작동할 수 있습니다.

다른 클라우드 스토리지에서 마이그레이션하는 경우 DataSync가 해당 공급자와 함께 작동할 수 있는지 확인합니다. 지원하는 소스 목록은 데이터를 어디로 전송할 수 있나요 AWS DataSync?을(를) 참조하세요.

메타데이터 보존 요구 사항 검토

DataSync는 전송 과정에서 파일 또는 객체 메타데이터를 보존할 수 있습니다. 메타데이터 보존 방법은 전송 위치와 해당 위치에서 유사한 유형의 메타데이터를 사용하는지 여부에 따라 달라집니다.

DataSync는 경우에 따라 NTFS 임의 액세스 목록(DACL)과 같은 파일 메타데이터를 보존하기 위해 추가 권한이 필요합니다.

자세한 내용은 DataSync가 파일 및 객체 메타데이터를 처리하는 방법 이해 단원을 참조하십시오.

소스 스토리지에서 성능 지표 수집

소스 스토리지의 평균 및 피크 워크로드 기간 동안 기준 IOPS 및 디스크 처리량을 측정합니다. 데이터를 전송하면 소스 및 대상 스토리지 시스템 모두에 I/O 오버헤드가 추가됩니다.

이 성능 데이터를 스토리지 시스템의 사양과 비교하여 사용 가능한 성능 리소스를 확인합니다.

대상 AWS 스토리지 서비스 선택

이 시점에서 데이터에 적합한 AWS 스토리지 서비스가 무엇인지 알고 있을 수 있습니다. 그렇지 않다면 데이터 사용 패턴과 스토리지 성능은 결정 시 고려해야 할 몇 가지 영역입니다. 예를 들어, 아카이브 데이터가 있다면 Amazon S3를, 활성 데이터에 대해서는 Amazon FSx 또는 Amazon EFS를 고려할 수 있습니다.

데이터에 적합한 객체 또는 파일 기반 스토리지를 결정하는 데 도움이 필요하면 AWS 스토리지 서비스 선택을 참조하세요.

네트워크 요구 사항 확인

DataSync로 데이터를 마이그레이션하려면 소스 스토리지, 에이전트 및 간에 네트워크 연결을 설정해야 합니다 AWS. 또한 충분한 네트워크 대역폭과 인프라를 계획해야 합니다.

네트워크 엔지니어 및 스토리지 관리자와 협력하여 다음 네트워크 요구 사항을 수집합니다.

사용 가능한 네트워크 대역폭 평가

사용 가능한 네트워크 대역폭은 전송 속도와 전체 마이그레이션 시간에 영향을 미칩니다. 온프레미스 스토리지 시스템에서 전송하는 경우 다음을 수행합니다.

네트워크 팀과 협력하여 평균 및 최대 대역폭 사용률을 결정합니다.
데이터 전송 가능 기간을 파악하여 일상 작업이 중단되지 않도록 합니다. 그러면 마이그레이션 웨이브와 전환이 언제 발생하는지 알 수 있습니다.

DataSync가 사용하는 대역폭의 양을 제어할 수 있습니다. 자세한 내용은 AWS DataSync 작업에 대한 대역폭 제한 설정 단원을 참조하십시오.

다른 클라우드 스토리지에서 전송은 일반적으로 퍼블릭 인터넷을 통해 이루어지므로 이러한 전송에는 일반적으로 대역폭 제한 및 고려 사항이 적습니다.

네트워크를에 연결하기 위한 옵션 고려 AWS

DataSync 전송을 위한 네트워크 연결을 설정하려면 다음 옵션을 고려하세요.

Direct Connect - DataSync와 함께 Direct Connect를 사용하기 위한 아키텍처 및 라우팅 예시를 검토합니다. Amazon CloudWatch를 사용하여 Direct Connect 활동을 모니터링할 수 있습니다.
VPN - AWS Site-to-Site VPN은 터널당 최대 1.25Gbps의 처리량을 제공합니다.
퍼블릭 인터넷 - 네트워크 사용 데이터에 대해서는 인터넷 서비스 공급자에게 문의하세요.

에이전트 통신을 위한 서비스 엔드포인트 선택

DataSync 에이전트는 서비스 엔드포인트를 사용하여 DataSync 서비스와 통신합니다. 사용하는 엔드포인트 유형은 네트워크에 대해 AWS에 연결하는 방법에 따라 달라집니다.

충분한 네트워크 인프라 확보 계획

생성하는 모든 전송 작업에 대해 DataSync는 데이터 전송을 위한 네트워크 인프라를 자동으로 생성하고 관리합니다. 이 인프라를 네트워크 인터페이스 또는 탄력적 네트워크 인터페이스라고 하며, 이는 가상 네트워크 카드를 나타내는 Amazon 가상 프라이빗 클라우드(VPC)의 논리적 네트워킹 구성 요소입니다. 자세한 내용은 Amazon EC2 사용 설명서를 참조하세요.

각 네트워크 인터페이스는 대상 VPC 서브넷에서 단일 IP 주소를 사용합니다. 마이그레이션에 충분한 네트워크 인프라가 있는지 확인하려면 다음을 수행합니다.

DataSync가 사용자의 DataSync 대상 위치에 생성한 네트워크 인터페이스 수에 주목합니다.
서브넷에 DataSync 작업에 필요한 충분한 IP 주소가 있는지 확인하세요. 예를 들어 에이전트를 사용하는 작업에는 4개의 IP 주소가 필요합니다. 마이그레이션을 위해 4개의 작업을 생성하는 경우 서브넷에 사용 가능한 IP 주소 16개가 필요합니다.

javascript가 브라우저에서 비활성화되거나 사용이 불가합니다.

AWS 설명서를 사용하려면 Javascript가 활성화되어야 합니다. 지침을 보려면 브라우저의 도움말 페이지를 참조하십시오.

문서 규칙

1단계: 마이그레이션 계획

개념 증명 실행