

As traduções são geradas por tradução automática. Em caso de conflito entre o conteúdo da tradução e da versão original em inglês, a versão em inglês prevalecerá.

# Por que você deve usar MLOps?
<a name="sagemaker-projects-why"></a>

À medida que você deixa de executar inteligência artificial individualAI/ML) projects to using AI/ML to transform your business at scale, the discipline of ML Operations (MLOps) can help. MLOps accounts for the unique aspects of AI/ML projects in project management, CI/CD, aprendizado de máquina (e garantia de qualidade), ajudando você a melhorar o tempo de entrega, reduzir defeitos e tornar a ciência de dados mais produtiva. MLOps refere-se a uma metodologia baseada na aplicação de DevOps práticas às cargas de trabalho de aprendizado de máquina. Para uma discussão sobre os DevOps princípios, consulte o white paper [Introdução a DevOps on AWS](https://docs.aws.amazon.com/whitepapers/latest/introduction-devops-aws/welcome.html?did=wp_card). Para saber mais sobre a implementação usando AWS serviços, consulte [Praticando CI/CD AWS](https://d1.awsstatic.com/whitepapers/DevOps/practicing-continuous-integration-continuous-delivery-on-AWS.pdf) e [Infraestrutura como Código](https://d1.awsstatic.com/whitepapers/DevOps/infrastructure-as-code.pdf).

Like DevOps, MLOps depende de uma abordagem colaborativa e simplificada do ciclo de vida de desenvolvimento de aprendizado de máquina, em que a interseção de pessoas, processos e tecnologia otimiza as end-to-end atividades necessárias para desenvolver, criar e operar cargas de trabalho de aprendizado de máquina.

MLOps concentra-se na interseção da ciência de dados e da engenharia de dados em combinação com DevOps as práticas existentes para agilizar a entrega de modelos em todo o ciclo de vida de desenvolvimento de aprendizado de máquina. MLOps é a disciplina de integrar cargas de trabalho de ML ao gerenciamento de versões, CI/CD e operações. MLOps requer a integração de desenvolvimento de software, operações, engenharia de dados e ciência de dados.

## Desafios com MLOps
<a name="sagemaker-projects-why-challenges"></a>

Embora MLOps possa fornecer ferramentas valiosas para ajudá-lo a expandir seus negócios, você pode enfrentar alguns problemas ao se MLOps integrar às suas cargas de trabalho de aprendizado de máquina.

**Gerenciamento de projetos**
+ Os projetos de ML envolvem cientistas de dados, uma função relativamente nova e que nem sempre é integrada a equipes multifuncionais. Esses novos membros da equipe geralmente falam uma linguagem técnica muito diferente da dos proprietários de produtos e engenheiros de software, agravando o problema usual de traduzir requisitos comerciais em requisitos técnicos. 

**Comunicação e colaboração**
+ Criar visibilidade em projetos de ML e permitir a colaboração entre diferentes partes interessadas, como engenheiros de dados, cientistas de dados, engenheiros de ML, DevOps está se tornando cada vez mais importante para garantir resultados bem-sucedidos.



**Tudo é código**
+ O uso de dados de produção em atividades de desenvolvimento, os ciclos de vida de experimentação mais longos, as dependências em pipelines de dados, o retreinamento de pipelines de implantação e as métricas exclusivas na avaliação do desempenho de um modelo.
+ Os modelos geralmente têm um ciclo de vida independente das aplicações e sistemas que integram com esses modelos. 
+ Todo o end-to-end sistema é reproduzível por meio de código versionado e artefatos. DevOps os projetos usam Infrastructure-as-Code (IaC) e Configuration-as-Code (CAc) para criar ambientes e Pipelines-as-Code (PAc) para garantir padrões consistentes. CI/CD Os pipelines precisam se integrar aos fluxos de trabalho de treinamento de Big Data e ML. Isso geralmente significa que o pipeline é uma combinação de uma CI/CD ferramenta tradicional e outro mecanismo de fluxo de trabalho. Há questões políticas importantes em muitos projetos de ML, portanto, o pipeline também pode precisar aplicar essas políticas. Dados de entrada tendenciosos produzem resultados tendenciosos, uma preocupação crescente para investidores empresariais.

**CI/CD**
+ Em MLOps, os dados de origem são uma entrada de primeira classe, junto com o código-fonte. É por isso que MLOps as chamadas para o controle de versão dos dados de origem e o início da execução do pipeline quando os dados de origem ou de inferência são alterados. 
+ Os pipelines também devem criar uma versão dos modelos de ML, junto com as entradas e outras saídas, a fim de fornecer rastreabilidade. 
+ Os testes automatizados devem incluir a validação adequada do modelo de ML durante as fases de criação e quando o modelo estiver em produção.
+ As fases de criação podem incluir treinamento e retreinamento de modelos, um processo demorado e que consome muitos recursos. Os pipelines devem ser granulares o suficiente para realizar um ciclo completo de treinamento somente quando os dados fonte ou o código de ML forem alterados, não quando os componentes relacionados mudarem.
+ Como o código de machine learning geralmente é uma pequena parte de uma solução geral, um pipeline de implantação também pode incorporar as etapas adicionais necessárias para empacotar um modelo para consumo como uma API por outras aplicações e sistemas.

**Monitoramento e registro**
+ As fases de engenharia de atributos e treinamento de modelos necessárias para capturar métricas de treinamento de modelos, bem como experimentos com modelos. O ajuste de um modelo de ML requer a manipulação da forma dos dados de entrada, bem como dos hiperparâmetros do algoritmo, e a captura sistemática desses experimentos. O rastreamento de experimentos ajuda os cientistas de dados a trabalhar com mais eficiência e fornece um snapshot reproduzível de seu trabalho.
+ Os modelos de ML implantados exigem o monitoramento dos dados passados ao modelo para inferência, junto com as métricas padrão de estabilidade e performance do endpoint. O sistema de monitoramento também deve capturar a qualidade da saída do modelo, conforme avaliada por uma métrica de ML apropriada. 

## Benefícios do MLOps
<a name="sagemaker-projects-benefits"></a>

A adoção de MLOps práticas agiliza time-to-market os projetos de ML, oferecendo os seguintes benefícios.
+ **Produtividade**: fornecer aos ambientes de autoatendimento acesso a conjuntos de dados selecionados permite que engenheiros e cientistas de dados se avancem mais rapidamente e percam menos tempo com dados perdidos ou inválidos.
+ **Repetibilidade**: automatizar todas as etapas do MLDC ajuda a garantir um processo repetível, incluindo como o modelo é treinado, avaliado, versionado e implantado. 
+ **Confiabilidade**: a incorporação de práticas de CI/CD permite não apenas uma implantação mais rápida, mas com maior qualidade e consistência. 
+ **Auditabilidade**: o controle de versão de todas as entradas e saídas, desde experimentos de ciência de dados até dados fonte e modelo treinado, significa que podemos demonstrar exatamente como o modelo foi construído e onde foi implantado.
+ **Qualidade dos dados e do modelo**: nos MLOps permite aplicar políticas que protegem contra o viés do modelo e acompanhamos as alterações nas propriedades estatísticas dos dados e na qualidade do modelo ao longo do tempo. 