A inteligência artificial (IA) generativa vem fazendo sucesso desde o lançamento do ChatGPT no ano passado, e tem o potencial de transformar vários setores. Mas o que há de tão diferente nisso e o que representa para os data centers?
Resumo:
O uso crescente da IA generativa cria novas demandas para a infraestrutura de IT, exigindo que as organizações estejam preparadas. O Global Tech Trends Survey (GTTS) de 2023, estudo encomendado pela Equinix, aponta que 42% dos líderes de TI globais não confiam que suas infraestruturas tenham capacidade de acomodar o crescimento da IA.
A IA generativa já influenciou a arquitetura dos clusters de IA, exigindo uma rede neural maior – o que significa mais hardware – bem como melhor malha computacional e conjuntos de dados maiores. Esses fatores levam ao alto consumo de energia e à necessidade de resfriamento mais eficiente e melhor infraestrutura de rede.
Mas, primeiro, vamos falar sobre o que torna a IA generativa diferente da IA tradicional:
Assim, fica claro que a IA generativa impacta na forma como projetamos a arquitetura do data center — desde onde você coloca sua infraestrutura, como o espaço é construído, opções de conectividade e muito mais. Vamos dar uma olhada em cinco destes fatores.
As cargas de trabalho de desenvolvimento de IA generativa consomem muita energia, por isso é melhor criá-las em locais que possam fornecer energia de baixo custo. Normalmente, elas não são sensíveis à latência, portanto, não precisam estar em áreas altamente povoadas. Além disso, você vai querer hospedá-las em locais onde pode tirar proveito das técnicas de resfriamento de “ar externo livre”.
Faz sentido colocar cargas de trabalho de produção de IA generativa em pontos de presença próximos de onde os dados estão sendo gerados. Assim, pode-se querer implantar clusters de inferência de IA em várias regiões para reduzir o backhaul de dados para um local central. Dependendo do número de usuários acessando simultaneamente o modelo de IA generativa, talvez seja necessário implantar um grande cluster de inferência de IA que exija muita energia. Assim, é importante implantar esses sistemas de produção em data centers que possam suportar altos requisitos de energia.
Para satisfazer os regulamentos de residência de dados e conformidade, muitas organizações precisam implantar seus sistemas de produção de IA em vários países. Você pode simplificar e agilizar seus processos de implantação de data center trabalhando com um fornecedor global de data center com presença em todo o mundo.
As cargas de trabalho de IA de produção exigem data centers de alta disponibilidade, assim como outras cargas de trabalho de TI. No entanto, os requisitos do data center para cargas de trabalho de desenvolvimento de IA são exclusivos das seguintes maneiras:
Para criar modelos de IA generativa, você precisa de acesso de alta velocidade a muitas fontes de dados externas. Ao usar um modelo para produção, precisa de conectividade de alta largura de banda para trazer dados de entrada multimodais (por exemplo, vídeo, fotos) e conectividade de baixa latência para provedores de dados externos (por exemplo, clima ao vivo, mercado de ações, tráfego, etc.). Dessa forma, é importante hospedar cargas de trabalho de IA generativa em um data center que forneça conectividade segura e de alta velocidade a vários provedores de rede para trazer tráfego da borda (5G, Wi-Fi, baixa potência, MPLS).
Você também precisa de conectividade segura e de alta velocidade com fontes de dados espalhadas por nuvens, data brokers e outras empresas. Muitas nuvens cobram pela saída de dados por meio de uma conexão privada a pontos de custo muito mais baixos do que os dados de saída pela internet pública. Os data centers devem ser um provedor de conectividade privada aprovado para reduzir os custos de saída de dados em nuvem.
Como as cargas de trabalho de IA generativa consomem muita energia, os provedores de data centers precisam utilizar fontes de energia sustentáveis. Cada vez mais, haverá pressão sobre os provedores de soluções de IA de governos e órgãos de fiscalização da indústria para hospedar suas soluções em data centers ecológicos com um número de baixo consumo de energia (PUE). Os provedores de data centers precisarão aproveitar a tecnologia de IA para otimizar e personalizar a operação em relação ao número de ventiladores, chillers e assim por diante. Por fim, deverão publicar relatórios periódicos de sustentabilidade para ajudar os clientes a otimizar o consumo de energia por meio de sua infraestrutura de TI.
Muitas organizações querem manter o controle total sobre seus dados por motivos de privacidade e concorrência. Além da segurança em nível de software e dados, a segurança física de sua infraestrutura também é muito importante. Os data centers precisam fornecer gaiolas privadas que podem ser acessadas apenas pelo cliente, com monitoramento de vídeo 24 horas por dia, 7 dias por semana. Em muitos casos, os clientes querem saber se o provedor de data center atende às regulamentações governamentais de segurança de infraestrutura por motivos de conformidade.
Doron Hendel, engenheiro elétrico e desenvolvedor de negócios em IA e Kaladhar Voruganti, cientista da computação e tecnologista de negócios sênior na Equinix
Leia Também:
Este post foi modificado pela última vez em %s = human-readable time difference 12:46
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…