A infraestrutura como serviço (IaaS) otimizada para Inteligência Artificial (IA) está emergindo como o próximo motor de crescimento disruptivo para a infraestrutura de IA. Como resultado, os gastos dos usuários finais devem crescer 146% até o final de 2025, de acordo com o Gartner.
O mercado de IaaS otimizada para IA inclui gastos com computação de alto desempenho (HPC), como unidades de processamento gráfico (GPUs), circuitos integrados específicos para aplicações (ASICs) e outros aceleradores de Inteligência Artificial, projetados para processamento de IA em grande escala.
“A IaaS tradicional está amadurecendo, mas as projeções de crescimento dos gastos com IaaS otimizada para IA são maiores do que as com IaaS tradicional nos próximos cinco anos”, diz , Analista Principal do Gartner. “À medida que as organizações expandem o uso de IA e Inteligência Artificial Generativa (GenAI), elas precisarão de infraestrutura especializada, como GPUs, unidades de processamento tensorial (TPUs) ou outros ASICs de Inteligência Artificial, redes de alta velocidade e armazenamento otimizado para processamento paralelo rápido e movimentação de dados. Assim, o IaaS tradicional baseado em unidade central de processamento (CPU) enfrentará desafios significativos para atender a essas demandas.” Singh, Analista Principal do Gartner. “À medida que as organizações expandem o uso de IA e Inteligência Artificial Generativa (GenAI), elas precisarão de infraestrutura especializada, como GPUs, unidades de processamento tensorial (TPUs) ou outros ASICs de Inteligência Artificial, redes de alta velocidade e armazenamento otimizado para processamento paralelo rápido e movimentação de dados. Assim, o IaaS tradicional baseado em unidade central de processamento (CPU) enfrentará desafios significativos para atender a essas demandas.”
O Gartner estima que os gastos mundiais dos usuários finais com IaaS otimizada para IA totalizarão US$ 18,3 bilhões até o final de 2025 e US$ 37,5 bilhões em 2026.
Gastos mundiais e taxa de crescimento anual de IaaS otimizada para IA, 2024-2029

Fonte: Gartner (Outubro 2025)
À medida que a adoção da Inteligência Artificial se expande em todos os setores, as cargas de trabalho de inferência se tornarão uma força dominante, impulsionando a demanda por IaaS otimizada para IA. O Gartner projeta que os gastos dos usuários finais com inferência ultrapassarão os com cargas de trabalho intensivas em treinamento em 2026. Os investimentos em aplicações focadas em inferência devem chegar a US$ 20,6 bilhões, ante US$ 9,2 bilhões em 2025. Em 2026, 55% dos gastos com IaaS otimizada para IA apoiarão cargas de trabalho de inferência, e a projeção é que esse número chegue a mais de 65% em 2029.
“Ao contrário do treinamento, que envolve ciclos de computação intensivos e em grande escala que ocorrem durante o desenvolvimento do modelo e atualizações contínuas, a inferência acontece continuamente, alimentando aplicações em tempo real, como chatbots, mecanismos de recomendação, sistemas de detecção de fraudes e aplicações específicas do setor”, diz Singh.

