Qualcomm dispara no mercado após revelar nova linha de chips para inferência de IA

As ações da Qualcomm subiram cerca de 18% após a divulgação de uma nova linha de placas aceleradoras baseadas em chip para inferência de IA, sinalizando confiança do mercado no movimento estratégico da empresa.

A Qualcomm é mais conhecida por seus chips para mobile e conectividade, mas está entrando no segmento de aceleradores de inferência de IA para centros de dados.

A Qualcomm Technologies, Inc. anunciou hoje o lançamento de soluções de inferência de IA em nível de rack para data centers: as placas aceleradoras baseadas em chip Qualcomm AI200 e AI250, bem como racks. Construídas sobre a liderança da empresa em tecnologia NPU, essas soluções oferecem desempenho em escala de rack e maior capacidade de memória para inferência de IA gerativa com alto desempenho por watt, marcando um avanço significativo para tornar a IA gerativa escalável, eficiente e flexível em diversos setores.

Qualcomm AI200: solução de inferência de IA por rack

Projetada para entregar baixo custo total de propriedade (TCO) e desempenho otimizado para inferência de grandes modelos de linguagem (LLMs) e modelos multimodais (LMMs) e outros workloads de IA, a AI200 suporta até 768 GB de memória LPDDR por placa, aumentando a capacidade de memória e reduzindo custos, o que facilita escalabilidade e flexibilidade para a inferência de IA.

Qualcomm AI250: arquitetura de memória com near-memory computing

A AI250 estreia com uma arquitetura de memória inovadora baseada em near-memory computing, proporcionando ganhos significativos em eficiência e desempenho para cargas de trabalho de inferência de IA, ao oferecer mais de 10x de largura de banda efetiva de memória e consumo de energia consideravelmente menor. Isso viabiliza a inferência desagregada, permitindo uso mais eficiente dos recursos de hardware sem comprometer desempenho e custo.

Embora não pareça uma ameaça direta à Nvidia no espaço de treinamento, a corrida pela inferência envolve Nvidia, AMD, Intel e outros players. Esse movimento pode impulsionar centros de dados, e qualquer ganho de eficiência poderia reduzir o consumo de energia, embora haja quem defenda que maior inferência leve a maior uso de IA.

Ainda é necessário acompanhar a validação prática das afirmações sobre a largura de banda de memória e o ecossistema de software que acompanha essas soluções.