O Microsoft Ignite está a decorrer em Chicago, e a primeira grande notícia a surgir envolve, como seria de esperar, Inteligência Artificial. E onde há IA, muitas vezes há Nvidia, por isso não é surpresa que a empresa tenha aproveitado o evento da Microsoft para lançar ferramentas de IA para programadores destinadas ao que apelidaram de “PC GeForce RTX com IA”.
As novas ferramentas podem ajudar os programadores a criar “humanos digitais” para serem os rostos de agentes digitais, assistentes e avatares. A Nvidia acredita que esta abordagem dará aos humanos digitais um melhor contexto ao responder a perguntas feitas por nós, os humanos biológicos.
Para esse fim, anunciou o modelo Nvidia Nemovision-4B-Instruct. Ele usa o Nvidia Vila e o Nvidia NeMo para fornecer desempenho preciso em GPU RTX. A ferramenta, diz a Nvidia, ajuda os humanos digitais a verem imagens no ecrã (e no mundo) da mesma forma que nós.
“A multimodalidade serve de base para fluxos de trabalho e oferece um vislumbre do futuro onde os humanos digitais podem raciocinar e agir com assistência mínima de um utilizador”, disse a Nvidia em comunicado.
Actualizações do Mistral NeMo e TensorRT
A Nvidia também anunciou o conjunto Mistral NeMo Minitron 128k Instruct de pequenos modelos de linguagem. O modelo de grande contexto estará disponível em versões de 2, 4 e 8 mil milhões de parâmetros. Os modelos de formato GGUF são projectados para acomodar uma variedade de PC, incluindo dispositivos de baixo consumo de energia, para criar “interacções humanas digitais”.30
O TensorRT Model Optimizer recebeu novas funcionalidades. “Com as actualizações mais recentes, o TensorRT ModelOpt permite que os modelos sejam optimizados num checkpoint ONNX para implementar o modelo com ambientes de tempo de execução ONNX – usando provedores de execução de GPU como CUDA, TensorRT e DirectML”, disse a Nvidia em comunicado.
A Nvidia espera que o TensorRT ModelOpt actualizado reduza as necessidades de memória durante a implementação em até 2,6 vezes em comparação com o formato FP 16. Isso aconteceria em GPU RTX.
A Nvidia tem tido bastante sucesso com as suas linhas de GPU e aceleradores de IA. No mês passado, a Intel reconheceu que não vai competir com a Nvidia em desempenho, mas sim atrair clientes através do custo mais baixo dos seus aceleradores Gaudi 3.
Em sentido contrário à Intel, AMD quer competir em desempenho com os seus CPU Epyc de 5ª geração e aceleradores de IA.