O novo modelo de IA Gemini 1.5 da Google é capaz entender contextos mais longos

A Google anunciou o lançamento da fase de testes do novo modelo de inteligência artificial Gemini 1.5 Pro. Um dos aspectos mais importantes deste novo modelo é a capacidade de entender contextos mais longos. Neste momento o contexto pode ser composto por até 128000 tokens, mas a Google quer aumentar a capacidade até ao milhão de tokens.

- Publicidade -

De acordo com o documento publicado pela Google, o Gemini 1.5 Pro ultrapassa o desempenho do Gemini 1.0 Pro e 1.0 Ultra. Quando comparado com o Ultra, o Gemini 1.5 Pro tem uma taxa de ganho de 54,8%, 77% em tarefas relacionadas com texto, 46% na interpretação de imagem e 20% em áudio. Quando comparado com o modelo 1.0 Pro, os ganhos aumentam substancialmente para: 87.1%, 100%, 77% e 60% respectivamente.

Algumas das novas capacidades incluem:

Fazer raciocínios com base em grandes quantidades de informação.

O Gemini 1.5 Pro consegue analisar e resumir o documento de 404 páginas com a transcrição completa das comunicações da missão Apollo 11.

Compreender melhor o contexto em vários tipos de meios

O Gemini 1.5 Pro consegue interpretar e retirar vários tipos de informação a partir de um filme mudo.

Resolver problemas complexos em pedaços de código mais longos

O Gemini 1.5 Pro consegue analisar 100000 linhas de código e sugere modificações, resoluções de problemas e explicações directamente no código original.

A Google não indicou quando é que o Gmeini 1.5 Pro vai estar disponível para o público em geral.