A Google anunciou o lançamento da fase de testes do novo modelo de inteligência artificial Gemini 1.5 Pro. Um dos aspectos mais importantes deste novo modelo é a capacidade de entender contextos mais longos. Neste momento o contexto pode ser composto por até 128000 tokens, mas a Google quer aumentar a capacidade até ao milhão de tokens.
De acordo com o documento publicado pela Google, o Gemini 1.5 Pro ultrapassa o desempenho do Gemini 1.0 Pro e 1.0 Ultra. Quando comparado com o Ultra, o Gemini 1.5 Pro tem uma taxa de ganho de 54,8%, 77% em tarefas relacionadas com texto, 46% na interpretação de imagem e 20% em áudio. Quando comparado com o modelo 1.0 Pro, os ganhos aumentam substancialmente para: 87.1%, 100%, 77% e 60% respectivamente.
Algumas das novas capacidades incluem:
Fazer raciocínios com base em grandes quantidades de informação.
O Gemini 1.5 Pro consegue analisar e resumir o documento de 404 páginas com a transcrição completa das comunicações da missão Apollo 11.
Compreender melhor o contexto em vários tipos de meios
O Gemini 1.5 Pro consegue interpretar e retirar vários tipos de informação a partir de um filme mudo.
Resolver problemas complexos em pedaços de código mais longos
O Gemini 1.5 Pro consegue analisar 100000 linhas de código e sugere modificações, resoluções de problemas e explicações directamente no código original.
A Google não indicou quando é que o Gmeini 1.5 Pro vai estar disponível para o público em geral.