O ecossistema de IA desenvolvido na Faculdade de Ciências da Universidade de Lisboa (FCUL) foi actualizado com mais parâmetros, ou seja, com mais informação que permite gerar textos e manter conversas, entre outras funcionalidades.
O Albertina (codificador) chega agora à versão 1.5B, com a adição de 1,5 mil milhões de parâmetros, que se juntam aos mil milhões que já faziam parte deste modelo. Já o Gervásio (descodificador) entra na versão 7B e é reforçado com 7 mil milhões de parâmetros, ficando, assim, com 8 mil milhões.
Ambas as actualizações foram desenvolvidos pelo NLX (Grupo da Fala e da Linguagem Natural da FCUL); no caso do Albertina, a universidade de Lisboa colaborou com a Faculdade de Engenharia da Universidade do Porto.
«Este ecossistema é crucial para a tecnologia da língua portuguesa e esta expansão representa um passo da maior importância na preparação da língua portuguesa para a era da inteligência artificial», sublinha António Branco, coordenador destes dois grandes modelos de linguagem (LLM) e professor do Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa.
Quer o Gervásio, quer o Albertina (que foram criados especificamente para a língua portuguesa, inclusive para a variante do Brasil) têm um conceito open source, ou seja, são «gratuitos e distribuídos em acesso aberto sob uma licença aberta», neste caso para «investigadores, organizações públicas e privadas, grandes empresas e PME de todos os sectores económicos».
Como exemplo da utilização destes dois modelos por empresas, a FCUL destaca um «recente desenvolvimento por uma start-up do MediAlbertina [um LLM treinado com informação médica, em português], para a IA generativa aplicada à medicina em língua portuguesa.
Desde Maio de 2023, altura em que este projecto começou, o ecossistema de IA português tem contado com o apoio da Portulan Clarin (Infraestrutura de Investigação para a Ciência e Tecnologia da Linguagem), da Accelerat.ai (um consórcio criado no âmbito do PRR, com um investimento de 34,5 milhões de euros) e da FCCN/FCT.