A OpenAI anunciou hoje que vai lançar uma funcionalidade de reconhecimento de voz e imagem para o ChatGPT. Quando estas funcionalidades estiverem implementadas, o chatbot com inteligência artificial vai poder reconhecer imagens e falar com os utilizadores acerca delas e também terá possibilidade de entender a fala humana e converter as respostas escritas para respostas faladas. A OpenAI diz que estas funcionalidades têm o objectivo de tornarem o chatbot mais humano do que nas versões anteriores.
No anúncio, a OpenAi incluiu dois vídeos, que depois também publicou na rede social X (Twitter), que mostram como é que estas funcionalidades vão funcionar. No primeiro vídeo, um utilizador pergunta ao ChatGPT como é que faz para baixar o assento de uma bicicleta e o robô responde com as instruções.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
De seguida, o utilizador pede ao ChatGPT para o ajudar a reconhecer o tipo de porca usada na bicicleta. Mais uma vez, o robô consegue reconhecê-lo e aconselha o utilizador acerca do tipo de chave a usar. No segundo vídeo, é pedido (por voz) ao ChatGPT que conte uma história, ao que ele responde e começa a contar a história.
Estas funcionalidades só estão disponíveis para os utilizadores que pagarem os planos Plus ou Enterprise e, dentro de duas semanas, podem ser usadas através das aplicações para Android e iOS. Quem utilizar o ChatGPT através da web também vão poder usar a funcionalidade de reconhecimento de imagens em breve.
Naturalmente, estas funcionalidades não funcionam tão rapidamente como aparece nos vídeos. A Wired experimentou uma versão teste destas funcionalidades e diz que, na maioria das vezes, o sistema demora alguns segundos a responder e que a funcionalidade de reconhecimento de imagem não funciona com pessoas. Supostamente para proteger a privacidade.