A xAI, empresa de Elon Musk, confirmou o que será a primeira grande atualização para o modelo de IA do Grok, com o novo Grok-1.5V. Este novo modelo conta, por entre as suas novidades, com o suporte para processamento de imagens visuais.
O Grok-1.5V será capaz de processar não apenas texto, mas também documentos, diagramas, gráficos, capturas de ecrã e fotos. A empresa demonstrou ainda, durante a apresentação do novo modelo, algumas formas como este pode ser usado no mundo real.
Num dos exemplos, os utilizadores podem apresentar um diagrama de funcionamento de uma app, e pedir ao Grok para converter o mesmo em formato de código Python, criar uma história com base no gráfico ou outras tarefas.
É ainda possível usar a imagem de um meme e explicar o que a mesma quer dizer – para quem não acompanhe as tendências da internet no dia a dia.
Este novo modelo surge menos de uma semana depois da empresa ter revelado o Grok-1.5, a primeira atualização real do modelo, que veio sobretudo com melhorias a nível do processamento de código e de criação do mesmo, bem como melhorias na capacidade de questões de matemática. Na altura, a xAI também tinha deixado claro que os utilizadores iriam rapidamente ter acesso ao modelo do Grok-1.5V quando este ficasse disponível.
A par com a revelação do novo modelo, a empresa também revelou o RealWorldQA, uma aplicação para benchmark dos modelos de IA, que permite medir o desempenho dos diferentes modelos de IA existentes no mercado, usando vários itens para tal – o que inclui também a avaliação de imagens especificamente criadas para o efeito de teste.
A xAI afirma que o seu modelo do Grok conta com um dos melhores desempenhos finais quando comparado com outros modelos de IA no mercado, como o ChatGPT da OpenAI e o Gemini da Google.
Nenhum comentário
Seja o primeiro!