1. TugaTech » Software » Noticias de Software
  Login     Registar    |                      
Siga-nos

ChatGPT em smartphone

Numa jogada que está a agitar o mundo da tecnologia, a OpenAI anunciou o lançamento de novos modelos de linguagem de grande escala "open-weight". É um marco significativo para a empresa, que desde o lançamento do GPT-2 em 2019 não disponibilizava modelos desta natureza, enfrentando acusações de se ter desviado da sua missão original de beneficiar toda a humanidade com a inteligência artificial.

Após vários adiamentos para testes de segurança e refinamentos adicionais, os modelos gpt-oss-120b e gpt-oss-20b já se encontram disponíveis para download na plataforma Hugging Face.

O que significa 'open-weight' e porque não é 'open-source'?

Antes de mais, é crucial perceber a diferença. A OpenAI não está a lançar modelos "open-source" (código aberto) no sentido tradicional, o que implicaria partilhar o código e os dados de treino. Em vez disso, está a partilhar os "pesos" (weights) – os valores numéricos que os modelos aprenderam durante o treino e que ditam o seu comportamento.

Benjamin C. Lee, professor de engenharia e ciência da computação na Universidade da Pensilvânia, explica a distinção. Um modelo "open-weight" permite que qualquer pessoa utilize o modelo, o personalize ou o refine para uma aplicação específica. Se os modelos comerciais são uma "caixa negra" e os "open-source" permitem personalização total, os "open-weight" situam-se a meio caminho, oferecendo um elevado grau de flexibilidade sem expor a "receita secreta" da empresa.

Disponibilizar um modelo totalmente "open-source" seria um risco, pois um rival poderia usar os dados e o código para fazer engenharia inversa da sua tecnologia.

Os novos modelos em detalhe: gpt-oss-120b e gpt-oss-20b

A principal diferença entre os dois novos modelos reside no número de parâmetros, que são, no fundo, as variáveis que o modelo de IA pode ajustar para formular uma resposta.

  • gpt-oss-120b: É um modelo com 117 mil milhões de parâmetros. Para o utilizar eficientemente, a OpenAI recomenda uma única GPU com 80GB de memória.

  • gpt-oss-20b: O seu irmão mais novo possui 21 mil milhões de parâmetros. A boa notícia é que pode ser executado em qualquer computador moderno com 16GB de RAM, permitindo, por exemplo, analisar código diretamente na sua máquina sem ligação à internet.

Ambos os modelos são disponibilizados sob a licença Apache 2.0, que oferece uma grande flexibilidade para modificação e utilização.

Capacidades e limitações: o que se pode fazer com os gpt-oss?

Apesar de não serem um lançamento comercial, a OpenAI afirma que estes modelos são, em muitos aspetos, comparáveis aos seus sistemas proprietários. Oferecem capacidades avançadas como o raciocínio em "cadeia de pensamento" (chain-of-thought), que lhes permite decompor problemas complexos em etapas mais pequenas, e sabem utilizar ferramentas como a web e linguagens de programação como o Python quando precisam de ajuda.

A grande limitação é que não possuem capacidade multimodal, ou seja, não conseguem processar imagens, vídeo ou voz. Para tal, os utilizadores ainda terão de recorrer aos modelos comerciais da OpenAI na cloud.

Em termos de desempenho, em testes de programação de nível competitivo, o gpt-oss-120b obteve uma pontuação apenas ligeiramente inferior à do o3, o modelo de raciocínio de ponta da OpenAI. Já o gpt-oss-20b posicionou-se entre o o3-mini e o o4-mini.

Uma mudança de rumo para a OpenAI e um recado para a Meta

Este lançamento surge numa altura interessante, pouco depois de Mark Zuckerberg ter sinalizado que a Meta iria lançar menos modelos abertos ao público, uma inversão na sua estratégia anterior. O momento, acidental ou não, coloca a Meta numa posição algo embaraçosa junto da comunidade de entusiastas que valorizam o acesso aberto a estas tecnologias. O cenário competitivo na área da Inteligência Artificial continua, assim, ao rubro, com movimentações estratégicas constantes, como se tem vindo a assistir com outras empresas do setor.

"Pode-se argumentar que os modelos 'open-weight' democratizam o acesso aos modelos mais capazes para pessoas que não têm centros de dados massivos", afirma o Professor Lee. "Permite que as pessoas usem os produtos de um processo de treino de meses sem terem de investir nessa infraestrutura."

A OpenAI já está a colaborar com várias organizações, como a AI Sweden, para implementar versões personalizadas destes modelos. A empresa vê este lançamento como uma experiência: quanto mais pessoas os utilizarem, maior a probabilidade de a OpenAI lançar mais modelos "open-weight" no futuro.




Aplicações do TugaTechAplicações TugaTechDiscord do TugaTechDiscord do TugaTechRSS TugaTechRSS do TugaTechSpeedtest TugaTechSpeedtest TugatechHost TugaTechHost TugaTech