terça-feira, 17 de dezembro de 2024

A corrida da IA está empatada – Pedro Doria

O Globo

É difícil afirmar, com clareza, qual empresa está à frente na capacidade de seus modelos

Os lançamentos anunciados na semana passada por OpenAI e Google deixam claro que a corrida pela inteligência artificial apertou. É difícil afirmar, com clareza, qual empresa está à frente na capacidade de seus modelos. Há diferenças, mas são cada vez menos de ordem tecnológica. E a briga não é apenas entre o GPT da OpenAI e o Gemini do Google — há pelo menos um terceiro na disputa, chegando bem perto dos concorrentes. É o Claude, da Anthropic.

As três empresas não facilitam a vida de ninguém. Os nomes que usam para as versões de cada modelo seguem lógicas que nos escapam. O GPT opera, hoje, com três modelos essenciais: 4o, 4o mini, 4o1. O Gemini está na versão 1.5 e caminha para lançar a versão 2.0 em breve. Parece um salto, mas não é. Ampliará a capacidade de um mesmo modelo. O Claude, da Anthropic, está no Sonnet 3.5. Seu modelo alternativo é o Opus 3. Mas a diferença entre um e outro não é de todo clara.

Porque o modelo, na essência, é bem específico. Os cientistas reuniram uma grande base de dados, uma quantidade colossal de textos. É muito, mesmo, e a melhor metáfora para dar conta do volume é a proposta por Yann LeCun, francês que é vice-presidente de IA da Meta. Esses modelos todos têm, por base, uma quantidade de textos que tomariam, de um ser humano, 20 mil anos para ler tudo. “Quantidade colossal” não é hipérbole, é descrição fria. O modelo básico se treina com todas essas palavras, entende a lógica pela qual textos se estruturam, aprende informações que estão nos textos. Esse modelo básico vai aos poucos ganhando novas habilidades, novos usos. Mas eles têm, na base, o mesmo treinamento a partir de um único banco de dados.

Todos os GPTs 4 têm a mesma base. Claude, os dois, têm uma só base. Gemini 1.5 ou 2.0, a mesma coisa. São modelos diferentes, construídos com bancos de textos de mais ou menos o mesmo tamanho, com capacidades bastante equivalentes. Representam a segunda geração de modelos de linguagem de grande porte, LLM na sigla em inglês. As companhias estão treinando a terceira geração de LLMs, que serão construídas com uma quantidade ainda maior de textos. Muitas vezes maior. Aí, outro número ajuda a compreender quão distintas serão. Para treinar um modelo atual, de segunda geração, só a base, o custo aproximado é US$ 100 milhões. Para treinar um modelo de terceira geração, será preciso US$ 1 bilhão. As três companhias — e não só elas, pois Meta e xAI (de Elon Musk) também estão na corrida — querem ser as primeiras a botar um modelo novo na praça. 

Nenhum dos lançamentos da última semana representa um salto geracional. Estamos há pouco mais de um ano trabalhando no mesmo nível. Os sistemas não ficaram mais inteligentes. Mas ficaram capazes de fazer mais coisas. Tanto OpenAI quanto Google afirmaram, na semana passada, que será possível ligar a câmera do celular, mostrar para o ChatGPT ou o Gemini o que está à nossa volta e fazer perguntas. Mostre os ingredientes na mesa da cozinha e peça ajuda para fazer um bolo de laranja. O app não dará só a receita. Também dirá para você botar um pouco menos de farinha. Numa das demonstrações do Google, o app viu um exame de imagem em tempo real e detectou que o paciente tinha uma pancreatite.

As três companhias esperam, no ano que vem, que seus apps possam nos poupar de trabalho braçal. Nesse caso, a Anthropic pulou na frente e já botou uma versão beta no ar. A ideia é permitir que o modelo de IA assuma o controle de seu computador. Encontre uma receita e peça ao app que compre os ingredientes. Ele vai a seu supermercado favorito, entra com seu login e senha, substitui itens quando necessário, paga com seu cartão. A IA será capaz de executar tarefas por você. Fará compras de passagens aéreas no dia mais propício para aquela viagem no fim do ano. As possibilidades são imensas.

Mas chama a atenção quanto essas três empresas estão parelhas. Há um ano, a OpenAI estava bastante à frente da concorrência. Isso acabou. Se houvesse um ranking, OpenAI e Google estariam empatadas, Anthropic colando atrás. Meta e xAI acelerando quanto podem. Numa hora dessas, dinheiro pode fazer diferença e até mudar o quadro. Porque o Google tem muito dinheiro e um mundo de servidores próprios. Meta, idem. xAI não tem, mas Elon Musk tem dinheiro de sobra e será o regulador da tecnologia americana num governo que promete pura fisiologia.

É possível imaginar a OpenAI derrapando? Claro que é.

 

Nenhum comentário:

Postar um comentário

Observação: somente um membro deste blog pode postar um comentário.