O Globo
É difícil afirmar, com clareza, qual empresa
está à frente na capacidade de seus modelos
Os lançamentos anunciados na semana passada
por OpenAI e Google deixam
claro que a corrida pela inteligência artificial apertou. É difícil afirmar,
com clareza, qual empresa está à frente na capacidade de seus modelos. Há
diferenças, mas são cada vez menos de ordem tecnológica. E a briga não é apenas
entre o GPT da OpenAI e o Gemini do Google — há pelo menos um terceiro na
disputa, chegando bem perto dos concorrentes. É o Claude, da Anthropic.
As três empresas não facilitam a vida de ninguém. Os nomes que usam para as versões de cada modelo seguem lógicas que nos escapam. O GPT opera, hoje, com três modelos essenciais: 4o, 4o mini, 4o1. O Gemini está na versão 1.5 e caminha para lançar a versão 2.0 em breve. Parece um salto, mas não é. Ampliará a capacidade de um mesmo modelo. O Claude, da Anthropic, está no Sonnet 3.5. Seu modelo alternativo é o Opus 3. Mas a diferença entre um e outro não é de todo clara.
Porque o modelo, na essência, é bem
específico. Os cientistas reuniram uma grande base de dados, uma quantidade
colossal de textos. É muito, mesmo, e a melhor metáfora para dar conta do
volume é a proposta por Yann LeCun, francês que é vice-presidente de IA
da Meta.
Esses modelos todos têm, por base, uma quantidade de textos que tomariam, de um
ser humano, 20 mil anos para ler tudo. “Quantidade colossal” não é hipérbole, é
descrição fria. O modelo básico se treina com todas essas palavras, entende a
lógica pela qual textos se estruturam, aprende informações que estão nos
textos. Esse modelo básico vai aos poucos ganhando novas habilidades, novos
usos. Mas eles têm, na base, o mesmo treinamento a partir de um único banco de
dados.
Todos os GPTs 4 têm a mesma base. Claude, os
dois, têm uma só base. Gemini 1.5 ou 2.0, a mesma coisa. São modelos
diferentes, construídos com bancos de textos de mais ou menos o mesmo tamanho,
com capacidades bastante equivalentes. Representam a segunda geração de modelos
de linguagem de grande porte, LLM na sigla em inglês. As companhias estão
treinando a terceira geração de LLMs, que serão construídas com uma quantidade
ainda maior de textos. Muitas vezes maior. Aí, outro número ajuda a compreender
quão distintas serão. Para treinar um modelo atual, de segunda geração, só a
base, o custo aproximado é US$ 100 milhões. Para treinar um modelo de terceira
geração, será preciso US$ 1 bilhão. As três companhias — e não só elas, pois
Meta e xAI (de Elon Musk)
também estão na corrida — querem ser as primeiras a botar um modelo novo na
praça.
Nenhum dos lançamentos da última semana
representa um salto geracional. Estamos há pouco mais de um ano trabalhando no
mesmo nível. Os sistemas não ficaram mais inteligentes. Mas ficaram capazes de
fazer mais coisas. Tanto OpenAI quanto Google afirmaram, na semana passada, que
será possível ligar a câmera do celular, mostrar para o ChatGPT ou o Gemini o
que está à nossa volta e fazer perguntas. Mostre os ingredientes na mesa da
cozinha e peça ajuda para fazer um bolo de laranja. O app não dará só a receita.
Também dirá para você botar um pouco menos de farinha. Numa das demonstrações
do Google, o app viu um exame de imagem em tempo real e detectou que o paciente
tinha uma pancreatite.
As três companhias esperam, no ano que vem,
que seus apps possam nos poupar de trabalho braçal. Nesse caso, a Anthropic
pulou na frente e já botou uma versão beta no ar. A ideia é permitir que o
modelo de IA assuma o controle de seu computador. Encontre uma receita e peça
ao app que compre os ingredientes. Ele vai a seu supermercado favorito, entra
com seu login e senha, substitui itens quando necessário, paga com seu cartão.
A IA será capaz de executar tarefas por você. Fará compras de passagens aéreas
no dia mais propício para aquela viagem no fim do ano. As possibilidades são
imensas.
Mas chama a atenção quanto essas três
empresas estão parelhas. Há um ano, a OpenAI estava bastante à frente da
concorrência. Isso acabou. Se houvesse um ranking, OpenAI e Google estariam
empatadas, Anthropic colando atrás. Meta e xAI acelerando quanto podem. Numa
hora dessas, dinheiro pode fazer diferença e até mudar o quadro. Porque o
Google tem muito dinheiro e um mundo de servidores próprios. Meta, idem. xAI
não tem, mas Elon Musk tem dinheiro de sobra e será o regulador da tecnologia
americana num governo que promete pura fisiologia.
É possível imaginar a OpenAI derrapando?
Claro que é.
Nenhum comentário:
Postar um comentário
Observação: somente um membro deste blog pode postar um comentário.