Há um ditado comum nos círculos tecnológicos: os Estados Unidos são bons em inovação, passando de zero a um, enquanto a China é boa em aplicações comerciais, ou seja, passando de um a 100. Por um tempo, parecia que o mesmo se aplicaria a Para a inteligência artificial (IA), onde os modelos e pesquisas de fronteira de maior ponta foram criados por startups dos EUA como o OpenAI, que eram considerados dois a três anos antes de seus colegas chineses. No entanto, o rápido lançamento de dois novos modelos da empresa chinesa Deepseek-a V3 em dezembro e a R1 deste mês-está enfrentando essa suposição profundamente enraizada, provocando uma derrota histórica nos estoques de tecnologia dos EUA.
O modelo de raciocínio R1 da Deepseek corresponde (e às vezes batidas) OpenAI’s O1 em uma variedade de tarefas de matemática, código e raciocínio – e a 2 % do preço deste último. Um modelo de IA chinês agora é tão bom quanto os líderes de modelos de IA dos EUA, usando apenas uma pequena fração dos recursos da GPU disponíveis.
Isso é notável e um gamechanger para a corrida armamentista global da IA. Primeiro, isso significa que o jogo não é mais reservado para jogadores de bolso profundo com estoques de chip (como os Estados Unidos e a China). Essa também foi uma vantagem americana importante, uma vez considerada um fosso crítico na manutenção da lacuna de capacidade entre os modelos nós e chineses. Deepseek mostrou que as inovações algorítmicas podem superar as leis de escala. Diante de chips limitados devido aos controles de exportação dos EUA, a empresa chinesa empregou técnicas inovadoras de otimização de software, desde arquiteturas escassas da mistura de especialistas até a quantização, o que lhes permitia alcançar a eficiência de custos sem precedentes enquanto supera os modelos concorrentes.
Como o fundador da Deepseek, Liang Wenfeng, que é pesquisador de IA por treinamento, disse em um entrevista No ano passado, “em face das tecnologias disruptivas, os fossos criados por fonte fechada são temporários. Mesmo a abordagem de fonte fechada da OpenAI não pode impedir que outras pessoas o encontrem. ”
A capacidade da Deepseek de alcançar modelos de fronteira em questão de meses mostra que nenhum laboratório, fechado ou código aberto, pode manter uma vantagem tecnológica real e duradoura. Entramos em uma era da competição de IA, onde é provável que o ritmo da inovação se torne muito mais frenético do que todos esperamos, e onde mais pequenos jogadores e poderes médios estará entrando na briga, usando as estratégias de treinamento compartilhado por Deepseek.
Segundo, a China está se tornando líder global em código aberto da IA. A Deepseek é apenas uma das muitas empresas de IA chinesas que estão totalmente abertas seus modelos-permitindo que desenvolvedores em todo o mundo usem, reproduzem e modifiquem seus modelos de pesos e métodos. A grande gigante da tecnologia da China, Alibaba, fez de Qwen, seu principal modelo de Fundação AI, de código aberto. Então, as startups de IA mais recentes, como o Minimax, que também foram lançadas em janeiro, uma série de modelos de código aberto (fundamental e multimodal, ou seja, capaz de lidar com vários tipos de mídia).
Os testes competitivos de benchmark mostraram que o desempenho desses modelos de código aberto chinês está em pé de igualdade com os melhores modelos ocidentais de código fechado. Ao abraçar o rosto, uma plataforma americana que hospeda um repositório de ferramentas e dados de código aberto, os LLMs chineses estão regularmente entre os mais baixados. Isso não apenas traz mais desenvolvedores globais ao seu ecossistema, mas também induz mais inovação.
Pense em um LLM como um sistema operacional – semelhante ao iOS da Apple e ao Android do Google – onde os usuários podem desenvolver novos aplicativos. Manter os melhores modelos dos Estados Unidos, o Sprorce fechado, significa que a China está melhor pronta para expandir sua influência tecnológica em países que disputam o acesso às ofertas de ponta a um baixo custo. Essas empresas de IA chinesas também estão ironicamente democratizando o acesso à IA e mantendo a missão original do OpenAI vivo: Avançando a IA para o benefício da humanidade. Países fora das superpotências de IA ou hubs de tecnologia bem estabelecidos agora têm uma chance de desbloquear uma onda de inovação usando métodos de treinamento acessíveis.
Três, os controles de exportação dos EUA não têm mais um domínio do progresso da IA. Empresas chinesas como a DeepSeek demonstraram a capacidade de alcançar avanços significativos de IA, treinando seus modelos em NVIDIA H800, compatível com exportação-uma versão rebaixada dos chips de IA mais avançados usados pela maioria das empresas dos EUA-e aproveitando sofisticados técnicas de software. Muitas das táticas de “estrangulamento” dos Estados Unidos até agora se concentraram no hardware, mas o cenário de inovações algorítmicas em rápida evolução significa que Washington pode precisar explorar rotas alternativas de controle de tecnologia. Como muitos apontaram, a necessidade é realmente a mãe da invenção. Incapaz de confiar nas últimas fichas, Deepseek e outros foram forçados a fazer mais com menos e com ingenuidade em vez de força bruta.
Não há como subestimar esse marco. Enquanto muitos haviam contado a China na corrida de IA devido à enxurrada de controles de exportação dos EUA, o DeepSeek mostra que a China está de volta e pode estar na liderança. Se os esforços ocidentais para dificultar ou prejudicar o progresso da IA da China provavelmente serão inúteis, então a corrida real apenas começou: engenharia criativa e enxuta será o que vence o jogo; Não pura peso financeiro e controles de exportação.