Como o DeepSeek superou o ChatGPT mesmo com as sanções dos EUA

História é um exemplo fascinante de como a inovação pode surgir em momentos de extrema adversidade

Autor convidado
por | 27/01/2025 às 15:43

Por Gustavo Stork*

A história da DeepSeek é um exemplo fascinante de como a inovação pode surgir em momentos de extrema adversidade.

A startup chinesa está desafiando gigantes como OpenAI, Google e Anthropic, provando que limitações podem ser o motor da criatividade.

Com as sanções dos EUA impedindo a importação de componentes da Nvidia, empresa que domina o mercado de hardware para inteligência artificial, a DeepSeek enfrentou um cenário quase impossível.

Limitada a poucas unidades de placas da Nvidia e com recursos financeiros modestos, a equipe foi forçada a repensar o desenvolvimento de grandes modelos de linguagem (LLMs). Em vez de recuar, eles decidiram inovar.

Com um investimento de pouco mais de US$ 5 milhões, a DeepSeek desenvolveu um modelo que superou o ChatGPT em diversos benchmarks. O grande diferencial? Sua eficiência.

Graças à tecnologia Mixture of Experts (MoE), a DeepSeek criou um modelo com 671 bilhões de parâmetros, mas que utiliza apenas 37 bilhões a cada interação.

Essa abordagem reduz drasticamente a demanda por poder computacional e torna o modelo 27,4 vezes mais econômico que seus concorrentes ocidentais.

Como funciona a tecnologia do Deepseek?

Enquanto os modelos tradicionais ativam todos os seus parâmetros simultaneamente, o MoE funciona como uma equipe de especialistas: apenas os “membros” mais qualificados para uma tarefa específica são ativados.

Essa eficiência não só economiza recursos, mas também abre caminho para um desempenho impressionante.

Os resultados são evidentes. O modelo da DeepSeek não apenas supera benchmarks tradicionais, mas também apresenta uma performance superior em testes lógicos e matemáticos.

Além disso, sua gratuidade tem acelerado sua adoção global, desafiando modelos pagos de grandes empresas ocidentais.

No entanto, é importante destacar que o modelo da DeepSeek reflete alinhamentos políticos característicos do governo chinês.

Apesar disso, sua eficiência e acessibilidade têm gerado uma rápida expansão em mercados globais.

Uma nova era de disrupção na IA?

O sucesso da DeepSeek nos leva a repensar paradigmas do setor de IA. Por anos, acreditou-se que grandes resultados dependiam de grandes investimentos.

Mas a DeepSeek mostra que engenhosidade e criatividade podem superar até mesmo barreiras tecnológicas e financeiras aparentemente intransponíveis.

Será que estamos testemunhando o início de uma nova era, onde a inovação supera o capital?

E mais: será que iniciativas ocidentais, como o projeto Stargate (US$ 500 bilhões), estão preparadas para enfrentar esta nova onda de disrupção?

*Gustavo Stork é especializado em IA para marketing e fundador da startup The CMOs

Compartilhe:
Notícias mais populares