A DeepSeek pode DERRUBAR o ChatGPT?

แชร์
ฝัง
  • เผยแพร่เมื่อ 4 ก.พ. 2025

ความคิดเห็น • 2

  • @antoniobranco4323
    @antoniobranco4323 6 วันที่ผ่านมา

    Eles disseram isso e o Lula disse que nós íamos comer picanha e beber cerveja. Você tem alguma coisa técnica para dizer ou é só papo e mais papo?

    • @peolenna
      @peolenna  6 วันที่ผ่านมา

      Você quer detalhes técnicos? Vamos lá. Os modelos DeepSeek V3 e R1 superam o GPT-4o em vários aspectos cruciais. Primeiro, a eficiência computacional: o DeepSeek V3 adota uma arquitetura Mixture-of-Experts (MoE) com 671 bilhões de parâmetros, ativando apenas 37 bilhões por token. Isso resulta em um treinamento mais rápido e econômico, utilizando menos de 2.000 chips Nvidia H800 e custando cerca de US$ 5,6 milhões, enquanto o GPT-4o pode exigir investimentos de até US$ 1 bilhão e mais de 16.000 chips de alta performance. Além disso, o DeepSeek V3 suporta uma janela de contexto de até 128.000 tokens, permitindo processar e gerar respostas mais longas e contextualmente ricas, superando os 8.192 tokens da versão gratuita do GPT-4o. Em benchmarks, o DeepSeek V3 alcançou uma precisão de 88,5% no Massive Multitask Language Understanding (MMLU), comparável aos 86,4% do GPT-4o. No HumanEval, que avalia a capacidade de geração de código, o DeepSeek V3 obteve 82,6%, enquanto o GPT-4o atingiu 67%. Por fim, o DeepSeek adota uma abordagem de código aberto, disponibilizando seus modelos e algoritmos para a comunidade, o que facilita a colaboração e o aprimoramento contínuo, além de promover a democratização do acesso a tecnologias avançadas de IA.
      Em resumo: É superior, mais barato, mais fácil de rodar localmente e de implementar em algum sistema/aplicação mesmo que via API.
      Agora, se você vai acreditar ou não no que eles disseram, aí vai de você.