Nature & SpaceNature & Space

DeepSeek é um o chatbot de IA chinês capaz de ameaçar a hegemonia da OpenAI, Meta, Gemini e outros chats de IA. Essa IA de código aberto tem alta eficiência energética, baixo custo e precisão. Após poucos dias do lançamento atingiu o topo entre os mais baixados da App Store nos EUA.

Disponível na plataforma Hugging Face, o R1 pode ser usado comercialmente sem restrições, tornando-se uma alternativa acessível para desenvolvedores e pesquisadores.

O DeepSeek-R1 se destaca por sua capacidade de verificar fatos e evitar erros comuns em outros modelos. Com seu método inovador, a IA chinesa venceu o modelo da OpenAI em testes de raciocínio.

Os diferenciais do DeepSeek: Baixo custo, método eficiente e código aberto.

O DeepSeek-R1 é um marco importante no desenvolvimento da inteligência artificial, demonstrando o potencial da China nesse campo e desafiando as lideranças estabelecidas. (Imagem: Mojahid Mottakin/Shutterstock)

O principal diferencial do modelo DeepSeek-R1 está em sua gratuidade de utilização por usuários individuais e o baixíssimo custo para desenvolvedores, cobrando apenas US$ 0,14 por milhão de tokens, contra os US$ 2,50 do modelo GPT-4o, quase 18x mais barato.

Para maximizar o desempenho, o modelo utiliza sistema de aprendizado por reforço, abordagem em IA que imita o processo de “tentativa e erro”, descartando respostas ruins e reforçando respostas boas.

Nature & SpaceNature & Space

O sistema de aprendizado por reforço do DeepSeek consegue reduzir os custos operacionais e de treinamento da DeepSeek, utilizando cerca de 2 mil chips especializados da NVIDIA para treinar seus modelos mais avançados, enquanto as gigantes ocidentais utilizando mais de 16 mil chips.

Na prática, tanto a interface quanto às interações com o modelo da DeepSeek são muito similares com o ChatGPT, mas com dois botões na barra de prompt para ativar as funcionalidades de busca na web e motor de raciocínio lógico. 

Com 671 bilhões de parâmetros, o modelo completo exige hardware robusto, mas a DeepSeek oferece também versões mais leves que podem rodar até em notebooks.

Destaques do DeepSeek

1. DeepSeek é acessível

A IA é gratuita e não limita o número de mensagens para o usuário. Ela já está disponível tanto nas lojas de aplicativos quanto nos navegadores, em diversos idiomas, como o português. 

2. Modelo open source

O modelo utilizado pelo DeepSeek é o DeepSeek-V3, que é open source. Isso significa que o código-fonte do software pode ser utilizado e modificado, de forma gratuita, por qualquer pessoa, para corrigir Bugs, por exemplo. 

3. Desenvolvimento mais barato

Um dos motivos para o grande impacto no mercado foi o custo para desenvolver o DeepSeek. A IA chinesa investiu menos de US$ 6 milhões no software, enquanto a OpenAI gastou mais de US$ 100 milhões no desenvolvimento do ChatGPT.

4. IA mais eficiente

Diferente do treinamento de IA feito pelas big techs dos EUA, o DeepSeek possui um modelo em que as máquinas aprendem com elas mesmas. Isso torna a estrutura do produto mais simples, mais eficiente e mais barato.

5. DeepSeek mostra o que está “pensando”

Um grande diferencial do DeepSeek em relação aos concorrentes é a ferramenta “Deep Thinking (R1)”, disponível para todos os usuários, mostra o que a IA “pensou” para entregar a resposta ao seu comando.

Este recurso torna possível entender quais caminhos a IA toma, facilitando o entendimento sobre seu funcionamento. 

A Empresa DeepSeek e os Gênios desenvolvedores

Ao falar de tecnologia disjuntiva é importante citar quem são os mentores por trás da IA. Nesse aspecto, dois gênios se destacam no desenvolvimento do Chat de IA DeepSeek. Uma Garota Prodígio e o SEO Nerd da empresa.

Luo Fuli, a garota prodígio do DeepSeek

Retrato de Luo Fuli no Linkedin — Foto: Reprodução

A garota prodígio do DeepSeek, Luo Fuli, 29 anos, é uma das principais desenvolvedoras do chatbot chinês
Formada pela Universidade de Pequim, Luo Fuli desempenha papel crucial na empresa chinesa, criando modelos avançados de código aberto.

Graduada pela Universidade de Pequim, ela deu um salto na carreira quando publicou oito artigos em um único ano na Association for Computational Linguistics, maior associação especializada em linguagem natural do mundo.

No Alibaba, Luo trabalhou como pesquisadora na Damo Academy, centro de pesquisa da empresa, onde liderou o desenvolvimento de um modelo multilíngue e ajudou a desenvolver um projeto de código aberto.

Apesar de receber uma oferta atraente de US$ 10 milhões da Xiaomi, Luo tomou a decisão ousada de deixar o Alibaba em 2022 e se juntar à DeepSeek, uma escolha que provaria ser transformadora.

Liang Wenfeng, o CEO Nerd fundador da DeepSeek

O fundador da DeepSeek, Liang Wenfung (à direita), em uma recente reunião do governo da China

Não se sabe muito sobre Liang Wenfeng fundador da DeepSeek, homem de 40 anos, que nasceu em Guangdong, no sul da China, e se formou na Universidade de Zhejiang em engenharia de informação eletrônica e ciência da computação.

Em um artigo no site de tecnologia 36Kr, pessoas que o conhecem dizem que ele é “mais como um nerd do que um chefe”.

Liang, que raramente faz aparições públicas ou dá entrevistas, agora está sob os holofotes internacionais.

O surgimento da Startup Chinesa DeepSeek

Os desenvolvedores do DeepSeek dizem que o chatbot foi construído por uma fração do custo de rivais como o ChatGPT. Foto Reuters

A startup chinesa DeepSeek surgiu de um braço de pesquisa do fundo de hedge quantitativo High-Flyer, fundado em 2015 com foco em computação avançada para análises financeiras.

Com o avanço dos estudos em análises de dados financeiros, Liang Wenfeng, fundador e CEO do fundo, estabeleceu em 2019 que a High-Flyer passaria a focar no desenvolvimento e aplicação de algoritmos de negociação de IA.

Apenas em 2023, já com o ChatGPT operando publicamente, Wenfeng determinou a criação da Fire-Flyer, laboratório especializado dedicado à pesquisa de Inteligência Artificial Geral (AGI), que posteriormente deu origem à DeepSeek.

Ainda em 2023, a empresa chegou a lançar os modelos de linguagem DeepSeek Coder, para geração de códigos, e o DeepSeek LLM, cujo desempenho seria equivalente ao do GPT-4, mas que enfrentou problemas de escalabilidade e eficiência computacional.

No entanto, a experiência serviu de base para o desenvolvimento do DeepSeek-R1, inclusive de seu treinamento, fazendo com que o modelo liberado em janeiro de 2025 alcançasse o topo da lista de apps mais baixados para iOS das últimas semanas nos EUA.

Possíveis desdobramentos Geopolíticos

(Imagem: Rokas Tenys/Shutterstock)

O salto repentino de interesse dos estadunidenses por mais um aplicativo chinês pode resultar em novos imbróglios internacionais, principalmente com o novo mandato de Donald Trump, que assumiu a presidência dia 20 de janeiro.

Em seu primeiro mandato, Trump foi pivô das movimentações que desencadearam atritos com o TikTok sob a premissa de a empresa oferecer riscos para a segurança nacional.

O governo estadunidense tem histórico de intervir diretamente na penetração de produtos estrangeiros no país, já tendo agido diretamente para barrar a entrada de carros eletrificados chinesas após a Tesla começar a perder mercado.

Especificamente no setor de computação de alto desempenho (HPC) e Inteligência Artificial, tanto a primeira administração Trump quanto o governo de Joe Biden também passaram uma série de emendas restringindo a exportação de tecnologia destes setores para barrar o avanço da China.

Contudo, desta vez os EUA terão que conviver com empresas chinesas lideres mundiais em tecnologia de IA com sede na própria China, e não nos EUA.

Alem disso, a DeepSeek e outras empresas chinesas estão lançamento modelos de IA tão competentes quanto os da OpenA apesar das sanções, e por uma pequena fração do investimento. Em especial, usando de forma crescente chips de sucesso desenvolvidos na própria China.

Os ganhadores será a sociedade em todos os países, e as próprias empresas de desenvolvimento de tecnologia e IA, que agora poderão baixar custo de implantação e ofertar novos serviços. Com uma evolução mais distribuída geograficamente, a tecnologia estará acessível aos países do sul global, principalmente.

Política de Uso 

A reprodução de matérias é livre mediante a citação do título do texto com link apontando para este texto. Crédito do site Nature & Space 

DEEPSEEK: A REVOLUCIONARIA IA CHINESA E SEUS GÊNIOS MENTORES LUO FULL E LIANG WENFENG

Fonte

Época

Luo Fuli: A garota prodígio do DeepSeek desenvolvedora do chatbot chinês

BBC

Liang Wenfeng? O cérebro por trás do DeepSeek

TecTudo

DeepSeek: conheça modelo de IA da China que pode superar o ChatGPT

Canaltech

5 pontos para entender o DeepSeek, a IA chinesa concorrente do ChatGPT

LEAVE A REPLY

Please enter your comment!
Please enter your name here