Alibaba lança modelo de Inteligência Artificial e alega ter superado DeepSeek
Inteligência Artificial – Na última semana do mês de janeiro, a empresa chinesa de tecnologia Alibaba lançou a atualização mais recente de seu modelo de inteligência artificial, o Qwen 2.5. De acordo com a companhia o produto superou o DeepSeek-V3.
A data de lançamento inusitada, no primeiro dia do Ano Novo chinês, em que boa parte dos trabalhadores estão de folga, revela o acirramento da corrida tecnológica causado pela DeepSeek. Além dos concorrentes estrangeiros, pressão também atingiu empresas conterrâneas.
LEIA: “Microaposentadoria”: Geração Z investe em pausas na carreira para evitar esgotamento mental
“O Qwen 2.5-Max supera (…) quase todos os GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, afirmou a unidade de computação em nuvem da Alibaba. O anúncio foi publicado na rede social WeChat e faz referência, além do DeepSeek, aos modelos de IA de código aberto mais avançados da Open AI e da Meta.
O lançamento no dia 10 de janeiro do assistente de IA da DeepSeek, equipado com o modelo DeepSeek-V3, e, no dia 20, do modelo R1, chocou o Vale do Silício e derrubou ações de empresas de tecnologia ao redor do mundo.
Porém o sucesso da empresa chinesa também pressionou outras empresas do país para atualizar os seus modelos de IA.
A ByteDance, proprietária do Tik Tok, lançou uma atualização do seu principal modelo de IA dois dias depois do lançamento do DeepSeek-R1. De acordo com a companhia, o produto superou o o1, principal modelo de inteligência artificial da Meta. A comparação foi feita com o teste AIME, que mede a capacidade de uma IA em entender e responder a instruções complexas.
A novidade ecoou na DeepSeek, que havia afirmado que o seu R1 rivalizava com o o1 em vários benchmarks de desempenho.
Disputa interna
Antes do modelo V3, a empresa chinesa já havia causado agitações no mercado doméstico com o seu V2, lançado em maio de 2024. Houve uma guerra de preços após o seu lançamento.
O fato de o DeepSeek-V2 ser de código aberto e barato, apenas 1 iuan (R$ 0,81) por 1 milhão de tokens —ou unidades de dados processados pelo modelo de IA— fez com que a unidade de computação em nuvem da Alibaba anunciasse cortes de preços de até 97% em uma série de modelos.
Outras empresas chinesas de tecnologia seguiram o exemplo. A Baidu, que lançou o primeiro equivalente ao ChatGPT ainda em 2023, e a Tencent, empresa de tecnologia mais valiosa da China, são dois exemplos.
Em uma rara entrevista, o fundador da DeepSeek, Liang Wenfeng, declarou que “não se importava” com guerras de preços e que alcançar a AGI (inteligência artificial geral) é seu principal objetivo.
AGI são sistemas autônomos que superam seres-humanos em atividades de alto valor econômico, conforme definição da OpenAI.
Enquanto outras empresas chinesas de tecnologia, como a Alibaba, têm em seu corpo centenas de milhares de funcionário, a Deep Seek chama atenção por operar como um laboratório de pesquisa. Nele operam jovens graduados e doutorandos das principais universidades chinesas.
O próprio Liang afirmou na entrevista que não acreditava que as grandes big techs da China fossem adequadas para o futuro da IA no país. Ele apontava a diferença entre as estruturas verticalizadas e onerosas com o modelo mais flexível e enxuto da DeepSeek.
“Grandes modelos fundamentais exigem inovação contínua, as capacidades dos gigantes da tecnologia têm seus limites”, afirmou na ocasião.
(Com informações de Folha de S. Paulo)
(Foto: Freepik/Reprodução)
Sentimento de insatisfação na carreira nem sempre está ligado apenas ao cansaço, explicam especialistas
Criminosos estão comprometendo ferramentas usadas por desenvolvedores, criando ciclo de infecções capaz de atingir milhares…
Estudos apontam mudanças em áreas do cérebro ligadas à aprendizagem, memória e tomada de decisões