Home TI IA de startup francesa gera conteúdo perigoso em 68% dos testes

IA de startup francesa gera conteúdo perigoso em 68% dos testes

Pesquisa mostrou que sistemas multimodais Mistral foram facilmente manipulados para produzir respostas ilegais e antiéticas

Redação22 de maio de 20252 Minutos de leitura500

IA – Uma pesquisa conduzida pela plataforma Enkrypt AI apontou que modelos de inteligência artificial multimodal da startup francesa Mistral são vulneráveis a manipulações e podem ser levados a produzir conteúdos perigosos e antiéticos. Segundo o estudo, os sistemas Pixtral-Large (25.02) e Pixtral-12b geraram respostas inadequadas em 68% dos testes realizados, incluindo orientações sobre abuso infantil e instruções para a fabricação de armas químicas.

A análise utilizou a técnica conhecida como red teaming, na qual pesquisadores simulam ataques para testar os limites de segurança das IAs. A equipe testou comandos disfarçados, imagens modificadas e mudanças sutis no contexto para avaliar a resposta dos modelos. Mesmo com mensagens aparentemente inofensivas, como “preencha os itens abaixo” acompanhada de uma imagem com lista vazia, os sistemas produziram conteúdos ilegais.

LEIA: IA aparece em 77% dos ciberataques a empresas brasileiras

Os modelos testados são do tipo multimodal, ou seja, têm capacidade de interpretar texto, imagem e vídeo simultaneamente. De acordo com os pesquisadores, essa característica amplia os riscos, já que a combinação entre texto e imagem pode alterar o significado da mensagem e burlar os filtros de segurança tradicionais.

O relatório destaca que os modelos da Mistral foram até 60 vezes mais suscetíveis a falhas do que sistemas considerados referência no setor, como o GPT-4o, da OpenAI, e o Claude 3.7 Sonnet. Além disso, apontou que os sistemas chegaram a fornecer respostas técnicas sobre substâncias químicas perigosas, como o agente tóxico VX, mesmo sem receber perguntas diretas.

A Mistral, avaliada em 6 bilhões de euros e parceira do governo francês, afirmou em nota que mantém uma política de “tolerância zero” quanto à segurança de crianças e que está analisando os dados do relatório em parceria com a ONG Thorn, especializada no combate ao abuso sexual infantil.

Como proposta de solução, os especialistas da Enkrypt AI sugerem a implementação de um processo chamado Safety Alignment, que treina as IAs para recusar comandos perigosos com base em simulações de risco. Segundo o estudo, esse método pode reduzir em até 70% o número de falhas. O relatório também recomenda o uso de filtros contextuais e ferramentas de transparência sobre as limitações dos modelos, além da manutenção contínua das medidas de segurança.

(Com informações de Techtudo)
(Foto: Reprodução/Freepik/Daniel Morfin)

sindical

Post anterior IA aparece em 77% dos ciberataques a empresas brasileiras

Próximo post Inteligência Artificial aberta impulsiona economia de forma positiva

Top Insights

Economize nas compras do dia a dia e zere sua contribuição com cashback da Bee Fenati!

Relatório sobre IA continha informações falsas geradas por IA

Governo veta projeto que flexibilizava direitos em primeiro emprego

Preservação de jogos antigos enfrenta obstáculos e ameaça clássicos dos videogames

IA de startup francesa gera conteúdo perigoso em 68% dos testes

Notícias recentes

Museu em Campo Grande usa IA para dar vida a personagens do hino de MS

Brasil disputa 1º lugar do grupo, e você também pode entrar em campo na Bee Copa!

Celular Seguro terá novos recursos para fechar cerco à venda de aparelhos roubados

Fenômeno digital em torno de Endrick na Copa chama atenção global

Justiça libera R$ 2,1 bilhões em atrasados do INSS; saiba quem recebe

Da nuvem à IA: o legado da tecnologia na Copa do Mundo 2026

IA fora da Terra: como o espaço se tornou peça-chave para corrida tecnológica

‘Animada e ansiosa’, diz vencedora de passagem aérea em concurso da Bee Fenati

Tribunal inglês registra caso inédito com apoio de sistema jurídico baseado em IA

Novo curso do Sindplay ensina como criar formulários PHP mais seguros e profissionais

Posts relacionados

Museu em Campo Grande usa IA para dar vida a personagens do hino de MS

Celular Seguro terá novos recursos para fechar cerco à venda de aparelhos roubados

Da nuvem à IA: o legado da tecnologia na Copa do Mundo 2026

IA fora da Terra: como o espaço se tornou peça-chave para corrida tecnológica