Estudo Afirma que os Dados de IA Contaminam a Entrada Humana Vital.

Estudo Afirma que os Dados de IA Contaminam a Entrada Humana Vital.

Aproximadamente 250.000 pessoas são empregadas pelo mercado Mechanical Turk da Amazon, que é apenas uma das várias plataformas que oferecem serviços semelhantes.


Nos anos 2000, Jeff Bezos introduziu o conceito de “turcos mecânicos”, que envolvia a contratação de trabalhadores remotos para tarefas simples que os computadores encontravam desafiadoras. Esses trabalhadores, frequentemente pagos com baixos salários, colaboravam com vários outros para completar pequenas partes de projetos computacionais maiores. Bezos alcunhou o termo “inteligência artificial” para descrever essa fusão entre inteligência humana e digital, com o objetivo de incorporar uma perspectiva humana em tarefas com as quais os computadores tinham dificuldade, principalmente aquelas de natureza mais simples.

Aproximadamente 250.000 pessoas são empregadas por meio do mercado Mechanical Turk da Amazon, que é apenas uma das várias plataformas que oferecem serviços semelhantes.

A Crescente Dependência dos Trabalhadores Humanos em Conteúdo Gerado por IA

Recentemente, pesquisadores da Universidade EPFL, com sede na Suíça, destacaram uma tendência preocupante: trabalhadores que anteriormente forneciam contribuições humanas valiosas agora estavam dependendo de conteúdo gerado por IA para concluir suas tarefas. Eles alcunharam o termo “inteligência artificial” para descrever esse fenômeno.

Embora o termo possa causar risos, os pesquisadores expressam sérias preocupações sobre as implicações. Eles argumentam que se os trabalhadores passarem a depender cada vez mais de geradores de IA para cumprir suas tarefas, isso diminuiria significativamente a confiabilidade dos dados obtidos por meio de colaboração em massa.

Grandes modelos de linguagem (GLMs) são excelentes em processar dados de treinamento, mas há certas tarefas em que a contribuição humana continua sendo superior. Os humanos são mais eficientes em rotular dados para entrada em modelos, descrever imagens e responder a telas CAPTCHA em comparação com os computadores.

As Possíveis Armadilhas do Crowdsourcing com Grandes Modelos de Linguagem

A tentação de usar o crowdsourcing para validar as saídas de grandes modelos de linguagem ou criar dados humanos de referência pode levar a um problema: e se os trabalhadores em massa também usarem os GLMs para aumentar sua produtividade e renda nas plataformas de crowdsourcing?

Esse cenário contaminaria o conjunto de dados, potencialmente comprometendo a confiabilidade das operações baseadas em IA.

O termo “turco” tem origem em um “robô” enxadrista do século XVIII que derrotava jogadores de xadrez em toda a Europa, enganando-os a acreditar que estavam jogando contra uma máquina. Hoje, o crowdsourcing com “turcos” se tornou uma indústria bilionária, embora sua reputação tenha sido prejudicada por baixos salários.

No entanto, a indústria agora enfrenta uma ameaça devido à rápida adoção de grandes modelos de linguagem. Um estudo recente constatou que um modelo turbo ChatGPT 3.5 teve um desempenho significativamente melhor do que os trabalhadores em massa a uma fração do custo.

À medida que os trabalhadores enfrentam uma pressão crescente para produzir mais resultados em um ritmo mais rápido, eles podem cada vez mais contar com recursos de IA. Os pesquisadores da EPFL estimaram que de 33% a 46% das atribuições dos trabalhadores na plataforma Mechanical Turk da Amazon foram concluídas com a ajuda de grandes modelos de linguagem, com base em um estudo limitado.

Os pesquisadores alertam que, à medida que os grandes modelos de linguagem ganham popularidade e surgem modelos multimodais que suportam entrada e saída de texto, imagem e vídeo, medidas devem ser tomadas para garantir que os dados humanos permaneçam distintamente humanos. Suas descobertas servem como um sinal de alerta para plataformas, pesquisadores e trabalhadores em massa encontrarem novas abordagens para preservar o elemento humano nos dados.


Leia O Artigo Original Em TechXplore.

Leia Mais: A Estrutura De IA Aprimora A Análise De Comunicação No treinamento De Equipes

Share this post