Empresas de IA recrutam jornalistas para treinar modelos de linguagem

*Por Andrew Deck 

Em dezembro, Carla McCanna recebeu uma mensagem de um recrutador da Outlier, empresa de treinamento de dados de IA.

McCanna, uma recém-formada da Medill School of Journalism da Northwestern University, nunca tinha ouvido falar da empresa, mas a mensagem veio pelo Handshake, um site de recrutamento hospedado pela universidade. “O recrutador disse que minhas habilidades se alinham com uma função de especialista em escrita e que eu estaria treinando modelos de IA para otimizar a precisão e a eficiência”, McCanna me disse.

Na época, McCanna não tinha experiência em trabalho com dados, aprendizado de máquina ou na indústria de tecnologia. As habilidades que o recrutador mencionou eram sua experiência em jornalismo — suas habilidades profissionais de escrita, pesquisa e checagem de fatos. Ela trabalhou em estágios no The Dallas Morning News e na revista mensal D Magazine e, em agosto passado, obteve seu mestrado em jornalismo.

No entanto, as oportunidades de trabalho são escassas e a competição é assustadora. (Em 2024, a já sitiada indústria de notícias dos EUA cortou quase 5.000 empregos, um aumento de 59% em relação ao ano anterior, de acordo com um relatório anual da Challenger, Gray & Christmas.) “Estou mais interessado em revistas, redação de artigos ou redação sobre cultura e música, esses empregos no LinkedIn recebem milhares de candidatos”, disse-me McCanna. “Enquanto estou procurando por essa posição de redator em tempo integral, este [trabalho da Outlier] parecia ótimo, porque é completamente remoto e paga bem se você for consistente”.

Nos últimos meses, McCanna tem trabalhado quase em tempo integral para a Outlier, pegando projetos por demanda por cerca de US$ 35/hora. O trabalho com dados rapidamente se tornou sua principal fonte de renda e uma atividade que ela recomendou a outros colegas de classe da Medill. “Muitos de nós ainda estamos procurando empregos. Três vezes eu disse a alguém o que eu faço, e eles disseram, por favor, envie para mim”, ela disse. “Está difícil agora, e muitos dos meus colegas estão dizendo a mesma coisa”.

McCanna é só uma dos muitos jornalistas que já foram recrutados pela Outlier para assumir um trabalho remoto de meio período. Falei com escritores de notícias locais, fotojornalistas e repórteres de rádio nos EUA que receberam mensagens de recrutamento semelhantes ou ouviram falar da plataforma.

Vários deles me disseram terem trabalhado com a Outlier para complementar a renda ou substituir o trabalho em jornalismo, por causa do baixo número de vagas na área. 

Alguns são jornalistas em início de carreira, como McCanna, mas outros são repórteres com mais de uma década de experiência. Uma coisa que todos eles tinham em comum? Antes do ano passado, nunca tinham ouvido falar de Outlier ou sequer sabiam que esse tipo de trabalho existia.

Lançado em 2023, o Outlier é uma plataforma de propriedade e gerenciada pela Scale AI, uma empresa de dados sediada em São Francisco avaliada em US$ 13,8 bilhões. Ela está entre as maiores empresas de IA do mundo, incluindo OpenAI, Meta e Microsoft. 

Outlier e plataformas semelhantes, como CrowdGen e Remotasks, usam a mão de obra humana, que trabalha de forma remota, para melhorar os modelos de IA de seus clientes. Os trabalhadores são pagos por hora por tarefas como rotular dados de treinamento, redigir prompts de teste e classificar a precisão factual e a gramática dos resultados. Muitas vezes, seu trabalho é realimentado em um modelo de IA para melhorar seu desempenho, por meio de um processo chamado aprendizado por reforço com feedback humano (RLHF). Esse ciclo de feedback humano tem sido essencial para a construção de modelos como o GPT, da OpenAI, e o Llama, da Meta.

Além de mensagens diretas de recrutamento, também encontrei dezenas de anúncios de emprego públicos recentes que ressaltam essa tendência crescente de contratação de jornalistas para trabalho com dados. Esses posts vieram das principais empresas de dados de treinamento do setor de IA, incluindo Appen, Data Annotation e a própria Scale AI. Todas as vagas listam jornalistas como candidatos preferenciais, geralmente ao lado de editores, revisores e redatores técnicos.

“Embora nossos esforços de recrutamento com jornalistas não sejam novos, descobrimos que eles são ótimos contribuidores gerais, em grande parte por causa de suas habilidades de escrita e compreensão de texto”, disse Joe Osborne, porta-voz da Scale AI. “A natureza remota e flexível do trabalho também tende a se adequar às suas necessidades e cronogramas”.  Osborne também disse que a empresa está atualmente atualizando suas listas de empregos de “verificador de fatos” com o título “instrutor de IA”, para esclarecer que a verificação de fatos no Outlier não é uma forma de moderação direta de conteúdo.

Muitas vagas de emprego que encontrei estão procurando por especialistas em idiomas, incluindo jornalistas que falam idiomas e dialetos menos representados nos dados de treinamento de grandes empresas de IA. Encontrei vagas para verificadores de fatos internacionais que falam tailandês, holandês, hindi e sueco, bem como dialetos como “espanhol (México)” e “francês (Canadá)”. 

Jornalistas que falam inglês tendem a se qualificar para vagas de emprego mais generalistas; estas geralmente são listadas com títulos como “avaliador de escrita de IA”, “escritor freelancer” e “verificador de fatos”.

Eliza Partika, uma jornalista freelancer de Glendale, na Califórnia, encontrou uma publicação semelhante no LinkedIn na primavera de 2024. Partika vinha contribuindo regularmente para veículos de notícias locais como AfroLA e Crescenta Valley Weekly. Depois da integração, os trabalhos da Outlier se tornaram uma fonte de renda “incrivelmente útil” para ela, com a maioria dos projetos custando em média entre US$ 17 e US$ 20 por hora. “É um trabalho freelancer ao qual posso retornar a qualquer momento, então eu entro sempre que posso”, disse ela.

A maior parte do trabalho de Partika no Outlier é feita em blocos de 30 minutos e requer a revisão de históricos de bate-papo reais e anônimos de produtos como Meta AI ou ChatGPT . Ela então classifica as respostas do modelo usando uma rubrica. “Se um usuário pede à Meta AI para escrever uma carta de apresentação com base em uma descrição de trabalho, seria meu trabalho verificar se a carta de apresentação respondente incorporou experiências especificadas na descrição do trabalho, fez sentido gramatical e usou o tom adequado para uma carta de apresentação”, ela me disse.

Frequentemente, esses bate-papos se desviam para tópicos mais factuais, incluindo literatura, matemática e saúde. “Se eles perguntam o que o solilóquio de Hamlet significa, tenho que verificar se a IA responde com algo sobre o solilóquio de Hamlet, mas também se a análise se alinha com os pensamentos atuais sobre o assunto”, ela acrescentou. “Se for um fato científico ou matemático, eu procuro”

Todos os colaboradores do Outlier com quem falei mencionaram que seus índices de trabalho são muito voltados para a verificação de fatos, incluindo a identificação de alucinações por modelos ou a marcação quando os chatbots extraem de fontes incorretas na internet. Muitos deles compararam isso a uma “verificação pontual” de uma história, focando em detalhes importantes como números, nomes próprios e fatos declarados.

“Não preciso entrevistar ninguém, mas minhas habilidades de pesquisa, meu conhecimento de história, meu conhecimento de política, minhas habilidades de raciocínio, minhas habilidades de checagem de fatos, obviamente o domínio da língua inglesa, todas essas habilidades se transferem”, disse Cory Clark, que trabalha como repórter de notícias local e fotojornalista freelancer na Filadélfia há mais de uma década. Clark tem trabalhado regularmente como freelancer para o The Philadelphia Inquirer e serviços de foto wire como a Associated Press, AFP, Getty Images e Sipa Press.

Clark me disse que tem se tornado cada vez mais difícil sustentar sua família com seu trabalho freelancer, e no ano passado ele parou de buscar novas atribuições freelance para trabalhar para a Outlier. Ele ouviu falar da plataforma depois que um colega do The Local, um veículo do noroeste da Filadélfia, fez uma recomendação. “É um trabalho realmente muito adequado para jornalistas”, disse ele.

Como qualquer trabalho de plataforma, a contratação para a Outlier não foi isenta de desafios. No verão passado, Clark disse que lutou para encontrar novos projetos na plataforma e, por fim, teve que encontrar outro emprego de meio período. Fluxos e refluxos semelhantes na demanda por trabalhadores podem tornar a renda da Outlier inconsistente. A empresa também foi criticada por problemas de folha de pagamento, incluindo acusações no ano passado de não pagamento por horas registradas no site.

Outros trabalhadores me disseram que suas avaliações de IA frequentemente envolvem lidar com tópicos pesados ​​ou perturbadores. “Muitas vezes, o conteúdo que vejo é explícito ou sensível. Somos solicitados a não classificar esses chats e a sinalizá-los por conteúdo sensível”, disse Partika. No mês passado, os trabalhadores da Outlier entraram com uma série de processos contra a Scale AI, alegando que seu trabalho havia causado um impacto psicológico sem fornecer suporte ou salvaguardas adequados.

Para muitos jornalistas, no entanto, o motivo para não trabalhar para uma empresa de dados de treinamento de IA é mais existencial. Celia Hack, uma repórter da estação de rádio KMUW em Wichita, Kansas, recebeu uma mensagem de um recrutador da Outlier no LinkedIn em fevereiro de 2024. Ela não foi receptiva ao contato, em vez disso, foi ao Twitter para postar uma captura de tela da mensagem do recrutador. Seu tuíte: “quando eles oferecem pagar para ajudar a tornar seu trabalho de jornalismo obsoleto”.

“Eu não sabia sobre pessoas sendo realmente contratadas para fazer esse tipo de trabalho”, ela me disse em uma ligação recente, explicando que, embora ela não se preocupe com as tecnologias de IA substituindo seu próprio trabalho como jornalista local, a mensagem do recrutador ainda a pegou desprevenida. “Honestamente, ainda estou meio confusa sobre como seria esse tipo de trabalho”, afirmou.

Hack não é o 1º a fazer essa pergunta. Os jornalistas com quem conversei dizem que seu trabalho para a Outlier geralmente exige algumas explicações para amigos e colegas da indústria. “A reação imediata das pessoas geralmente é, meu Deus, então você está ajudando a IA a assumir o controle?”, disse McCanna. Em vez de treinar um substituto, McCanna vê seu trabalho com dados como um trunfo, aumentando seu conhecimento sobre ferramentas de IA à medida que elas continuam a ser incorporadas ao local de trabalho. “Na verdade, fazendo esse trabalho, você percebe que os modelos de IA ainda precisam de nós… Acho que vai demorar muito, muito tempo até que eles possam realmente escrever como humanos”, disse.

Clark, enquanto isso, diz que tem apresentado o Outlier a outros jornalistas. Mesmo aqueles que estavam inicialmente frios se animaram com a ideia. “Eles não confiavam no aspecto de IA, mas eu expus, eu estava tipo, olha, de uma forma ou de outra, este é o futuro, seja como uma ferramenta para nós ou uma eventual substituição”, afirmou.

Um desses amigos é um fotojornalista que mora na cidade de Nova York. “Eu fiquei tipo, cara, você paga milhares de dólares por mês de aluguel. Eu sei que você nem sempre consegue ganhar isso como freelancer”, ele disse. “A Outlier é uma forma de suplementar isso”, declarou.


*Andrew Deck é um redator da equipe que cobre IA no Nieman Lab. Tem dicas sobre como a IA está sendo usada na sua redação? Você pode entrar em contato com Andrew por e-mail, Bluesky ou Signal (+1 203-841-6241).


Texto traduzido por Eduarda Teixeira. Leia o original em inglês.


O Poder360 tem uma parceria com duas divisões da Fundação Nieman, de Harvard: o Nieman Journalism Lab e o Nieman Reports. O acordo consiste em traduzir para português os textos que o Nieman Journalism Lab e o Nieman Reports e publicar esse material no Poder360. Para ter acesso a todas as traduções já publicadas, clique aqui.

Adicionar aos favoritos o Link permanente.