Como a internet e seus robôs estão sabotando a pesquisa científica

Há apenas algumas décadas, os pesquisadores das áreas de psicologia e saúde sempre precisavam interagir com as pessoas pessoalmente ou por telefone. Na pior das hipóteses, enviavam questionários pelo correio e aguardavam respostas manuscritas.

Assim, ou encontrávamos os participantes nas pesquisas pessoalmente, ou tínhamos vários pontos de evidência que corroboravam que estávamos lidando com uma pessoa real que, portanto, provavelmente nos diria a verdade sobre si mesma.

Desde então, a tecnologia fez o que sempre faz: criou oportunidades para reduzir custos, economizar tempo e acessar um grupo maior de participantes pela internet. Mas o que a maioria das pessoas não percebeu completamente é que a pesquisa na internet trouxe riscos de corrupção de dados ou falsificação de identidades, que podem ter como objetivo comprometer deliberadamente projetos de pesquisa científica.

O que mais entusiasmou os cientistas sobre a pesquisa via internet foi a capacidade de acessar pessoas que normalmente não poderíamos envolver nos estudos. Por exemplo, à medida que mais pessoas podiam pagar para acessar a internet, pessoas mais pobres passaram a poder participar, assim como aquelas de comunidades rurais que poderiam estar a muitas horas e vários meios de transporte de distância de nossos laboratórios.

A tecnologia então deu um salto à frente em um período muito curto de tempo. A democratização da internet a abriu para cada vez mais pessoas, e a Inteligência Artificial (IA) cresceu em penetração e capacidade técnica. Então, em que ponto estamos agora?

Como membros de um grupo de interesse internacional que analisa fraudes em pesquisas (Fraud Analysis in Internet Research, ou Fair na sigla em inbglês), percebemos que agora é mais difícil do que nunca identificar se alguém é real. Existem empresas que os cientistas podem pagar para fornecer participantes para pesquisas via internet, e elas, por sua vez, pagam aos participantes.

Embora elas tenham controles e contrapesos para reduzir fraudes, provavelmente é impossível erradica-las completamente. Muitas pessoas vivem em países onde o padrão de vida é baixo, mas a internet está disponível. Se elas se inscreverem para “trabalhar” para uma dessas empresas, podem ganhar uma quantia razoável de dinheiro dessa forma, possivelmente até mais do que em empregos que envolvem trabalho árduo e longas jornadas em condições insalubres ou perigosas.

Isso não é um problema em si. Mas sempre haverá a tentação de maximizar o número de estudos nos quais podem participar, e uma maneira de fazer isso é fingir ser relevante e elegível para um número maior de estudos. É provável que haja manipulação do sistema, e alguns de nós já vimos evidências indiretas disso (pessoas com um número extraordinariamente alto de doenças simultâneas, por exemplo).

Não é viável (ou ético) insistir em solicitar registros médicos, então confiamos que uma pessoa com doença cardíaca em um estudo também é elegível para participar de um estudo sobre câncer porque também tem câncer, além de ansiedade, depressão, distúrbios sanguíneos ou enxaquecas e assim por diante. Ou todos esses. Sem exigir registros médicos, não há uma resposta fácil para como excluir essas pessoas.

Mais insidiosamente, também haverá pessoas que usarão outros indivíduos para burlar o sistema, muitas vezes contra a vontade deles. Só agora estamos começando a considerar a possibilidade dessa nova forma de escravidão, cuja extensão é amplamente desconhecida.

Entram os bots

Da mesma forma, estamos vendo o surgimento de robôs (bots) que fingem ser participantes, respondendo a perguntas de maneiras cada vez mais sofisticadas. Várias identidades podem ser fabricadas por um único programador, que pode então não só ganhar muito dinheiro com estudos, mas também comprometer seriamente a ciência que estamos tentando fazer (o que é muito preocupante quando os estudos estão abertos à influência política).

Está ficando muito mais difícil identificar a Inteligência Artificial. Houve um tempo em que perguntas de entrevistas escritas, por exemplo, não podiam ser respondidas pela IA, mas agora elas podem.

É literalmente apenas uma questão de tempo até nos vermos conduzindo e gravando entrevistas online com uma representação visual de um indivíduo vivo e respirando que simplesmente não existe, por exemplo, por meio da tecnologia deepfake.

A série de TV *The Capture* destaca o problema crescente dos *deepfakes*. wikipedia

Estamos a apenas alguns anos, se não meses, de fraudes tão profundas. A série de TV britânica The Capture pode parecer exagerada para alguns, com sua representação de notícias falsas de TV em tempo real, mas qualquer pessoa que tenha visto o estado da arte atual em relação à IA pode facilmente imaginar que estamos a poucos passos de suas representações dos “males” da falsificação de identidades usando avatares perfeitos extraídos de dados reais. É hora de se preocupar.

A única resposta, por enquanto, será simplesmente conduzir entrevistas cara a cara, em nossos escritórios ou laboratórios, com pessoas reais que podemos olhar nos olhos e apertar a mão. Teremos voltado no tempo até o ponto mencionado anteriormente, de algumas décadas atrás.

Com isso, vem a perda de uma das grandes vantagens da internet: ela é uma plataforma maravilhosa para democratizar a participação em estudos de pessoas que, de outra forma, não teriam voz, como aquelas que não podem viajar devido a uma deficiência física, entre outras. É desanimador pensar que todo fraudador está essencialmente roubando a voz de uma pessoa real que realmente queremos em nossos estudos. E, de fato, entre 20% e 100% das respostas em estudos foram consideradas fraudulentas em pesquisas anteriores.

Devemos sempre suspeitar daqui para frente, quando nossa propensão natural como pessoas receptivas que tentam servir à Humanidade com o trabalho que fazemos é ser confiantes e abertas. Essa é a verdadeira tragédia da situação em que nos encontramos, além da corrupção dos dados que alimentam nossos estudos.

Isso também tem implicações éticas que precisamos levar em consideração com urgência. Mas parece que não temos outra escolha a não ser “esperar pelo melhor, mas presumir o pior”. Devemos construir sistemas em torno de nossas pesquisas, que existem fundamentalmente apenas para detectar e remover participações falsas de um tipo ou de outro.

A triste realidade é que estamos potencialmente retrocedendo décadas para descartar uma proporção relativamente pequena de respostas falsas. Cada “firewall” que erguemos em torno de nossos estudos reduzirá a fraude (embora provavelmente não a elimine totalmente), mas ao custo de reduzir a amplitude da diversidades de participantes que desejamos desesperadamente ver.

Entram os bots

Sign Up For Daily Newsletter

Be keep up! Get the latest breaking news delivered straight to your inbox.