A “Poluição de Dados” dificulta a Investigação Psiquiátrica

Na JAMA Psychiatry, os investigadores argumentam que muitos estudos são corrompidos pela poluição de dados e que o campo é incapaz de gerir estas questões.

0
675

Em um novo artigo na JAMA Psiquiatry, os pesquisadores sugerem que a “poluição de dados” impede a pesquisa psiquiátrica. Eles escrevem que há muitos aspectos da poluição de dados, e os especialistas em pesquisas psiquiátricas específicas não estão preparados para prestar contas de todos eles.

“A pesquisa neuropsiquiátrica é substancialmente impedida por questões relacionadas à coleta e análise de dados. Embora estas questões tenham sido amplamente discutidas, seu grave impacto sobre os tamanhos dos efeitos neuropsiquiátricos não é tão amplamente reconhecido”, escrevem os pesquisadores.

Os pesquisadores foram Alessandro S. De Nadai da Texas State University, Yueqin Hu da Beijing Normal University, e Wesley K. Thompson da University of California, San Diego.

Empresário trabalhando em situação de poluição do arDe Nadai, Hu, e Thompson se concentram na poluição de dados, que eles definem como “erros inadvertidos” nos dados. Isto é diferente de “envenenamento de dados”, que envolve “tentativas intencionais de alimentar modelos com dados imprecisos”. O artigo atual se concentra em pesquisadores bem intencionados, cujos resultados são enganosos por acidente.

Isto é comum, segundo De Nadai, Hu, e Thompson. Além disso, eles escrevem que os pesquisadores em neuropsiquiatria vêm de origens tão variadas que nenhum deles é especialista em todas as formas potenciais de poluição de dados e em como mitigá-la.

Por exemplo, a poluição de dados pode vir de qualquer uma das seguintes áreas: “(1) medição não confiável, (2) definição de construção heterogênea, (3) misturas populacionais com diferentes mecanismos biopsicossociais, (4) enviesamento comportamental de relato tanto por pacientes quanto por clínicos, (5) enviesamento de seleção, e (6) dados que não faltam por acaso”.

O que estes têm em comum é a falta de confiabilidade ou “ruído”. Todos os testes e definições em psiquiatria têm níveis variados de subjetividade e são influenciados por uma gama quase infinita de fatores na vida de uma pessoa. Especialmente quando um estudo utiliza múltiplos testes ou tentativas de responsabilização pela moderação ou mediação (se certos fatores são influenciados por outros), este ruído pode se somar. No final, os efeitos que os pesquisadores encontram não são confiáveis e muitas vezes inflados.

“A estimativa inconsistente e imprecisa do tamanho do efeito polui a literatura da pesquisa e torna quase impossível construir incrementalmente sobre descobertas pequenas porém importantes, que serão críticas para o progresso futuro”, explicam os autores.

Eles observam que, se a pesquisa física tivesse o mesmo nível de falta de confiabilidade, sistemas como o GPS seriam impossíveis de se desenvolver.

De Nadai, Hu, e Thompson também se concentram na confiabilidade e validade dos diagnósticos psiquiátricos. Eles observam que mesmo os médicos muitas vezes discordam sobre se um paciente atende aos critérios para um diagnóstico específico, e os pacientes muitas vezes têm uma perspectiva muito diferente. Eles acrescentam que diagnósticos como depressão e esquizofrenia são extremamente heterogêneos, unindo pessoas que têm traços, sentimentos e comportamentos muito diferentes. Isto torna muito difícil fazer pesquisas que possam ser generalizadas aos pacientes do mundo real.

Os autores sugerem que existem maneiras específicas de contabilizar os vários tipos de poluição de dados e que os pesquisadores devem ter um “plano de mitigação da poluição de dados” antes de iniciar seu estudo.

“Sem atender à poluição de dados”, eles escrevem, “muito do nosso progresso será ilusório, e as verdadeiras descobertas que melhoram o bem-estar dos pacientes permanecerão sem ser detectadas”.

****

De Nadai, A. S., Hu, Y., & Thompson, W. K. (2021). Data pollution in neuropsychiatry—an under-recognized but critical barrier to research progress. JAMA Psychiatry. Published online December 1, 2021. (Link)