Reduzir o valor de P, aumentar o nível de exigência das pesquisas: um clamor renovado

Steve Stiles (equipe Medscape)

Notificação

12 de abril de 2018

O valor de P = 0,05 foi novamente questionado como limite de significância clínica na pesquisa médica, desta vez em um comentário que oferece um caminho para alternativas mais relevantes.

"O problema com os valores de P é que se você for pela definição exata, o que eles transmitem não é algo pelo que um médico se interessaria, com raríssimas exceções", diz o Dr. John P. A. Ioannidis, da Stanford University na Califórnia.

"O valor de P, disse o Dr. Ioannidis ao Medscape, "é um pouco um ritual que foi incorporado em toda a literatura. É enganoso e equivocado. Nós precisamos nos livrar dele".

Na verdade, os cientistas e as revistas especializadas devem substituir o valor limite de significância de P de, tipicamente P < 0,05, para um décimo da magnitude, argumenta o Dr. Ioannidis em um de ponto de vista publicado em 22 de março de no periódico JAMA.

O novo padrão de P = 0,005 seria uma solução temporária até que o campo adote e assimile de forma sistemática um teste estatístico com maior relevância clínica, ou vários, dependendo do tipo de análise, propõe o autor.

Que os valores de P são atualmente "mal interpretados, inquestionáveis e mal utilizados"  significa que um resultado de pesquisa dentro do padrão < 0,05 "é erroneamente equiparado a uma descoberta ou um resultado (por exemplo, uma associação ou um efeito de tratamento) verdadeiro, válido e com o qual vale a pena trabalhar", escreve o Dr. Ioannidis.

"Esses equívocos atingem pesquisadores, revistas especializadas e leitores de artigos de pesquisa, e até mesmo a mídia e o público que consome informações científicas. A maioria das afirmações corroboradas com valores de P ligeiramente abaixo de 0,05 são provavelmente falsas (isto é, as associações avaliadas e os efeitos do tratamento não existem). Mesmo entre aquelas afirmações que são verdadeiras, poucas valem alguma ação em medicina e saúde", de acordo com o Dr. Ioannidis.

"Afogados em uma inundação de significância estatística"

Os valores de P costumam ser mal-entendidos como sendo a probabilidade de uma descoberta ser devida ao acaso, o que é incorreto e, além disso, não leva em conta a relevância clínica da descoberta, observa oDr. Ioannidis.

Em vez disso, "um valor de P é a chance de você ver esses resultados extremos se a hipótese nula for verdadeira e se não houver viés". Estes dois "se" são críticos, observou.

Uma métrica melhor, que serviria às necessidades dos médicos, iria refletir se existe um efeito do tratamento grande o suficiente para ser clinicamente significativo. O valor de P, disse o Dr. Ioannidis, "é muito remoto para isso. É tão remoto que as pessoas estão simplesmente enganadas".

Mais úteis são as hazard ratios (ou riscos relativos ou as odds ratios) com intervalos de confiança que informam os tamanhos do efeito que mostram se o resultado de um tratamento pode ser clinicamente atraente, disse Dr. Ioannidis. Essas métricas não simplesmente dicotomizam os resultados em termos de significância vs. não significância.

"Estamos nos afogando em uma inundação de significância estatística", disse o Dr. Ioannidis. "Então, precisamos fazer alguma coisa rapidamente para evitar nos afogarmos, enquanto trabalhamos em algumas soluções melhores e mais duradouras, o que representa, em grande parte, talvez abandonar os valores de P para outras métricas em cerca de 80% ou 90% da literatura onde o valor de P não é a ferramenta apropriada de inferência".

Seu ponto de vista afirma que "trocar o limite do valor de P de 0,05 para 0,005 mudará cerca de um terço dos resultados estatisticamente significativos da literatura biomédica pregressa para a categoria de apenas 'sugestiva'. Esta mudança é essencial para aqueles que acreditam (talvez credulamente) em categorizações significativas ou não significativas, preto ou branco".

"O que estamos tentando responder?"

Não é uma ideia nova, e o Dr. Ioannidis faz referência a uma série de críticas e propostas anteriores para modificar os limiares tradicionais, os valores máximos de P inclusive uma recente proposta de um novo padrão de 0,005.

O próprio Dr. Ioannidis tem uma longa história de levantar bandeiras sobre esta questão e outros padrões pelos quais os resultados dos estudos e os periódicos científicos que os publicam, são classificados. Já transcorreram 13 anos desde o seu próprio manifesto sobre o assunto, intitulado "Por que a maioria dos achados de pesquisa publicados é falsa".

O Dr. Sanjay Kaul, do Cedars Sinai Medical Center em Los Angeles (EUA), que não participou da redação do comentário, apoiou a ideia de que o limiar para o valor de P deve ser mais rigoroso do que de 0,05. Dr. Kaul observou ao Medscape que algumas publicações têm insistido em valores menores para o limiar de P para avaliar a força dos resultados, ao passo que outras têm desencorajado inteiramente o uso do valor de P.

O comentarista disse que apoia o uso da análise Bayesiana, "que supera as deficiências do valor de P", ao menos como uma alternativa.

Esse método, escreve o Dr. Ioannidis, deve ser amplamente aplicável a diferentes tipos de pesquisa, bem como às métricas que mostram os tamanhos dos efeitos e os intervalos de incerteza. Independentemente das métricas utilizadas, elas devem ser adequadas ao tipo de pesquisa.

"Precisamos pensar para cada estudo e cada questão que estamos levantando: por que estamos fazendo isso, e o que estamos tentando responder? E então podemos escolher a métrica e a ferramenta com as quais iremos analisar especificamente o que queremos responder. E muito raramente esta será o valor de P", disse o Dr. Ioannidis em entrevista.

Por enquanto, a ampla adoção do valor de P < 0,005 como padrão de significância provavelmente seria um primeiro passo na direção certa "para qualquer tipo de desenho do estudo", quer seja estudo randomizado, meta-análise ou estudo observacional, disse o autor – embora mesmo este nível "seja provavelmente muito leniente" para os estudos observacionais.

"Para os resultados observacionais, como as associações de dieta ou estilo de vida aos resultados cardiovasculares ou ao câncer ou ao acidente vascular cerebral, eu usaria limiares muito mais baixos, como 10-6. Em genética, as pessoas usam limiares de 10-8".

De acordo com o Dr. Kaul, "os resultados dos estudos observacionais e das meta-análises muito provavelmente irão se beneficiar da implementação de um valor de P mais baixo". Até mesmo a Food and Drug Administration (FDA) norte-americana, disse, endossou um valor de P < 0,001 para as meta-análises de eventos de segurança, e seria uma boa ideia "se os editores das publicações seguissem a liderança da FDA a este respeito".

JAMA. Publicado on-line em 22 de março de 2018. Resumo

Comente

3090D553-9492-4563-8681-AD288FA52ACE
Comentários são moderados. Veja os nossos Termos de Uso

processing....