Rastreamento mamográfico por IA: desempenho equivalente ao de avaliadores humanos

M. Alexander Otto

18 de setembro de 2023

Com o advento da inteligência artificial (IA), a era da dupla leitura na avaliação de mamografias pode estar chegando ao fim, segundo a Dra. Liane Philpotts, médica e professora de radiologia e imagem biomédica na Yale University, nos EUA.

O motivo dessa afirmação é que a IA tem se provado tão boa quanto os humanos na interpretação de mamografias, pelo menos nas pesquisas científicas.

Em um estudo recente, publicado on-line no periódico Radiology, pesquisadores britânicos descobriram que o desempenho de um sistema de IA disponível comercialmente (INSIGHT MMG, versão 1.1.7.1, da empresa Lunit) era essencialmente equivalente a mais de 500 avaliadores especializados. Esses resultados seguem a mesma linha de outras pesquisas recentes sobre IA.

A dupla leitura das mamografias (ou seja, a avaliação por dois médicos visando aumentar as taxas de detecção de câncer) é comum no Reino Unido e em outros países da Europa.

A equipe de cientistas britânicos comparou o desempenho de 552 avaliadores ao do programa de IA no exame Personal Performance in Mammographic Screening, um teste de garantia de qualidade que os profissionais envolvidos na avaliação de mamografias no Reino Unido são obrigados a realizar duas vezes por ano. Nesse teste, os avaliadores atribuem um escore de malignidade a 60 casos complexos, contendo uma mistura de mamas normais e mamas com lesões benignas e malignas. O estudo foi composto por duas sessões de teste com um total de 120 mamografias.

Do total de avaliadores participantes do estudo, 57% eram radiologistas certificados, 37% eram técnicos em radiologia e 6% eram mastologistas. Cada um dos profissionais avaliava no mínimo 5 mil mamografias por ano.

Não houve diferença no desempenho geral entre o programa de IA e os avaliadores humanos (área sob a curva de 0,93 versus 0,88; p = 0,15).

Comentando em um editorial que acompanhou a publicação do estudo, a Dra. Liane disse que os resultados “sugerem que a IA poderia atuar com segurança como um segundo avaliador para diminuir a carga de trabalho [desses profissionais]”.

Quanto aos EUA, onde normalmente não se faz a dupla leitura, ela destacou que “muitos radiologistas norte-americanos que interpretam mamografias não são especializados e não lidam com grandes volumes de exames. Assim, o sistema de IA avaliado no estudo “poderia ser usado como uma ferramenta suplementar para auxiliar no desempenho de avaliadores nos EUA ou em outros países nos quais os programas de rastreamento são baseados em uma única avaliação”.

Também não houve diferença entre a IA e os avaliadores humanos no que diz respeito à sensibilidade (84% vs. 90%; p = 0,34). No entanto, o algoritmo de IA apresentou uma especificidade mais elevada (89% vs. 76%; p = 0,003).

Utilizando escores de revocação de IA correspondentes ao desempenho de um avaliador humano médio (90% de sensibilidade e 76% de especificidade), não houve diferença no uso da IA com relação a sensibilidade (91%; p = 0,73) ou especificidade (77%; p = 0,85), entretanto os pesquisadores apontaram que o poder estatístico dessa análise foi limitado.

De forma geral, “o desempenho diagnóstico da IA foi similar ao de um avaliador humano médio”. Aparentemente, é "cada vez mais provável que a IA acabe tendo uma função na interpretação de mamografias de rastreamento”, afirmaram os pesquisadores liderados pela Dra. Yan Chen, Ph.D., que é afiliada ao Nottingham Breast Institute, na Inglaterra.

“O fato de o modelo de IA ter apresentado um desempenho equivalente ao de um avaliador médio proveniente de um grupo especializado de avaliadores de mamografia indica a robustez do algoritmo de IA”, disse a Dra. Liane.

No entanto, existem algumas ressalvas. Por exemplo, o sistema foi projetado para avaliar mamografias bidimensionais tradicionais, conforme o padrão atual de rastreamento realizado no Reino Unido, mas nos EUA a tomossíntese mamária digital vem substituindo a mamografia bidimensional.

Nos EUA, “são necessários algoritmos de IA específicos para a tomossíntese mamária digital, e eles precisarão ser confiáveis e reprodutíveis para serem adotados pelos radiologistas”, disse a Dra. Liane.

Além disso, o rastreio no Reino Unido é realizado a cada três anos em mulheres com idades entre 50 e 70 anos, o que significa que a população do estudo tinha um alto índice de mulheres idosas com mamas menos densas. Nos EUA, o rastreio geralmente começa mais cedo e inclui mulheres na pré-menopausa, com mamas mais densas.

Um estudo recente realizado na Coreia do Sul, país no qual muitas mulheres têm mamas densas, mostrou que a mamografia bidimensional e a ultrassonografia complementar superaram a IA na detecção de câncer.

“Isso realça os desafios do rastreamento oncológico em mamas densas, o que afeta tanto os radiologistas quanto a IA. [O estudo] nos dá evidências de que a densidade da mama é um fator importante a ser considerado ao avaliar o desempenho da IA”, disse a Dra. Liane.

A pesquisa foi financiada pela Lunit, empresa desenvolvedora do programa de IA utilizado no estudo. Os pesquisadores responsáveis pelo estudo e a Dra. Liane Philpotts informaram não ter conflitos de interesses.

Este conteúdo foi originalmente publicado no MDedge.com ─ Medscape Professional Network

Siga o Medscape em português no Facebook, no X (antigo Twitter) e no YouTube

Comente

3090D553-9492-4563-8681-AD288FA52ACE
Comentários são moderados. Veja os nossos Termos de Uso

processing....