Pele escura é sub-representada em conjuntos de dados usados pela IA para identificar o câncer de pele

Jeff Craven

Notificação

23 de novembro de 2021

Uma análise dos conjuntos de dados de imagens de pele de acesso aberto disponíveis para treinar algoritmos de aprendizagem de máquina (machine learning) para identificar câncer de pele revelou que os tons de pele mais escura estão significativamente sub-representados nos bancos de dados, informam pesquisadores do Reino Unido.

Das 106.950 lesões de pele documentadas nos 21 bancos de dados de acesso aberto e nos 17 atlas de acesso aberto identificados pelo Dr. David Wen, médico da University of Oxford, no Reino Unido, e colaboradores, 2.436 imagens continham informações sobre o tipo de pele da classificação de Fitzpatrick. Destas, "apenas 10 imagens eram de pessoas de pele Fitzpatrick tipo V, e apenas uma única imagem era de um paciente com pele Fitzpatrick tipo VI", disseram os pesquisadores. "A nacionalidade dessas pessoas era brasileira ou desconhecida".

Em dois conjuntos de dados contendo 1.585 imagens com informações sobre a origem étnica, "não havia imagens de pessoas de ascendência africana, afro-caribenha ou sul-asiática", observaram Dr. David e colaboradores. "Juntamente com as origens geográficas dos conjuntos de dados, houve uma sub-representação maciça de imagens de lesões cutâneas em populações de pele mais escura".

Os resultados da revisão sistemática foram apresentados no National Cancer Research Institute (NCRI) Festival e publicados em 09 de novembro no periódico Lancet Digital Health. “Até onde sabemos esta é a primeira revisão sistemática de imagens de lesões cutâneas disponíveis publicamente, compreendendo imagens predominantemente dermatoscópicas e macroscópicas disponíveis através de conjuntos de dados e atlas de acesso aberto".

No total, 11 dos 14 conjuntos de dados (79%) eram da América do Norte, da Europa ou da Oceania entre os conjuntos de dados com informações sobre o país de origem, disseram os pesquisadores. Tanto as imagens dermatoscópicas quanto as fotografias macroscópicas eram os únicos tipos de imagem disponíveis em 19 dos 21 (91%) conjuntos de dados. Houve alguma variação em relação às informações clínicas disponíveis, com 81.662 imagens (76,4%) contendo dados sobre idade, 82.848 imagens (77,5%) contendo dados sobre sexo e 79.561 imagens contendo dados sobre o local do corpo (74,4%).

Os pesquisadores explicaram que esses conjuntos de dados podem ser de uso limitado na vida real, onde as imagens não são representativas da população. Programas de inteligência artificial (IA) que treinam usando imagens de pacientes com um tom de pele, por exemplo, têm o potencial de diagnosticar incorretamente os pacientes com outros tons de pele, disseram.

"Os programas de inteligência artificial têm um grande potencial para diagnosticar o câncer de pele, porque podem ver as imagens e avaliar de forma rápida e custo-efetiva quaisquer sinais preocupantes na pele", disse o Dr. David em um comunicado de imprensa do NCRI Festival. "No entanto, é importante conhecer as imagens e os pacientes usados para criar os programas, pois estes determinam para quais grupos de pessoas esses programas serão mais eficazes na vida real. Pesquisas mostraram que os programas feitos a partir de imagens de pessoas com pele mais clara não têm tanta acurácia para as pessoas com pele mais escura, e vice-versa".

Também havia "poucas informações sobre quem, como e por quê as imagens foram tiradas", disse Dr. David no comunicado. "Isso repercute nos programas criados a partir dessas imagens, devido à incerteza em torno de seu desempenho em diferentes grupos de pessoas, especialmente entre os que não estão bem representados nos conjuntos de dados, como os de pessoas de pele mais escura. Isto pode levar à exclusão ou até mesmo prejudicar estes grupos em relação às técnicas de inteligência artificial".

Embora não existam diretrizes atuais para a criação de conjuntos de dados de imagens de pele, são necessários padrões de qualidade, de acordo com os pesquisadores.

"Assegurar uma saúde digital equitativa contempla a criação de conjuntos de dados universais e representativos, a fim de garantir que os algoritmos criados beneficiem as pessoas de todas as ascendências ou tons de pele", concluíram os autores do estudo.

O Dr. Neil Steven, Ph.D., médico e membro do National Cancer Research Institute Skin Group, que não participou da pesquisa, afirmou no comunicado de imprensa que os resultados do estudo de Dr. David e colaboradores "levantam questões sobre a capacidade de a inteligência artificial auxiliar no diagnóstico de câncer de pele, especialmente num contexto global".

"Espero que este trabalho tenha sequência e ajude a garantir que o progresso que fazemos na utilização da inteligência artificial na medicina beneficie todos os pacientes, reconhecendo que a cor da pele humana é altamente diversificada", disse Dr. Neil, Consultor Honorário em Oncologia Médica no University Hospitals Birmingham NHS Foundation Trust no Reino Unido.

"Precisamos de mais imagens de todo mundo"

O Dr. Adewole Adamson, dermatologista e professor assistente no Departamento de Medicina Interna (Divisão de Dermatologia) na Dell Medical School da University of Texas, nos EUA, disse em uma entrevista que uma "possível grande desvantagem" de algoritmos não treinados em conjuntos de dados com diversidade é o potencial de erros diagnósticos.

"Os problemas dos algoritmos usados para fins de diagnósticos de lesões de pele podem ser particularmente significativos pela escalabilidade desta tecnologia. É necessário haver muita reflexão sobre como esses algoritmos são elaborados e testados", disse o Dr. Adewole, que revisou o manuscrito do estudo The Lancet Digital Health, mas não participou da pesquisa.

O médico citou os resultados de um estudo publicado recentemente no periódico JAMA Dermatology, que descobriu que apenas 10% dos estudos usados para criar ou testar algoritmos de aprendizagem profunda continham metadados sobre o tom de pele. "Além disso, a maioria dos conjuntos de dados são de países onde os tons de pele mais escuros não têm representatividade. Estes algoritmos, portanto, provavelmente terão mau desempenho para as pessoas cuja pele tem uma tonalidade mais escura e por isso os pacientes devem ter cautela”, disse Dr. Adewole.

Diretrizes de consenso devem ser criadas para os algoritmos de inteligência artificial públicos, disse o médico, que devem ter metadados contendo informações sobre sexo, raça e etnia, localização geográfica, tom da pele e parte do corpo. "Esta distribuição também deve ser informada em todas as publicações de algoritmos, para que os usuários possam ver se a distribuição da população nos dados de aprendizado espelha a da população para a qual se destina", disse o especialista.

O Dr. Adam Friedman, médico, professor e chefe da dermatologia na George Washington University School of Medicine and Health Sciences, nos EUA, que não participou da pesquisa, disse que, embora esta questão da sub-representação seja conhecida na dermatologia de longa data, a força do estudo publicado no Lancet reside no fato de ser um grande estudo, com a mensagem: "precisamos de mais imagens de todos".

"Este é provavelmente o maior estudo a avaliar todos os recursos acessíveis possíveis e a adotar uma abordagem sistemática", disse o Dr. Adam em uma entrevista. "Mas eu acho que também levanta alguns pontos importantes sobre como pensamos a respeito dos tons de pele e como nos referimos a isso, bem como no que diz respeito a má utilização dos esquemas de classificação que dispomos atualmente."

Usar dados de etnia e certos tipos de classificação da pele de Fitzpatrick como um substituto para pele mais escura é uma limitação dos metadados que os autores do estudo tinham disponíveis, e também destaca "um problema mais amplo com relação ao léxico sobre o tom de pele", explicou.

“Pele não tem raça nem etnia”, disse Dr. Adam.

Um conjunto de dados contendo não só diferentes tons de pele, mas como a aparência das doenças dermatológicas pode ser diferente nos tons de pele é importante, observou o especialista. "Se você olhar apenas uma foto de um tom de pele, você perde de perspectiva de que as apresentações clínicas podem ser tão polimórficas, especialmente por causa dos diferentes tons de pele", disse Dr. Adam.

"Precisamos continuar pressionando essa mensagem para garantir que as imagens continuem sendo coletadas. Nós precisamos assegurar que exista um controle de qualidade dessas imagens e que as estamos divulgando de forma que todos tenham acesso, tanto para fins autodidáticos como para o ensino de terceiros", disse Dr. Adam, coeditor de um atlas dermatológico recém-lançado, que mostra doenças de pele em diferentes tons de pele.

Lancet Digit Health. Publicado on-line em 09 de novembro de 2021. Texto completo

O Dr. Adewole Adamson informou não ter conflitos de interesses. O Dr. Adam Friedman é coeditor de um atlas de dermatologia apoiado pela Allergan Aesthetics and Skinbetter Science. O estudo foi financiado pela NHSX e pela Health Foundation. Três autores informaram trabalhar para a empresa Databiologia durante a realização do estudo. Os outros autores informaram não ter conflitos de interesses.

Jeff Craven é um jornalista independente que mora nos EUA.

Siga o Medscape em português no Facebook, no Twitter e no YouTube

Comente

3090D553-9492-4563-8681-AD288FA52ACE
Comentários são moderados. Veja os nossos Termos de Uso

processing....