Em parceria com o Instituto Nacional do Câncer (NCI, na sigla em inglês), pesquisadores do Laboratório Nacional de Oak Ridge do Departamento de Energia e da Universidade Estadual da Louisiana desenvolveram um longo sequenciador de inteligência artificial (IA) capaz de processar milhões de relatórios de patologia para fornecer aos especialistas que pesquisam diagnósticos e manejo do câncer informações exponencialmente mais precisas sobre relatórios de câncer.
PUBLICIDADE
“Nosso objetivo é tentar ver se podemos automatizar o processo de extração de informações específicas sobre o local do câncer desses relatórios de patologia e transformá-lo em dados estruturados para relatórios de incidência de câncer em nível nacional”, disse Mayanka Chandra Shekar, uma cientista pesquisadora da Divisão de Ciências Computacionais e Engenharia do ORNL.
O trabalho da equipe foi publicado no Clinical Cancer Informatics.
Os modelos de transformadores de IA são treinados em grandes quantidades de dados e os “transformam” em informações úteis e digeríveis para cientistas. Usando o framework CITADEL seguro no supercomputador Summit de Liderança em Computação de Oak Ridge, pesquisadores do ORNL usaram o modelo de transformador especializado para processar 2,7 milhões de relatórios de patologia de câncer. Esse modelo, conhecido como Path-BigBird, extrai dados de seis registros de câncer do SEER (Vigilância, Epidemiologia e Resultados Finais).
PUBLICIDADE
O programa SEER do NCI é uma fonte autoritativa de informações sobre incidência e sobrevivência ao câncer nos Estados Unidos. O SEER atualmente coleta e publica dados de incidência e sobrevivência ao câncer de registros de câncer baseados na população que cobrem aproximadamente 48% da população dos EUA.
Atualmente, esses registros de câncer são atualizados manualmente, deixando um intervalo de dois anos entre a incidência de câncer e sua notificação, o que significa que se houver um aumento na taxa de câncer nacionalmente, os pesquisadores terão que esperar dois anos antes de reconhecer essa área de preocupação.
Ao processar eficazmente as informações de milhões de relatórios de patologia, o Path-BigBird tem o potencial de otimizar a velocidade e a precisão para extração de informações de patologia e superar abordagens de aprendizado profundo tradicionais para reunir informações importantes, como identificar locais de câncer, histologia e melhorar a precisão dos relatórios de incidência de câncer em nível populacional.
PUBLICIDADE
“Nosso modelo atual de aprendizado profundo já codificou automaticamente cerca de 23% dos relatórios processados pelos registros de câncer, economizando um tempo valioso aos pesquisadores em sua busca por relatórios de câncer quase em tempo real”, disse Chandrashekar. Ela acrescentou que esse avanço abre portas para criar uma linguagem patológica abrangente que pode realizar tarefas de maneira mais rápida do que nunca.
Leia também: