Cientistas das Universidades de Manchester e Oxford desenvolveram uma estrutura de inteligência artificial (IA) que pode identificar e rastrear variantes novas e preocupantes da covid-19 e pode ajudar com futuras infecções.
A estrutura combina técnicas de redução de dimensão e um novo algoritmo de agrupamento explicável chamado CLASSIX, desenvolvido por matemáticos da Universidade de Manchester. Isto permite a rápida identificação de grupos de genomas virais que podem representar um risco no futuro devido a grandes volumes de dados.
O estudo, apresentado na revista PNAS, poderia apoiar métodos tradicionais de rastreamento da evolução viral, como a análise filogenética , que atualmente requer extensa curadoria manual.
Roberto Cahuantzi, pesquisador da Universidade de Manchester e primeiro e correspondente autor do artigo, disse: “Desde o surgimento do covid-19, vimos múltiplas ondas de novas variantes, maior transmissibilidade, evasão de respostas imunológicas e aumento da gravidade de doença.”
Tal como muitos outros vírus ARN, o covid-19 tem uma elevada taxa de mutação e um curto período de tempo entre gerações, o que significa que evolui extremamente rapidamente. Isto significa que a identificação de novas estirpes que provavelmente serão problemáticas no futuro requer um esforço considerável.
Atualmente, existem quase 16 milhões de sequências disponíveis na base de dados GISAID (Iniciativa Global sobre Partilha de Todos os Dados da Gripe), que fornece acesso a dados genómicos dos vírus da gripe.
O mapeamento da evolução e da história de todos os genomas da covid-19 a partir destes dados é feito atualmente utilizando grandes quantidades de tempo humano e computacional.
O método descrito permite a automação de tais tarefas. Os pesquisadores processaram 5,7 milhões de sequências de alta cobertura em apenas um ou dois dias em um laptop moderno padrão; isto não seria possível com os métodos existentes, colocando a identificação de estirpes patogénicas preocupantes nas mãos de mais investigadores devido à redução das necessidades de recursos.
O método proposto funciona dividindo as sequências genéticas do vírus covid-19 em “palavras” menores (chamadas 3-mers) representadas como números, contando-as. Em seguida, ele agrupa sequências semelhantes com base em seus padrões de palavras usando técnicas de aprendizado de máquina.
Stefan Güttel, professor de matemática aplicada na Universidade de Manchester, disse: “O algoritmo de agrupamento CLASSIX que desenvolvemos é muito menos exigente em termos computacionais do que os métodos tradicionais e é totalmente explicável, o que significa que fornece explicações textuais e visuais dos clusters computados.”
Leia também:
Este post foi modificado pela última vez em %s = human-readable time difference 14:42
O Google DeepMind acaba de anunciar uma parceria estratégica com a Apptronik, uma empresa de…
Uma equipe de pesquisadores de 20 laboratórios diferentes acaba de apresentar o Genesis, um motor…
O Google acabou de lançar o que está chamando de um novo modelo de inteligência…
A GitHub, de propriedade da Microsoft, acaba de anunciar um nível gratuito de seu Copilot…
A OpenAI acaba de lançar uma nova maneira surpreendente de acessar o ChatGPT - através…
O Google DeepMind acaba de lançar o FACTS Grounding, um novo benchmark projetado para avaliar…