Inteligência Artificial sugere grupo de risco para COVID-19 a partir dos 45 anos

RESUMO
Análise da influência de diferentes variáveis em um modelo de aprendizado de máquina indica que maior presença de idosos na população leva a uma curva de mortalidade de início silencioso e evolução agressiva. Padrão semelhante se repete com a população de idade entre 45 e 49 anos de idade, indicando que a maior presença dessa faixa etária é interpretada pelo modelo como importante para aumento no número de mortes.

A pandemia do novo coronavírus atingiu um momento crítico globalmente, com a adoção do distanciamento social e das práticas de isolamento por praticamente todas as autoridades governamentais e entes privados pelo mundo.

Nós da Kunumi acreditamos na ciência, conhecimento e tecnologia como formas de iluminar o caminho à frente. Assim, propomos a utilização de modelos interpretáveis de aprendizado de máquina — subárea da inteligência artificial — para melhor entender padrões e fenômenos que podem ser invisíveis aos olhos humanos devido à tamanha complexidade.

Neste ensaio, em parceria com o LIA-UFMG (Laboratório de Inteligência Artificial da Universidade Federal de Minas Gerais), destacamos padrões curiosos que emergiram a partir de modelos preditivos da progressão da COVID-19 em vários países do mundo. Eles nos permitem visualizar as variáveis mais influentes para a predição do número de mortes decorrentes da doença nas próximas semanas.

Muitos modelos já são capazes de predizer números de mortes decorrentes da COVID-19, mas ainda são poucas as iniciativas que explicam essas predições (para que não sejam consideradas “caixas pretas”). Acreditamos que é fundamental desenvolver modelos transparentes e explicativos que sigam um processo decisório compreensível e auditável. Este é nosso compromisso. A partir das explicações de cada modelo, poderemos observar padrões e tendências possivelmente relevantes na discussão e que tenham efeitos na tomada de decisão para contenção do coronavírus.

Convidamos a comunidade científica a colaborar com o debate aqui iniciado — e buscaremos publicar nas próximas semanas outras análises de cenários e ferramentas para prever e mitigar os danos da pandemia.

O que fizemos?

Nosso modelo parte dos números oficiais de mortes divulgados pela OMS diariamente e cruza essas informações com dezenas de bases de dados relacionadas: informações demográficas de cada país (densidade populacional, distribuição de idade etc), de saúde (número de médicos por habitante, leitos), de mobilidade, climáticas, geográficas, e outros mais. Inicialmente apresentamos insights baseados em pirâmide etária. Analisaremos outros aspectos em próximos artigos.

Para avaliarmos a taxa de acerto do modelo, fizemos a predição para o número de mortes do passado e comparamos com o número real divulgado pela OMS. Nessa comparação, a taxa de erros do modelo tende a ser efetivamente baixa. A variável temporal é sincronizada entre os diversos países em nossa análise. Consequentemente, o modelo leva em conta aspectos e similaridades com o que aconteceu em outros países, de forma a predizer com maior eficácia.

A previsão do modelo

Tomando como exemplo o Brasil, a previsão de número de mortes feita pelo modelo para o dia seguinte ao da escrita desse artigo é de 0,070 mortos a cada 100 mil habitantes. Na semana anterior, no 65º dia de epidemia, esse número era de 0,021. Aqui estamos fazendo a previsão para o relatório da OMS de número 71, datado de 31 de março — com dados para diferentes países.

O padrão não óbvio

Dentre diversos padrões observados, um chama mais atenção e surge quando analisamos a relação entre o dado de distribuição etária dos países e sua influência na predição do número de mortes.

Intuitivamente, somos levados a crer que países com uma grande população de idosos são prontamente mais suscetíveis a maior mortalidade por COVID-19. Este é um padrão considerado óbvio, de aparente fácil entendimento e justificativa, e por isso é extremamente aceito pela população de maneira geral.

Embora isso seja uma verdade para números maiores de dias (e em dado momento do tempo), é possível observar no gráfico ao lado que esse padrão segue uma trajetória contraintuitiva ao longo da epidemia. Inicialmente, ter uma maior população de idosos colabora para que o modelo decida por predizer um número menor de mortes.

Uma das interpretações possíveis para esse padrão é de que a população idosa, mais propensa a necessitar de cuidados especiais, já adota em boa parte alguma medida de isolamento (ainda que parcial) e tende a passar menos tempo em contato com outros indivíduos. Este comportamento se aproxima da recomendação de distanciamento, contribuindo para uma previsão inicial mais otimista por parte do modelo.

Entretanto, conforme a epidemia avança ao longo do tempo, o alto número de idosos passa a ser entendido pelo modelo como um fator determinante para o aumento no número de mortes. E o crescimento da contribuição da população idosa passa a ser exponencial.

A hipótese para isso é de que a população jovem, menos propensa ao comportamento de reclusão da população idosa, contrai o vírus e o transmite aos mais velhos pelo contato pessoal.

Por ser grupo mais suscetível ao óbito por COVID-19, a grande população de idosos agora passa por uma inversão, e é encarada pelo modelo como um elemento importante para uma previsão mais pessimista.

Esse padrão é importante de se observar considerando que reflete a possibilidade de que populações com grande número de idosos possam demorar para identificar a aceleração da curva do número de mortes e, consequentemente, adotar medidas mais brandas de isolamento.

A importância dos 45–49 anos

Outro padrão pouco óbvio encontrado pelo modelo é o impacto da presença de pessoas na faixa etária dos 45–49 anos para a previsão do número de mortes.

O grupo de risco para COVID-19 é definido pela OMS como aqueles com idade a partir de 60 anos — ou com condições preexistentes. Entretanto, o modelo sugere que o risco passa a ser maior já a partir da faixa etária dos 45 anos, levando a uma previsão mais pessimista.

Estratégias de combate

É importante refletir sobre o efeito que diferentes medidas de isolamento podem ter sobre a frequência de contágio do vírus. Uma proposta recorrente é a do isolamento vertical — uma estratégia que prevê a adoção do isolamento apenas entre pessoas de grupos de risco (maiores de 60 anos de idade, portadores de doenças crônicas, entre outros), com o restante da população retomando a circulação para suas atividades habituais.

Os padrões indicados por nosso modelo parecem indicar que essa talvez não seja a melhor estratégia. O isolamento de um grupo de idosos por si só não parece ser suficiente para conter a infecção dessa população. Sendo um único sistema, o isolamento de todos mostra-se mais efetivo para o combate ao vírus.

Importante destacar que os achados aqui comunicados não são conclusões definitivas. Eles representam o início de um diálogo sobre o momento atual da pandemia para o qual convidamos a comunidade científica a participar. O desafio de frear a pandemia do coronavírus é imenso, e tampouco será superado sem a união de mentes e esforços e o espírito de colaboração. Não hesite em nos contatar com suas considerações e buscaremos formas de colaborar.

Nota: o texto foi editado no dia 14 de abril para esclarecer a data da previsão do modelo.

Outros artigos: