Skip to content

Análisis de las variantes de COVID-19 de acuerdo con información de GISAID

Notifications You must be signed in to change notification settings

RodrigoZepeda/VariantesCovid

Repository files navigation

VariantesCOVID

Nacional

Variantes a nivel nacional

CDMX

Variantes en Ciudad de México

Norte

Variantes en región norte

Oriente y Oeste

Variantes en regiones oriente y oeste

Sur

Variantes a en región del centro

Descripción

Publicación diaria (automatizada) de las variantes en México usando datos de GISAID.

  • Tablas en la carpeta tablas
  • Gráficas en la carpeta images

Nota Si usas los datos debes citar a GISAID (ver referencias)

Paquete covidmx en rstats

Para analizar en R los datos más actuales de esta publicación instala el paquete covidmx:

library(covidmx)
variantes <- descarga_datos_variantes_GISAID()

Nota Si usas los datos del paquete debes citar a GISAID (ver referencias) así como el paquete covidmx.

Datos

Los datos necesitas obtenerlos de GISAID yendo a Downloads > Variant Surveillance.

Alternativamente puedes usar el scrapper download_gisaid.py con tu password y tu usuario. No es un producto oficial y úsalo bajo tu riesgo pues desconozco si va en contra de los términos y condiciones de GISAID.

Automatización

Para Linux puedes usar crontab para automatizar la descarga de la base de datos. Sugerencia:

  1. Crea tu crontab parecido a este:
57 14 * * * export DISPLAY=:0 && /bin/sh /home/rodrigo/VariantesCovid/orchestrate.sh > /dev/null 2>&1

donde tu número de display se obtiene haciendo

env | grep 'DISPLAY'
  1. Guarda tus credenciales en gisaid_user_password.txt donde el primer renglón es tu usuario y el segundo tu password:
usuario
password
  1. Cambia los paths en el orchestrate.sh y vulélvelo ejecutable con chmod +x orchestrate.sh.

Funcionamiento

Algunas de las variantes que no fueron asignadas a un linaje uso pangolin para asignarlas. Para ello el ciclo se vuelve más complejo pues hay que descargar los FASTA de GISAID. El diagrama es así

flowchart TD;
    a[<code>download_gisaid.py</code><br>Descarga los datos<br>de GISAID]-->b[<code>analisis_variantes.R</code><br>Identifica los datos<br>de variantes faltantes];
    b-->c[<code>download_fasta.py</code><br>Descarga los FASTA que<br> no han sido asignados<br> en GISAID];
    c-->d[<code>get_pangolin.sh</code><br>Corre <code>pangolin</code> para <br> clasificar el FASTA];
    d-->b;
    b-->e[<code>analisis_variantes.R</code><br>Genera el reporte<br>diario de variantes];
Loading

Instalar

  1. Copia este repositorio en tu computadora
git clone git@github.com:RodrigoZepeda/VariantesCovid.git
  1. Usando conda instala los ambientes en los archivos yml (son dos distintos):
conda env create -f environment.yml
conda env create -f pangolin_environment.yml

Referencias de GISAID

Khare, S., et al (2021) GISAID’s Role in Pandemic Response. China CDC Weekly, 3(49): 1049-1051. doi:10.46234/ccdcw2021.255 PMCID: 8668406

Elbe, S. and Buckland-Merrett, G. (2017) Data, disease and diplomacy: GISAID’s innovative contribution to global health. Global Challenges, 1:33-46. doi:10.1002/gch2.1018 PMCID: 31565258

Shu, Y. and McCauley, J. (2017) GISAID: from vision to reality. EuroSurveillance, 22(13) doi:10.2807/1560-7917.ES.2017.22.13.30494 PMCID: PMC5388101

About

Análisis de las variantes de COVID-19 de acuerdo con información de GISAID

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published