Análisis de Datos y Aplicación de Clustering en Registros de Casos Confirmados por COVID-19 en la Provincia de Cañete
Data Analysis and Clustering Application in Case Records Confirmed by COVID-19 in Cañete Province
DOI:
https://doi.org/10.53942/srjcidi.v2i3.84Keywords:
COVID 19, Python, Algoritmo de clusteringAbstract
Tomar las medidas necesarias para la contención de la Pandemia por Covid19 resulta muy complejo. En la actualidad, los Países reconocen muy tarde las situaciones de riesgo de la propagación del virus provocando el colapso de camas UCI en los Hospitales. Por ello se busca identificar los niveles de alerta temprana para evitar una nueva ola de contagio y ubicar los distritos con mayor impacto del virus COVID-19. Esta investigación se desarrolló en 6 fases: La primera consistió en obtener y preparar los datos para el análisis, luego se cargaron los datos al entorno de trabajo Colab, después se seleccionaron los datos de reportes de contagio correspondientes a la provincia de Cañete, Perú; En cuarto lugar, se realizó un análisis utilizando las librerías pandas y Matplotlib, posterior a ello, se creó un nuevo DataFrame con los datos anteriores, finalmente se aplicó el algoritmo de agrupación para segmentar los datos del DataFrame. Obteniendo como resultado, cuatro niveles de alerta temprana, definidos de acuerdo con el total de casos reportados por día. Además, se obtuvo que los distritos con mayor impacto son Imperial y Mala, ya que presentaron mayor frecuencia de reportes y sus promedios de contagios por día son altos. Lo que contribuye a determinar indicadores para plantear nuevas estrategias de prevención, vigilancia y contención de la pandemia en el País.