Este projeto visa construir rotas web interativas usando Flask que se conecta ao AWS COVID-19 data lake para visualizar dados atualizados sobre a pandemia. As rotas oferecem gráficos e mapas para explorar tendências de casos, disponibilidade de leitos hospitalares e dados de vacinação, facilitando a compreensão dos diversos aspectos da pandemia.
Utilização do Amazon CloudFormation para configurar o Data Catalog no AWS Athena, garantindo acesso fácil aos datasets relevantes do COVID-19 data lake.
Identificação e seleção dos conjuntos de dados mais relevantes, como números de casos, mortes, dados de leitos hospitalares e informações sobre vacinação.
Elaboração de consultas SQL para extrair os dados necessários do AWS Athena para as visualizações planejadas.
As consultas de SQL através da Amazon Athena possuem os dados de retorno armazanados em um bucket da Amazon S3.
Desenvolvimento de uma aplicação Flask que serve como a base, gerenciando conexões e execuções de consultas ao Athena.
Criação de gráficos e mapas interativos usando a biblioteca Plotly para representar visualmente os dados.
Uso de arquivo csv encontrado na Harvard Dataverse sobre as eleições presidenciais dos Estados Unidos para filtragem dos dados e relacionamento com a quantidade de pessoas vacinadas por estado.
Rotas contendo visualizações na aplicação Flask, assegurando uma interface interativa para os usuários.
Os dados salvos no Amazon S3 serão consumidos em um notebook que apresenta todas os gráficos e análises produzidas na aplicação.
- AWS Athena
- AWS CloudFormation
- AWS S3
- Flask
- SQL
- Python
- Plotly
- HTML