Utilizando Ciência de Dados para um Melhor Entendimento do Cenário da Violência no Espírito Santo
Nome: EDUARDO RIBEIRO VARGAS DUARTE
Tipo: Dissertação de mestrado acadêmico
Data de publicação: 08/06/2020
Banca:
Nome | Papel |
---|---|
ANILTON SALLES GARCIA | Orientador |
HELDER ROBERTO DE OLIVEIRA ROCHA | Examinador Interno |
JAIR ADRIANO LIMA SILVA | Coorientador |
MARIA CARMEN VIANA | Examinador Externo |
Resumo: Este trabalho tem como objetivo auxiliar a Secretaria de Saúde do Espírito Santo na melhor compreensão da situação da morbimortalidade por causas externas (violência e acidentes), que representa a terceira causa de morte na população em geral e a primeira na população de 1 a 49 anos no Brasil.
Para atingir tal objetivo, foi proposto a construção de um banco de dados, semanticamente estruturado, onde os dados dos registros das vítimas, disponibilizados em fichas textuais sejam organizados com a finalidade de possibilitar o uso de ferramentas para geração de inteligência em relação ao problema da violência. A partir da base de dados, o objetivo é desenvolver um conjunto de ferramentas com o uso de técnicas de Ciência de Dados de modo
a possibilitar a identificação, após a integração das informações, das possíveis causas e consequências desses casos de violência e, com base em técnicas de raciocínio inteligente, propor ações e medidas que possam prevenir os casos mais comuns de violência e/ou amenizar suas consequências. Um banco de dados estruturado foi desenvolvido com base nos registros de violência por
causas externas no estado do Espírito Santo de 2011 a 2018. Com essa base de dados, foram desenvolvidos painéis que ajudaram a analisar as cidades com maior ocorrência de incidentes, como as características pessoais da vítima (cor, idade, estado civil, sexo) afetam os casos e como a relação entre vítima e agressor influencia os incidentes. O algoritmo de aprendizado de máquina teve resultados consistentes na previsão dos casos de violência que ocorreram
várias vezes. O classificador Support Vector Machine (SVM) teve o melhor desempenho, com precisão de 0.7827, recall de 0.7009 e F1 score de 0.7235.
Com este estudo, foi possível ter um conhecimento mais consistente em relação à violência por causas externas no estado do Espírito Santo. O modelo de machine learning provou ser uma ótima ferramenta para prever os casos de violência que ocorreram repetidas vezes.