Ciência de Dados

Ciência de Dados

Ciência de Dados é uma linha de pesquisa e aplicação interdisciplinar centrada no estudo e análise de dados de diversos domínios – tais como saúde, educação, esportes, jogos, segurança, cidades, governos, astronomia, biologia, economia, engenharias, química, entre outros – que visa apoiar a tomada de decisão e a eficiência nos processos desses domínios. Nessa linha de pesquisa, são estudados e propostos métodos de análise e visualização de dados, incluindo conceitos e técnicas de diversas áreas do conhecimento, tais como Estatística, Banco de Dados, Mineração de Dados, e Aprendizado de Máquina.

Disciplinas

Obrigatórias da Linha de Pesquisa

  • Aprendizado de Máquina
  • Bancos de Dados Distribuídos
  • Mineração de Dados

Optativas

  • Biologia Computacional
  • e-Science
  • Gerência de Dados Semiestruturados
  • Gerência de Grandes Volumes de Dados
  • Visualização de Dados
  • Web Semântica: Tecnologia e Aplicações

Obrigatórias do Curso Recomendadas

  • Estrutura de Dados e Algoritmos
  • Tratamento de Incertezas

Tópicos de pesquisa:

Análise de Dados

Trata-se de um tópico de pesquisa interdisciplinar centrado no estudo e desenvolvimento de técnicas de mineração e visualização de dados, com aplicação em múltiplos domínios, tais como saúde, educação, esportes, jogos, segurança, cidades, governos, astronomia, biologia, economia, engenharias, química, entre outros. A análise e exploração desses dados visam apoiar a tomada de decisão e a eficiência nos processos desses diversos domínios. Alguns temas de pesquisa explorados pelo grupo de professores e seus alunos são: (i) mineração de opinião e análise de sentimento, (ii) mineração de dados incertos, (iii) algoritmos de seleção supervisionada de atributos, (iv) mineração de dados biológicos, e (v) mineração de repositórios de software.

e-Science

Estuda métodos e algoritmos para auxiliar o cientista na condução de suas pesquisas, propondo soluções para todo o ciclo de vida do experimento científico: concepção, execução e análise. Em todas as etapas, preocupa-se com a gerência dos dados de proveniência do experimento. Especificamente em relação a proveniência, há uma preocupação em capturar os dados de entrada e intermediários, assim como as ações feitas pelos cientistas que levaram aos resultados do experimento. Com isso, é possível apoiar a reprodução, auditoria e depuração dos experimentos.

Ciência de Dados em Segurança Cibernética

Pesquisa o uso de métodos orientados a dados (data-driven) no contexto da Segurança Cibernética. Isso inclui, por um lado, compreender como a Ciência de Dados pode ser utilizada durante um ataque cibernético e, por outro lado, desenvolver métodos orientados a dados para realizar a detecção de ataques cibernéticos. Apresentamos, a seguir, alguns dos temas pesquisados nesta linha: (i) ataques furtivos a sistemas de controle em rede; (ii) identificação de bots em redes sociais; (iv) detecção de ataques DDoS a partir de dados de SIEM; (iii) classificação de malware via aprendizado de máquina.