MINERAÇÃO DE DADOS EM UMA BASE DE DADOS TELEFÔNICA UTILIZANDO A FERRAMENTA WEKA

Renato Manso Bastos

Resumo



BASTOS, Renato Manso ¹;

FENDT, Leticia Carvalho Pivetta ²

 

As grandes  massas de dados armazenada diariamente pelas empresas pode ter ser útil não apenas como dados que podem ser consultados, tendo em vista esses dados pode ser utilizados como ferramenta de trabalho onde pode-se extrair conhecimento a partir destes dados e não apenas informações como estamos acostumados a obter com consultas corriqueiras a estes dados através dos sistemas comerciais ERP ou de gestão comercial, onde encontramos nestas ferramentas apenas relatórios do tipo em que o desenvolvedor prospectou ser importante para o ramo de negócios em que ele projetou se sistema. O objetivo deste trabalho é demostrar como pode-se extrair conhecimento através de uma base de dados qualquer, foi realizado um estudo de caso com objetivo  de extrair conhecimento de uma base de dados com registros de ligações telefônicas que foi cedido por uma grande empresa que atua no ramo atacadista na cidade de Ji-Paraná/RO, para o objetivo ser alcançado seguimos as fazes do, KDD (Knowledge Discovery in Databases) – ou de descoberta de conhecimento em bases de dados. Fases do KDD: seleção, pré-processamento, limpeza, transformação, aplicação da tarefa de mineração, interpretação do conhecimento, analise dos resultados. Durante a seleção dos dados nos foi fornecido a base dados com o registro das ligações telefônicas dos últimos 12 meses sendo que este banco de dados estava em formato de arquivo log txt, o arquivo com 327.720 linhas com ligações efetuadas entre maio de 2009 a maio de 2010 os registros são referentes à ligações originadas pelos funcionários da empresa utilizando o sistema PABX, central telefônica com ramais, cada usuário possui um numero de ramal sendo capaz de identificar os mesmos, o arquivo de log com os dados foi migrado para um SGDB MySQL onde foi efetuado o processo de limpeza, utilizando a facilidade da linguagem SQL para proceder a eliminação de incompletudes, registros em branco ou dados discrepantes, que estivessem absurdamente fora do padrão, em seguida alguns atributos foram transformados para um padrão estatístico ex: o campo data foi transformado para    (01/10/2010 a 31/10/2010) foi modificado para out_2009 pois a ferramenta Weka  foi desenvolvida para uso acadêmico e possui limitações com tipo de dados hora e data. A tarefa de mineração utilizada ficou por conta da Associação, foram feitos teste com os algorítimos: Apriori e PredicativeApriori, sendo que o primeiro Apriori nos retornou: 10 regra de associação, já com o PredicativeApriori obtivemos: 100 regras de associação, apesar das limitações pelo fato de ser uma ferramenta Weka pode-se extrair conhecimento minerando a base de dados proposta.

 

Palavras-Chave:Mineração de Dados, Base de Dados Telefônica, Fermenta Weka

 

¹ Aluno de Sistemas de Informação, Ceulji – renatosos@hotmail.com

² Professora orientadora, Sistemas de Informação, Ceulji – leticia_privetta@yahoo.com.br


Apontamentos

  • Não há apontamentos.