terça-feira, 1 de dezembro de 2009

Data Mining













































Data Mining é conhecido como mineração de dados é o processo de extração de conhecimento de grandes bases de dados, convencionais ou não. Apresenta as informações utilizáveis, implícitas e recentes a partir de dados, que possam ser utilizadas para resolver um problema de negócios. A Mineração de dados pode ser aplicada tanto para a pesquisa cientifica como para impulsionar a lucratividade da empresa madura, inovadora e competitiva.
Diariamente as empresas acumulam grande volume de dados em seus aplicativos operacionais. São dados brutos que dizem quem comprou o que, onde, quando e em que quantidade. É a informação vital para o dia-a-dia da empresa. Se fizermos estatísticas ao final do dia para repor estoques e detectar tendências de compra, estaremos praticando business inteligence (BI). Se analisarmos os dados com estatística de modo mais refinado, à de procura de padrões de vinculações entre as variáveis registradas, então estaremos fazendo Mineração de dados. Buscamos com o MD conhecer melhor os clientes, seus padrões de consumo e motivações. A MD resgata em grandes organizações o papel do proprietário atendendo no balcão e conhecendo sua clientela. Através da MD, esses dados agora podem agregar valor às decisões da empresa, sugerir tendências, desvendar particularidades dela e de seu meio ambiente e permitir ações melhor informados aos seus gestores.
Pode-se então diferenciar o business inteligence (BI) da Mineração de dados (MD) como dois patamares distintos de atuação. O primeiro visa obter a partir dos dados operativos brutos, informação útil para subsidiar a tomada de decisão nos escalões médios e altos da empresa. O segundo busca subsidiar a empresa com conhecimento novo e útil acerca do seu meio ambiente. O primeiro funciona no plano estratégico, o segundo no tático.
Tem como objetivo encontrar padrões e relacionamentos entre dados de modo que a empresa possa se embasar melhor nas tomadas de decisões.
Por outro lado, o uso incorreto desta tecnologia pode gerar muito mais confusão, levando a empresa a tomar decisões erradas.
Uma empresa utilizando Data Mining é capaz de:
- Criar parâmetros para entender o comportamento do consumidor;
- Identificar afinidades entre as escolhas de produtos e serviços;
- Prever hábitos de compras;
- Analisar comportamentos habituais para detectar fraudes.

Exemplos:

Prático

Imagine que a letra ‘A’ esteja representando um item qualquer de um registro comercial. Por exemplo, a letra ‘A’ poderia significar “aquisição de pão” em uma transação de supermercado. A letra ‘B’ poderia, por exemplo, significar “aquisição de leite”. A letra ‘C’ é um indicador de que leite que foi adquirido é do tipo desnatado. É interessante notar que a obtenção de uma regra com as letras “AB” quer dizer, na prática, que toda vez que alguém comprou pão, também comprou leite. Esses dois atributos estão associados e isto foi revelado pelo processo de descoberta de padrões.
Esta associação já nos fará pensar em colocar "leite" e "pão" mais próximos um do outro no supermercado, pois assim estaríamos facilitando a aquisição conjunta desses dois produtos.

Real

Wal-Mart
Embora recente, a história de Mineração de dados já tem casos bem conhecidos. O mais divulgado é o da cadeia americana Wal-Mart, que identificou um hábito curioso dos consumidores. Ao procurar eventuais relações entre o volume de vendas e os dias de semana, o software apontou que, as sextas-feiras, as vendas de cervejas cresciam na mesma proporção que as fraldas. Crianças bebendo? Não. Uma investigação mais detalhada revelou que, ao comprar fraldas para seus bebês, os pais aproveitavam para abastecer as reservas de cerveja para o final de semana.

4 comentários:

  1. O Data Mining está se tornando cada vez mais popular como uma ferramenta de gerenciamento de informação, revelando estruturas de conhecimento, que possam guiar decisões em condições de certeza limitada. Recentemente, houve interesse crescente em desenvolver novas técnicas analíticas, especialmente projetadas para tratar questões relativas a Data Mining. No entanto, Data Mining ainda está baseado em princípios conceituais de Análise de Dados Exploratórios e de modelagem.

    ResponderExcluir
  2. Oi Vanessa..estou passando aqui pra lhe dar parabéns!!! Adorei as informações postadas aqui..isso me faz lembrar mto as aulas, as apresentações do qual tive a oportunidade de participar. Continue assim.. Sempre em busca de novas informações!! Alias ser uma Bacharela de SI não pode ficar parada no tempo!! bjoos Sdd.. Camila

    ResponderExcluir
  3. Talvez a definição mais importante de Data Mining[1] tenha sido elaborada por Usama Fayyad (Fayyad et al. 1996):

    "...o processo não-trivial de identificar, em dados, padrões válidos, novos, potencialmente úteis e ultimamente compreensíveis"

    Esse processo vale-se de diversos algoritmos (muitos deles desenvolvidos recentemente) que processam os dados e encontram esses "padrões válidos, novos e valiosos". É preciso ressaltar um detalhe que costuma passar despercebido na literatura: embora os algoritmos atuais sejam capazes de descobrir padrões "válidos e novos", ainda não temos uma solução eficaz para determinar padrões valiosos. Por essa razão, Data Mining ainda requer uma interação muito forte com analistas humanos, que são, em última instância, os principais responsáveis pela determinação do valor dos padrões encontrados[2]. Além disso, a condução (direcionamento) da exploração de dados é também tarefa fundamentalmente confiada a analistas humanos, um aspecto que não pode ser desprezado em nenhum projeto que queira ser bem sucedido.

    ResponderExcluir
  4. A necessidade de compreender as informações, complexos conjuntos de dados ricos, é comum à praticamente todas as áreas de negócios, ciência e engenharia. No mundo dos negócios, dados corporativos e dos clientes estão sendo reconhecidos como um ativo estratégico.
    A mineração de dados representa uma das principais aplicações de data warehousing, uma vez que a única função de um data warehouse é fornecer informações aos usuários finais para apoio à decisão. Ao contrário de outras ferramentas de consulta e sistemas de aplicação, o processo de data mining é a busca de novas informações valiosas, e não trivial em grandes volumes de dados, é capacidade de extrair conhecimento útil e oculto nestes dados.
    Essas ferramentas de Gestão do Conhecimento são cada vez mais importantes e indispensáveis no mundo competitivo de hoje.

    ResponderExcluir