Skip to main content
Global

4.8: Mineração de dados

  • Page ID
    171116
  • \( \newcommand{\vecs}[1]{\overset { \scriptstyle \rightharpoonup} {\mathbf{#1}} } \) \( \newcommand{\vecd}[1]{\overset{-\!-\!\rightharpoonup}{\vphantom{a}\smash {#1}}} \)\(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\) \(\newcommand{\id}{\mathrm{id}}\) \( \newcommand{\Span}{\mathrm{span}}\) \( \newcommand{\kernel}{\mathrm{null}\,}\) \( \newcommand{\range}{\mathrm{range}\,}\) \( \newcommand{\RealPart}{\mathrm{Re}}\) \( \newcommand{\ImaginaryPart}{\mathrm{Im}}\) \( \newcommand{\Argument}{\mathrm{Arg}}\) \( \newcommand{\norm}[1]{\| #1 \|}\) \( \newcommand{\inner}[2]{\langle #1, #2 \rangle}\) \( \newcommand{\Span}{\mathrm{span}}\)\(\newcommand{\AA}{\unicode[.8,0]{x212B}}\)

    A mineração de dados é o processo de classificação por meio de big data (medido em terabytes). No passado, faltavam dados para analisar. O desafio é uma superabundância de dados que devem ser revisados, o que é chamado de sobrecarga de dados. Isso se torna um problema porque o usuário precisa avaliar quais informações são úteis e quais não são. Muitas empresas fazem mineração para obter informações detalhadas sobre seus clientes e produtos e otimizar as decisões de negócios. A análise é executada com programas sofisticados. Os programas podem combinar vários bancos de dados. O efeito final é tão complexo que as empresas precisam encontrar uma forma de armazenar os dados. Armazéns de dados são necessários. O data warehouse é onde as informações são armazenadas e processadas a partir da mineração de dados. O preço de um armazém simples pode começar em $10 milhões.

    Empresas como Google, Netflix, Amazon e Facebook são grandes usuários da mineração de dados. Eles buscam descobrir quem é seu consumidor e qual a melhor forma de mantê-los e vender mais produtos. Eles também avaliam seus produtos. Os meios usados são analisar dados e encontrar tendências, padrões e associações para tomar decisões. Geralmente, a mineração de dados é realizada por meios automatizados em conjuntos de dados extensos, como um data warehouse.

    Exemplos de mineração de dados incluem:

    • Uma análise das vendas de uma grande rede de supermercados pode determinar que o leite é comprado com mais frequência no dia seguinte à chuva em cidades com menos de 50.000 habitantes.
    • Um banco pode descobrir que os solicitantes de empréstimos cujas contas bancárias mostram padrões específicos de depósito e saque não apresentam bons riscos de crédito.
    • Um time de beisebol pode encontrar jogadores universitários de beisebol com estatísticas específicas de rebatidas, arremessos e campo para jogadores mais bem-sucedidos da liga principal.

    Em alguns casos, um projeto de mineração de dados é iniciado com um resultado hipotético em mente. Por exemplo, uma rede de supermercados já pode ter alguma ideia de que os padrões de compra mudam depois que chove e queira ter uma compreensão mais profunda do que exatamente está acontecendo. Em outros casos, não há pressuposições e um programa de mineração de dados é executado em grandes conjuntos de dados para encontrar padrões e associações.