Milhões de casos em segundos: os Censos no R

Vale a pena ver o que esse pessoal está produzindo!

SOCIAIS & MÉTODOS

funilCensos Demográficos são bancos de dados muito pesados! Milhões de casos… Operações simples, como frequências, médias e proporções podem demorar muitos minutos. Modelos estatísticos complexos podem demorar horas… ou dias.  O  R convencional (assim como o Stata) carrega todos as informações com as quais está trabalhando na memória RAM. Ou seja, as análises são realizadas muito rapidamente, mas não é possível abrir um banco que seja maior do que a memória disponível. O SPSS e o SAS executam as análises a partir dos arquivos no HD – assim, suportam bancos grandes, mas são muito lentos.

Neste em 2012 e 2013 trabalhei muito com os Censos brasileiros (cf. Projeto Censo). Era necessário descobrir uma maneira de agilizar as análises. Foi quando descobri uma versão do feita exatamente para lidar com grandes bancos de dados, produzida pela Revolution AnalyticsEssa  empresa construiu um software (não aberto) em…

Ver o post original 473 mais palavras

Deixe um comentário

Arquivado em Uncategorized

Deixe uma resposta

Preencha os seus dados abaixo ou clique em um ícone para log in:

Logotipo do WordPress.com

Você está comentando utilizando sua conta WordPress.com. Sair / Alterar )

Imagem do Twitter

Você está comentando utilizando sua conta Twitter. Sair / Alterar )

Foto do Facebook

Você está comentando utilizando sua conta Facebook. Sair / Alterar )

Foto do Google+

Você está comentando utilizando sua conta Google+. Sair / Alterar )

Conectando a %s