Especialização Online em Ciência dos Dados começa em Abril

Nova rodada de cursos online que compõem a Especialização em Ciência dos Dados, oferecida pela John Hopkins University, através do Coursera, começa nesta segunda feira 07 de abril.

O Coursera é um dos MOOC (massive online open course) mais famosos da atualidade, oferecendo cursos de renomadas universidades internacionais para dezenas de milhares de alunos por vez. Desde o ano passado começaram a oferecer “Especializações“: uma série coordenada de cursos que, uma vez completados, oferecem um certificado especial de especialização.

Amanhã, 07 de abril, três cursos da especialização em Data Science, oferecida pelos professores Brian Caffo, Jeff Leek e Roger D. Peng, todos do departamento de Bioestatística da John Hopkins University (Estados Unidos). Os três cursos que abrem amanhã são “The Data Scientist’s Toolbox”, “R Programming” e “Getting and Cleaning Data”. Cada um deles será oferecido em turmas de maio e junho também. Em maio os três cursos seguintes começarão a ser oferecidos, também três vezes sucessivas – maio, junho e julho. Por fim, os três últimos serão oferecidos em junho, julho e agosto. A especialização é encerrada com um projeto especial, ainda sem data definida.

data scientist

 

Os cursos podem ser feitos sem ordem pré-definida, mas existe uma ordem de dependência a depender do conhecimento do aluno. O requisito para conseguir o certificado de especialização é cursar a todos e realizar o projeto final. Os cursos são gratuitos, e o único custo são os certificados, 49 dólares por curso realizado. Além de foto, o sistema de autenticação analisa o padrão de digitação para ter certeza de que o próprio aluno está realizando as atividades.

Dica: não se assuste com a linguagem R de programação. Antes de começar o curso, faça o módulo “Try R” na Code School e, em apenas 2 horinhas, veja como é fácil gerar e analisar dados e gráficos no programa.

 

12 Livros para o profissional de comunicação ler em 2014 – parte 2

Continuando a série de 12 livros para o profissional de comunicação ler em 2014, três publicações que tratam de estatística, sua aplicação e disseminação no cotidiano.

 

thinking statisticallyPara começo de conversa, o pequeno livro Thinking Statistically, do Uri Bram, não é um grande manual de estatística como os que você por aí. Tampouco busca ser um guia completo ou exaustivo dos conceitos de dados quantitativos, regressão múltipla ou métodos específicos de mensuração estatística. Como o título aponta, ele quer te ajudar a pensar melhor, raciocinar levando em conta as diversas variáveis que podem estar envolvidas em um problema ou hipótese.

Buscando alcançar este objetivo, o livro é dividido em três seções: Seleção, Endogenia e Bayes. O primeiro trata do selecionar coisas a serem observadas. Ao invés de falar de amostragem e seus complexos cálculos, antes explica como o senso comum pode levar a erros de seleção, como percepção seletiva. Já o capítulo sobre endogenia explica o porquê você deve olhar além do entorno de seu problema. A velha, clássica e sempre maltratada distinção entre correlação e causalidade é a chave deste capítulo. Por fim, apresenta os elementos da inferência bayesiana, que ajuda a colocar na fórmula – literalmente, as incertezas presentes em qualquer probabilidade.

O texto é redigido de modo quase informal, com exemplos e casos reais e ficcionais bem curiosos, garantindo a diversão na leitura. Na Amazon você compra a versão digital por apenas 6 reais.

 

big data O livro Big Data: A Revolution that Will Transform How We Live, Work, and Think, traduzido como Big Data: como extrair volume, variedade, velocidade e valor da avalanche de informação cotidiana explora de forma responsável e minuciosa os impactos da ideia de “big data”, tão em voga hoje nos mercados e imprensa. O conhecimento dos autores sobre a história da pesquisa permite uma profunda discussão sobre o impacto da abundância dos dados, como ao falar sobre amostragem aleatória: “random sampling has been a huge success and is the backbone of modern measurement at scale. But is only a shortcut, a second-best alternative to collecting and analyzing the full dataset”.

Viktor Mayer-Schonberger é professor de Oxford e Kenneth Cukier é jornalista e editor da revista The Economist. Juntos criaram um livro acessível e necessário a quem deseja entender o fenômeno para além do “buzz” mercadológico. Uma dica é acompanhar o blog do Lab404, da UFBA, que publicou posts sobre todos os capítulos do livro, que foi discutido por lá, como em Big Data: por que usar uma amostra quando é possível usar N=all?

 

the signal and the noiseSignal and the Noise, ou O Sinal e o Ruído, de Nate Silver, é um típico livro americano voltado a quem deseja estudar alguma inovação sobre o mundo tecnológico que influencia os negócios. Repleto de narração de casos – cada capítulo é amplamente baseado em um casos curioso de uma área, o autor passa do pôquer à política, tocando em temas como sismologia e baseball.

Silver é estatístico e ficou famoso ao “prever” as eleições americanas de 2008 e 2012, um caso que foi amplamente coberto pela imprensa e o tornou bastante famoso também em terras brasileiras. As histórias e metáforas que usa no livro são comumente utilizadas por clientes e gerentes de marketing: se você trabalha em agência ou consultoria, é mais um motivo pra lê-lo.

Não esqueça de ver a primeira parte em 12 Livros para o profissional de comunicação ler em 2014 – parte 1. Em breve, mais livros sobre comunicação para deixar seu 2014 repleto de boas ideias e inquietações.

Os Numerati, por Stephen Baker

Conceito interessante do pesquisador Stephen Baker, bastante útil para pensar as profissões da comunicação digital, cada vez mais calcadas em análises e pesquisa de marketing. Cita um exemplo de uma consultoria que segmentou os americanos em 10 “tribos”, para analisar seus perfis de voto e estratégias de persuasão necessárias.