A visualização de dados é uma etapa essencial no processo da Agência Fort. É onde você apresenta suas descobertas e comunica os resultados de sua análise em um formato gráfico que é intuitivo e fácil de entender.

A visualização de dados exige muito trabalho, e toneladas de limpeza e análise são necessárias para destilar e manipular dados confusos em belos gráficos e tabelas. Mas mesmo com os dados preparados, ainda é necessário aderir a certos princípios ou metodologias para produzir gráficos úteis e informativos.

Dito isso, neste artigo, vou me inspirar no livro Beautiful Evidence de Edward Tufte, que encapsula seis princípios de como fazer gráficos de dados úteis e informativos. São esses princípios que separam os gráficos úteis daqueles que não são.

Este artigo também é amplamente inspirado no livro Exploratory Data Analysis in R. de Roger D. Peng. Ele está disponível gratuitamente no Bookdown e você pode lê-lo para saber mais sobre EDA.

Agora vamos mergulhar nos princípios.

  1. Mostrar uma comparação (controle vs. grupo de tratamento)

Mostrar comparações é a base de um bom estudo científico. A evidência de uma hipótese é sempre relativa a outra coisa. Veja um exemplo em que você diz “Chocolate amargo melhora o foco e o aprendizado”.

Uma questão importante nesta afirmação é “Comparado com o quê?” Sem uma comparação (hipótese relativa), a afirmação será inútil.

Uma maneira de mostrar a comparação é ter um grupo de controle e um grupo de tratamento. O primeiro não ingerirá chocolate, enquanto o último sim. Dessa forma, você pode comparar os efeitos do chocolate no foco e no aprendizado com base em uma pontuação de teste ou medindo a atividade cerebral.

Ao criar seus gráficos para apresentar seu estudo, o que você pode fazer é plotar o grupo de controle e de tratamento com um box plot. Desta forma, os leitores têm uma noção clara dos efeitos do tratamento.

Agência Fort

  1. Mostre causalidade e explicação

Em seguida, é fornecer uma explicação que mostra uma estrutura causal para pensar sobre a pergunta que você está tentando responder. Se você mostrou que o grupo de tratamento experimentou um efeito diferente do controle, você deve formar uma hipótese a partir da evidência de por que isso acontece.

Voltando ao exemplo anterior, digamos que os sujeitos do grupo de tratamento obtiveram pontuação mais alta em um teste, e isso mostra que o chocolate amargo melhorou o foco. Uma questão importante é perguntar por que isso acontece.

Fazer essa pergunta é importante porque ajuda a levantar novas questões que podem refutar ou reforçar sua hipótese ao longo do estudo.

Para mostrar causalidade ou mecanismo, você pode medir a atividade cerebral dos grupos de controle e de tratamento e traçar os resultados lado a lado.

Com o gráfico de pontuação de teste e o gráfico de atividade cerebral, você vê uma estrutura causal de por que os indivíduos que ingeriram chocolate tiveram melhores resultados, que é que o chocolate amargo melhora a função cognitiva.

  1. Mostrar dados multivariados (> 2 variáveis)

O mundo real é complexo e as relações entre dois eventos geralmente não são lineares. É por isso que nos estudos você tem vários atributos ou variáveis ​​que pode medir.

Todas essas variáveis ​​estão interagindo umas com as outras de várias maneiras. Alguns deles podem ser confundidores, enquanto outros podem ser atributos importantes que explicam a relação dos eventos.

Como você já deve saber, correlação não implica causalidade. Portanto, não é ideal restringir seu estudo a apenas usar duas variáveis, pois isso leva a conclusões errôneas.

Portanto, você deve mostrar o máximo de dados possível em seus gráficos. Isso pode ajudá-lo a identificar quaisquer fatores de confusão em seus dados.

Considere o paradoxo de Simpson, um paradoxo nas estatísticas de probabilidade, em que “uma tendência que aparece em diferentes grupos de dados desaparece quando os grupos são combinados.”

Ilustrar:

duas variáveis ​​- relação negativa

três variáveis ​​- relação positiva (x, y, z) (existem variáveis ​​de confusão)

Agência Fort

  1. Não deixe que as ferramentas conduzam a análise

Um bom contador de histórias sabe como manter a atenção das pessoas e comunicar uma história de forma eficaz. O contador de histórias não é limitado pela história em si, mas pode expressá-la de maneira única combinando diferentes tipos de sentidos e incluindo muitas imagens, dando vida à história.

Da mesma forma, um bom visualizador de dados não se limita às ferramentas de visualização de dados disponíveis. Eles têm a capacidade de expandir de apenas uma forma de expressão (linhas ou círculos) para usar vários modos de apresentação.

Por exemplo, em vez de produzir relatórios que contêm apenas textos e linhas, use gráficos informativos que incluem imagens, diagramas, palavras, números, etc., tudo isso tornando-o rico em informações.

Com uma abundância de informações e gráficos, os leitores podem observar muitas correlações diferentes das evidências em um só lugar.

Então lembre-se, você é quem está contando a história. Não deixe que as ferramentas limitem seu pensamento. Deixe a análise conduzir as ferramentas e criar gráficos ricos em evidências que surpreendem as pessoas.

  1. Documente seus gráficos com rótulos, escalas e fontes de dados apropriados

Quando você olha um gráfico pela primeira vez, primeiro vê qual é o título, depois os rótulos, para saber o contexto por trás dele. Sem eles, o gráfico não contará nenhuma história.

Bons relatórios / gráficos são devidamente documentados, com cada gráfico tendo escalas e rótulos apropriados. As fontes de dados usadas para criar os gráficos também são cruciais.

Portanto, uma boa prática é preservar o código usado para gerar os dados e gráficos, pois isso permite a reprodutibilidade. Ele também adiciona credibilidade aos seus gráficos. Além disso, ao preservar o código, você pode editar seu gráfico caso seja necessário.

  1. Conteúdo acima de tudo

Em última análise, independentemente de todos os princípios acima, sem conteúdo de qualidade, relevância e integridade, seus gráficos serão inúteis ou enganosos. Em outras palavras, “entra lixo, sai lixo”.

Antes de relatar qualquer resultado, certifique-se de que seja algo interessante e importante. Não importa o quão bonitos ou visuais sejam seus gráficos, eles não salvarão resultados ruins.

Ter algo interessante para relatar vem de experiência pessoal ou pode ser uma inspiração tirada da internet. De qualquer forma, sempre faça perguntas, porque é assim que uma ideia se torna realidade.