Estatística descritiva para PMs - Parte 2

A dispersão que existe no seu produto

Estatística descritiva para PMs - Parte 2
Photo by Pritesh Sudra / Unsplash

Para ver a parte 1 dessa série de textos, clique aqui.


Na primeira parte desta série, trouxe os conceitos mais básicos da estatística descritiva, mas que são conceitos fundamentais para entender as distribuições de dados e identificar tendências centrais. 

Como vocês viram, quando a gente olha para média e para mediana, por vezes, temos uma dispersão que não conseguimos enxergar tão facilmente, exceto se analisemos extremos dos conjuntos.

E melhor do que olhar um conjunto número a número, é utilizar as técnicas da estatística que abordaremos aqui nesse texto e que vão nos ajudar a entender melhor a variabilidade e a dispersão dos nossos dados.

Entender esses elementos é fundamental para que a gente não tome decisões erradas ou deixe de fora casos de uso importantes para o nosso produto. Vamos então a nossa primeira medida: a variância.

Variância: a quantificação da dispersão

Variância é uma medida estatística que quantifica o grau de dispersão dos valores de um conjunto de dados em relação à média.

É dada pela fórmula:

Onde:

  • N é o número de dados.
  • xi são os valores individuais no conjunto de dados.
  • é a média dos dados.
  • ∑ representa um somatório.

Ela calcula a média das diferenças ao quadrado entre cada valor e a média, fornecendo uma visão sobre o quanto os dados estão espalhados ou concentrados. Quanto maior a variância, mais os dados variam em relação à média, o que para o nosso dia a dia de produto, pode indicar problemas em nossos produtos. 

Sim, eu sei que você pode estar meio perdido agora. Que raios significa "a média das diferenças ao quadrado dos dados em relação à média do conjunto"? 

Pois bem, vamos por partes. 

A diferença de um elemento do conjunto em relação à média nos mostra a distância que aquele elemento está da média. Por exemplo, se a média de um conjunto de dados é 7 e um dos valores é 5, a distância desse valor à média é 5 - 7 = -2. Simples.

A diferença ao quadrado é então (-2)2= 4.

Mas por que elevar ao quadrado?