Dizem que a primeira atividade humana foi a caça. Por entre as savanas e florestas, o ser humano - talvez ainda nem tão humano, nem tão homo sapiens sapiens - olhava o chão em busca de pistas que o levassem até sua presa. Buscava qualquer rastro que indicasse qual caminho seguir. Uma pegada, um barulho, um movimento. Qualquer pequena dica da direção deveria ser encarada com a maior atenção possível.
Ao mesmo tempo, o mesmo ser humano olhava para cima, percebia padrões e semelhanças entre o céu e a terra. Um touro, uma ursa, um cinturão. Qualquer semelhança entre as figuras celestes e os objetos terrenos indicava que poderia haver - e por que não? - uma ligação entre o firmamento e a terra. Buscavam-se as regras, as repetições, os ciclos celestes que determinariam as coisas aqui no mundo debaixo.
Enquanto os caçadores olhavam o chão, tentando entender o caminho percorrido pelo animal, os oráculos olhavam o céu, buscando as leis que permitiriam a previsão do futuro. Esses caçadores, de observar os rastros no chão, passaram a observar os rastros dos homens, os passos humanos, e então já não recriavam os caminhos das presas, mas sim por intermédio de vestígios passados, a história: o que se deu, por quê se deu, como se deu. E os riscos no chão se tornam então riscos da escrita, traçados e linhas a desenhar e descrever a história. Então já não se tratavam mais de caçadores, mas de historiadores. E, por que não, pesquisadores de experiência do usuário?
Já os oráculos e astrólogos, de tanto observarem o céu, se dão conta de que as regularidades cósmicas não se relacionavam com a terra como esperavam. Havia, sim, como prever os movimentos, os eclipses, os calendários, mas não exatamente da maneira que pensavam. Eles, então, foram deixando de lado as previsões extravagantes e começaram a se limitar aos fenômenos sensíveis e quantitativos, das rotações, das velocidades, dos pesos e das medidas. E por que não analisar os dados?
As duas linhas que auxiliam a tomada de decisão, a análise de dados e a pesquisa de experiência do usuário, se remetem a duas formas fundamentais, opostas, mas complementares, de se ver o mundo. A divisão destes dois paradigmas remetendo a fatos tão primitivos possui amparo nas ideias do historiador Carlo Ginzburg.
Duas formas de conhecer o mundo
O historiador Carlo Ginzburg, criador de uma área chamada micro-história, em seu fascinante texto Sinais: raízes de um paradigma indiciário, apresenta as semelhanças entre as práticas do caçador e os métodos utilizados nas ciências humanas. Ele descreve o historiador como um caçador que, a partir de vestígios e índices dispersos, de pequenos detalhes irrelevantes, poderia reconstruir os acontecimentos e desvendar o que se sucedeu. O próprio autor compara o historiador a um detetive, um Sherlock Holmes, que das pistas mais sutis consegue recriar todo o desdobramento do crime, juntamente com o paradeiro do criminoso.
Vejamos então uma pequena definição do que seria esse paradigma indiciário [1]:
“O que caracteriza esse saber é a capacidade de, a partir de dados aparentemente negligenciáveis, remontar a uma realidade complexa não experimentável diretamente. Pode-se acrescentar que esses dados são sempre dispostos pelo observador de modo tal a dar lugar a uma sequência narrativa, cuja formulação mais simples poderia ser “alguém passou por lá”. [...] O caçador teria sido o primeiro a “narrar uma história” porque era o único a ler, nas pistas mudas (se não imperceptíveis) deixadas pela presa, uma série coerente de eventos.”.
Essa forma de trabalhar pode ser vista nos objetivos dos pesquisadores de experiência do usuário. Um comentário a respeito de um hábito, uma insinuação de uma aspiração, um tom de frustração, um erro durante o uso de interface, são os pequenos detalhes que, assim como nas ciências humanas, fundamentam as hipóteses e os insights dos pesquisadores.
Se a pesquisa qualitativa de experiência do usuário pode ser remetida aos métodos do paradigma indiciário, qual seria o paradigma ou modo de trabalho de quem se baseia nos dados? Seria o outro lado do conhecimento: as ciências físicas, que usam a matematização para predição e intervenção de eventos naturais.
Podemos então dizer que a pesquisa do usuário, assim como as ciências humanas, deseja a compreensão e a interpretação, e então pode ser denominada histórico-interpretativa. Já o cientista de dados, à semelhança das ciências naturais, busca a previsão e intervenção, e então pode ser chamada de técnico-analítica [2]. Repare que disse cientista de dados, não analista de dados.
Isso coloca a pesquisa e a ciência de dados em lados opostos. Enquanto a primeira seria histórica, tentando descobrir motivações, aspirações, hábitos, valores e narrativas, a segunda seria técnica, tentando intervir, prever, padronizar e otimizar. Observando um exemplo de trabalho, teremos no primeiro caso um estudo, que nos responde o porquê dos usuários fazerem o que fazem. Enquanto no segundo teríamos um modelo de previsão que nos diz quanto de chance um usuário tem de fazer algo. No primeiro compreendemos, no segundo prevemos.
Essa divisão parece em um primeiro momento irreconciliável. De um lado temos dados e do outro experiências. Como equacioná-los? A resposta está no papel intermediário: o analista de dados.
O analista de dados, que não tem a ambição de criar modelos preditivos dos cientistas de dados nem a capacidade de aprofundar em experiências através de entrevistas, precisa utilizar ambos se quiser realizar bem seu trabalho. Deve encontrar padrões nos dados, como o cientista de dados, mas também deve interpretá-los, como o pesquisador.
Agora, parece que temos três categorias, não mais duas. O analista de dados seria um terceiro paradigma que utiliza as técnicas dos outros dois. Entretanto, isso seria um erro, pois não se trata de uma separação mas de um espectro contínuo.
Um espectro para os insights de produto
Como conciliar esses três grupos? Pense em uma faixa, que vai do cientista de dados, passa pelo analista de dados e chega no pesquisador. Ao longo dele, todas as técnicas de encontrar insights estão mais próximas de um ou de outro lado, mas estão ao longo de uma faixa contínua como na figura abaixo.
Na extremidade do espectro da ciência de dados, começamos com o teste A/B. Apesar de não ser considerada uma técnica específica da ciência de dados, o teste de hipótese, com grupo controle, é o padrão ouro das ciências naturais e é o que mais se aproxima dos testes realizados nos laboratórios físicos O teste A/B é a mais confiável técnica de se alterar o comportamento dos usuários e alterar os rumos dos negócios.
Em seguida temos a validação-cruzada (k-fold), em que o conjunto de dados é dividido entre um grupo de treino e um grupo de teste. Através dessa divisão, busca-se simular artificialmente o grupo controle com um conjunto de dados ainda não validado pelo modelo. Juntamente com ela temos os chamados modelos supervisionados, com variáveis-alvo. Esses modelos possuem uma variável, por exemplo, churn, a desistência de seu produto, a ser predita.
Logo em seguida temos os modelos não-supervisionados, por exemplo, k-means, junto com a correlação e outras estatísticas, como média, desvio-padrão, etc. Essas buscam encontrar padrões e relações por meio de modelos matemáticos. Até aqui estamos no campo do que é comumente visto como ciência de dados.
Na sequência, há os tipos de análises feitas pelos analistas de dados: contínuas, discretas, categóricas e históricas. As análises com dados contínuos (tempo e valores monetários) e dados discretos (frequência de acesso e número de produtos comprados), por se referirem a valores numéricos, estão mais próximas dos cientistas de dados.
Já as análises com dados categóricos (tipos de produtos comprados e dias da semana), assim como as análises de dados históricos (com uma variável ao longo do tempo), demandam mais informações contextuais que estão fora dos números. É impossível compreendê-las sem levar em conta fatores macroeconômicos externos ou mudanças de negócio.
A ordem apresentada vai do mais quantitativo ao mais qualitativo, pois analisar dados categóricos e históricos exige um grau muito maior de interpretação e contexto para se chegar a insights, de maneira que esses últimos já se aproximam do terreno da pesquisa qualitativa.
Agora, já nos aproximamos das práticas dos pesquisadores de experiência do usuário, com a pesquisa por formulários. Sendo uma boa maneira de se descobrir informações além das que estão presentes no produto ou serviço, podem permitir a descoberta de pontos cegos ou oportunidades ainda não mapeadas.
E, finalmente, do lado mais próximo da experiência do usuário temos: o teste de usabilidade, a entrevista em profundidade e o estudo de tendências. O teste de usabilidade responde a uma pergunta relativamente fechada: o nosso design de interação é compreendido e utilizado corretamente pelos usuários? Na entrevista em profundidade temos uma gama maior de dúvidas: quais são os hábitos, comportamentos, aspirações e narrativas dos usuários? Por último, no estudo de tendência, a pergunta é ainda mais aberta e incerta: o que será do futuro? Repare que estas se tornam cada vez mais dependentes da interpretação e mediação do pesquisador, sendo, então, mais próximas do que chamamos histórico-interpretativas, mais próximas das ciências humanas puras.
Após essa escala, parecemos ter tornado o trabalho mais difícil, pois agora dividimos os dados e as experiências em campos opostos. Entretanto o objetivo é justamente o contrário, essa escala mostra como todas as ferramentas são na verdade complementares e podem ser usadas em conjunto, de modo que a pesquisa qualitativa indica novas hipóteses às análises quantitativas, enquanto os dados sugerem ao pesquisador caminhos não explorados.
Na pré-história, caçadores e oráculos, com suas diversas técnicas, cumpriam a tarefa de manter a subsistência da tribo. Hoje, cabe aos cientistas de dados, analistas de dados e pesquisadores de experiência do usuário, com seus múltiplos métodos, não se esquecer de que sua tarefa é a sobrevivência do negócio.
Anexo
Essa é uma pequena tabela com sugestões de outras áreas onde o espectro aqui proposta parece aplicável:
Referências
- Texto "Sinais: raízes de um paradigma indiciário" no livro Mitos, emblemas, sinais de Carlo Ginzburg.
- A divisão entre ciências técnico-analíticas e histórico-interpretativas se baseia na divisão dos interesses de conhecimento proposta por Habermas e presente no texto "Qualidade, quantidade e interesses do conhecimento" do livro Pesquisa qualitativa com texto, imagem e som: um manual prático organizado por Martin W. Bauer e George Gaskell.