Parte inicial do prefácio do Prof. Dinis Pestana ao livro "Como mentir com Estatística", de Darren Huff, que acaba de ser publicado como n.º 201 da colecção "Ciência Aberta" da Gradiva, agora dirigida por Carlos Fiolhais:
«Dantes não havia Estatística, tinham que se contentar com mentiras.»
STEPHEN LEACOCK
«Eh pá, tortura esses dados, que eles confessam.»
R. COASE
Pode um livro sobre
Estatística tornar-se um bestseller? Sem
dúvida, Como Mentir com Estatística tornou-se quase de imediato
um êxito de vendas (sendo, porventura, a exceção que confirma a regra...).
Muitos factores explicam esse fenómeno: um título
apelativo, ilustrações humorísticas muito bem escolhidas
(e estrategicamente mais abundantes nos primeiros capítulos), exemplos
quase sempre referindo questões amplamente divulgadas
nos meios de comunicação social, um perfume a
escândalo — uma disciplina considerada científica é
afinal constantemente usada para enganar o público —,
pouco volume, e escrita quase terra-a-terra, de uma
simplicidade e clareza notáveis. E, por outro lado, as instituições científicas
de Estatística elogiaram a obra, que assim se torna respeitável e séria, mesmo
quando faz sorrir (frequentemente!).
Mais de meio século volvido
sobre a data de publicação continua a ser um livro cheio de ensinamentos úteis,
numa roupagem divertida. Não admira por isso que a prestigiada revista Statistical
Science tenha dedicado um fascículo do volume de 2005 a comemorar o cinquentenário
da primeira edição, com uma colecção de artigos cuja
leitura será menos amena do que a de Como Mentir com Estatística,
mas que vale a pena ler, pois claramente demonstram que usar Estatística
continua a ser, frequentemente, abusar da Estatística.
Uma parte substancial
do livro denuncia que uma boa dose de divulgação de factos e conclusões,
envolvendo-se em roupagem respeitável de ciência (e, em particular, usando a
Estatística para conferir uma aparência de rigor), usa maus dados. O primeiro
capítulo — que continua actual, e é porventura o mais útil, por ir ao cerne de
numerosas fraudes feitas com uma aparente respeitabilidade estatística — discute
pormenorizadamente as implicações de erros de amostragem, designadamente os que
se devem a amostras não representativas — comentando também que mesmo operações
de amostragem planeadas com rigor facilmente se afastam do padrão de excelência
que pretendem, indo as respectivas causas de simples intervenção do acaso à má
prática de agentes amostrais ou à tendência de os entrevistados fornecerem respostas
«correctas» em vez de verdadeiras.
Por outro lado, muitas
vezes as informações destinam-se a proteger interesses de quem as dá, em vez de
pretenderem agradar a quem as ouve. Há muitos anos (andava eu nos meus 18 anos,
estando longe de pensar em Estatística) li no Diário de Notícias a
deliciosa história de uma «senhora» de Viena que aceitou uma bem intencionada
boleia, mas, quando o carro se dirigia ao local onde recompensaria o motorista
por tão gentil comportamento, ocorreu um acidente, que obrigou a senhora a
internamento hospitalar durante alguns dias. E não é que a ingrata levou o
solícito condutor a tribunal, exigindo desmedida indemnização por perdas no
exercício da actividade, estimada a valores de artigo de muito luxo! E ganhou,
ficando a rir-se, mas não por muito tempo, porque as autoridades fiscais austríacas
depressa lhe enviaram uma intimação para pagar impostos, com multas e coimas
devidas à não declaração do início de actividade e consequente pagamento dos correspondentes
impostos, baseando-se na estimativa que ela tinha apresentado ao tribunal. Esta
historieta ilustra bem que, numa questão aparentemente trivial, interessado muda de interesses conforme as
circunstâncias e se, nuns casos exagera os seu proventos, noutros (e
especialmente nos contactos com o fisco), há a enorme tentação de os depreciar.
Amostragem inadequada é
húmus para o crescimento de ciência da treta. Se eu disser que pedi a dois
colaboradores para entrevistarem 200 cidadãos interrogando-os sobre como iriam
votar no referendo sobre liberalização da lei sobre interrupção voluntária da
gravidez que na altura ia ocorrer, e que um deles reportou que 99,5% eram
favoráveis à alteração legislativa, ao passo que o outro que apenas 11% tinham
declarado ser favoráveis a essa alteração, a Estatística parecerá muito pouco
fiável; mas, se juntar que os primeiros foram entrevistados num jantar de homenagem
à Dr.ª Odete Santos (uma deputada que se envolveu fortemente na campanha a favor
da liberalização da lei) e que a segunda «amostra» foi recolhida à saída de missas
no Mosteiro dos Jerónimos, facilmente se perceberá que não é a Estatística que
é pouco fiável, mas antes que as pessoas que tomaram a decisão de recolher essas
amostras enviesadas, em sentidos opostos, usaram mal a Estatística.
Há muitos anos dei-me
ao trabalho de coleccionar pequenas notícias na revista do «Expresso», sobre «progressos»
na Ciência, numa secção intitulada «Antes do Tempo», se não me falha a memória.
A maior parte dessas notícias seguia o tipo matricial:
Uma
equipa da universidade de... pediu a 46 voluntários que usassem a mesma roupa
durante 24 horas, e que, ao tirá-la, a colocassem num saco de plástico
hermeticamente fechado. O saco era depois dado a cheirar a cada um dos outros
45 indivíduos, pedindo-se que cada um deles classificasse o cheiro de 0
(abominável) a 10 (agradável, inebriante, despertando todos os desejos, mesmo
os mais secretos e inconfessáveis), concluindo-se que...
Este tipo de estudos
(ciência da treta, como muito bem são cada vez mais frequentemente
qualificados) enferma de vários males, designadamente o facto de o uso de
voluntários muito provavelmente recrutar indivíduos que têm um comportamento ou
opções diversas dos da população em geral (por exemplo, em muitas situações são
«exibicionistas» os que se oferecem), e o facto de a dimensão da amostra não
ter sido cientificamente determinada4 para
os fins em vista (e, infeliz mente, nem sempre há fins em vista a orientar um planeamento
experimental, há antes muita ciência da treta que resulta de «andar à pesca» do
que possa parecer interessante). Este tipo de colecções de dados quase nunca
podem ser consideradas representativas e, por isso, não servem para estabelecer
progressos no conhecimento. E, por outro lado, a graduação usando aquela escala
ordinal é muito subjectiva, não tendo cada número o mesmo sentido para todos os
respondentes.
O uso de amostras de
voluntários (amostras de conveniência —que muitas vezes são muito
inconvenientes para a seriedade do estudo que se está a realizar) é comum, mas
tirar dessas colecções de dados (repugna-me chamar-lhes amostras) conclusões para
uma população é ilegítimo.
Só por mera sorte essas
conclusões serão acertadas. Alguns anos atrás, um dos telejornais nacionais noticiou
a introdução de uma cirurgia em Portugal destinada a aumentar, por recolocação,
o «micropénis», causa de infertilidade indesejada em muitos casais. A equipa
médica que tinha introduzido essa técnica cirúrgica afirmava que 18% dos portugueses
(de sexo masculino, suponho, embora isso não estivesse especificado) têm
micropénis — uma estimativa cuja validade parece fortemente contestável, pois
não temos conhecimento de nenhum estudo sério sobre o assunto na população
portuguesa, e aquela percentagem é tanto mais estranha quanto a estimativa internacionalmente
aceite é 0,6%. Provavelmente este erro era muito vantajoso para justificar pedidos
de subsídios, mas era tão grosseiro — percentagem 30 vezes maior do que a
estimada internacionalmente! — que não duvidamos que nenhuma agência de
financiamento se compadeceu dos mais de meio milhão de diminuídos que se
afirmava existirem em Portugal. A estimativa baseou-se decerto numa amostra de
indivíduos observados em consultas de infertilidade, e não numa amostra
aleatória de portugueses adultos, o que leva a que a indução dessa amostra, que
não é representativa, para a população em geral careça de qualquer significado.
E, os leitores que acharam descabido o meu parêntesis acima «(de sexo
masculino, suponho, embora isso não estivesse especificado)» reparem que, se a
amostra fosse contituída por infantes, poderia obter-se aquele número.
É por estas e por
outras que, numa investigação científica séria, se começa por estabelecer, face
ao enunciado dos propósitos, um protocolo pormenorizado do modo como os dados
vão ser recolhidos.
O tamanho do pénis é
uma fonte abundante de estudos tolos. Uma das histórias mais saborosas sobre essa
questão tem que ver com um estudo de antropologia biológica que provava que os
bosquímanes do sul de Angola tinham sido mais bem apetrechados pela natureza do
que os bosquímanes sul africanos. Mas a diferença estimada era tão elevada que
ocasionou dúvidas e, quando a chefe da equipa exibiu a anotação dos dados que
tinha recolhido, um conhecedor da geografia humana de Angola disse estupefacto:
«A colega recolheu uma amostra maior do que a população!»
Quando se foi aclarar o
assunto, percebeu-se que:
• a «amostra» recolhida
era de conveniência, e ainda por cima «comprada», no sentido em que tinham andado
veículos do exército português equipados com autofalantes a berrar pelo deserto
de Moçâmedes que os membros da população que fossem à cidade seriam
recompensados com uma galinha;
• para que a senhora não
entrasse em contacto visual com uma parte tão resguardada da anatomia
masculina, foi decidido que dois pobres magalas estariam de plantão com um
lençol entre a observadora e o que ela ia medir. O modus
faciendi foi: a senhora antropóloga com uma mão segurava essa parte da anatomia,
com a outra o instrumento de medição, e usando o tacto em vez vista lá ia medindo
(os erros de aproximação assim cometidos eram irrelevantes face ao erro sistemático
que adiante se descobre, nesta história tão escondida);
• alguns bosquímanes
tiveram a excelente ideia de ir esconder a galinha e voltar para receber uma
segunda galinha, terceira galinha, etc. Com certeza esse exemplo foi seguido
por todos os que se aperceberam que podiam assim alegremente enriquecer o seu
património. Mas, quando voltavam, já sabiam ao que vinham, e para muitos deles
estas medições ulteriores não eram em repouso. Julgo que me entendem: não era
só o património galináceo que aumentava.
(…)”
Dinis Pestana
Universidade de Lisboa, Departamento de Estatística e Investigação Operacional
CEAUL — Centro de Estatística e Aplicações da Universidade de Lisboa1
2 comentários:
"Altifalantes".
A estatística é o ócio da Matemática. Como o soutien, mostra o relevante mas esconde o essencial. É a "ciência" que destruiu a Ciência. É o terceiro excluído feito senhor todo poderoso, prenhe de "matematicidade". É a sorte e o azar onde devia estar (somente) o Verdadeiro ou o Falso. É a ambivalência dos senhores dos congressos Solvay, transformados em vacas sagradas da "ciência" do incerto, que tanto agrada à política. Bardamerda pois para a estatística.
Enviar um comentário