Acerca de la condición normativa de la teoría de la decisión racional.
Palabras clave:
normatividad, racionalidad, decisiones, utilidad esperada, Prospect Theory (es)PARA UMA DISCUSSÃO DAS POLÍTICAS EDUCATIVAS À LUZ DE RAWLS
Paulo Mourao 1
Pedro Seixas Miranda 2
1 Doctor de la Universidad de Minho, actualmente es professor auxiliar de la Universidad de Minho. Dirección de correspondencia: Dept. Economia Univ. Minho. 4700 Braga. Portugal. Correo electrónico: paulom@eeg.uminho.pt.
2 Estudiante en la Universidade Católica, Braga, Portugal.
Os autores reconhecem o trabalho estimulante deixado por 3 avaliadores anónimos de Cuadernos de Economía sobre uma versão anterior. Limitações remanescentes são de responsabilidade dos autores.
Este artículo fue recibido el 25 de enero de 2012, ajustado el 23 de junio de 2012 y su publicación aprobada el 10 de septiembre de 2012.
Resumo
John Rawls é um autor a redescobrir no âmbito das políticas públicas de educação. Ele fornece-nos uma precompreensão de uma sociedade justa. E é a partir dela que pensamos, também, a Escola, na discussão do bem-estar individual e social; na observação do padrão de desigualdades; no atentar do conjunto institucional envolvente, assim, aqui, se desenha uma função de bem-estar, derivada da conhecida equação de Bergson-Samuelson - susceptível de fornecer mais sólidas/consistentes referências para discutir a Escola.
Palavras-chave: Rawls, política educativa, equação de Bergson-Samuelson.
JEL: I24, B31.
Resumen
John Rawls es un autor que merece ser redescubierto al momento de discutir políticas educativas. Rawls presenta una comprensión de una sociedad justa y desde esta sociedad justa también se discute a la Escuela (como institución). El pensamiento de Rawls es útil para proporcionar una discusión combinada que relaciona el bienestar individual y social, la desigualdad y los ambientes institucionales. Por tanto, se agrega la riqueza rawlsiana en una ecuación Bergson-Samuelson muy conocida, con el fin de desarrollar una herramienta práctica para evaluar políticas educativas.
Palabras clave: Rawls, política educativa, ecuación Bergson-Samuelson.
JEL: I24, B31.
Abstract
John Rawls is an author who deserves to be rediscovered in discussions of educational policy. Rawls provides tools to understand what is meant by a fair society. The article discusses the School (as an institution), arguing that it is far from representing such a society. Rawls' thought is useful as it provides a discussion that links individual and social welfare to inequality levels and institutional contexts. In recognition of this contribution, the authors, insert the richness of a Rawlsian approach into the well-known Bergson-Samuelson equation, in order to develop a practical tool for evaluating educational policies.
Keywords: Rawls, educational policy, Bergson-Samuelson equation.
JEL: I24, B31.
Résumé
John Rawls mérite bien d'être relu au moment de débattre de politiques éducatives. Cet auteur présente une compréhension d'une société juste, et depuis cette société juste l'on discute également de l'École (comme institution). La pensée de Rawls est utile pour favoriser une discussion combinée mettant en relation le bienêtre individuel et social, l'inégalité et les contextes institutionnels. La richesse rawlsienne vient donc s'ajouter à l'équation bien connue de Bergson-Samuelson, afin de mettre au point un instrument pratique d'évaluation des politiques éducatives.
Mots-clés : Rawls, politique éducative, équation Bergson-Samuelson.
JEL: I24, B31.
INTRODUÇÃO
O pensamento contemporâneo sobre políticas educativas precisa de uma revisão.
Em concreto, sentimos que a discussão de políticas educativas revela elementos derivados de visões extremadas (liberais versus marxistas) ou de perspectivas de aplicabilidade dicotomizadas (gestão descentralizada versus gestão estatal).
Como consequência destes antagonismos, os resultados educativos são aferidos por construções (indicadores) que reflectem estas dicotomias. Ou temos indicadores endogeneizados, que olham para os desempenhos de cada unidade dentro do conjunto em hierarquia imediatamente superior (por exemplo, o desempenho do aluno na turma, ou o desempenho da turma na escola), ou então temos indicadores absolutizados que discutem os desempenhos de cada unidade em face de critérios 'universalizados' (como o desempenho do aluno considerando todos os alunos do universo escolar, independentemente dos pontos de partida da aprendizagem, do complexo envolvente sócio-familiar ou do percurso realizado).
Assim, torna-se premente trazer as políticas educativas à discussão. Nesse sentido, este trabalho pretende contribuir para tal debate, nomeadamente, descortinando a importância de John Rawls e das suas propostas no pensamento da reforma escolar, como a significância da desigualdade endógena e como a importância dos padrões institucionais envolventes são questões incontornáveis neste debate sobre o papel da escola e, sobretudo, das escolas nos actuais contextos nacionais e globais.
Assim, este trabalho encontra-se estruturado da seguinte forma: a secção 1 reflecte sobre a base teórica do pensamento actual sobre a Escola, com base na reforma de Rawls; a secção 2 visa desenvolver um instrumento (uma função de bem-estar social) inspirada na revisão rawlsiana, que possibilite desenvolvimentos futuros, nomeadamente, o desenho de indicadores mais consistentes de avaliação de políticas públicas sobre o universo escolar; a secção 3 conclui.
UMA REFLEXÃO DA ESCOLA À PROCURA DE RAWLS
A influência de rawls no pensamento contemporâneo sobre a escola - uma síntese
Imaginemo-nos em eras porvir, situemo-nos em épocas distantes e olhemos para trás. Sentemo-nos. Utilizemos um telescópio. Avaliaremos dali melhor o presente. Um juízo projectadamente ex post, mas feito, deliberadamente, já hoje. Um bom analista (economista, político ou outro cientista social) usará deste raciocínio e verá, na prudência espacial, os efeitos, para as gerações vindouras, das medidas de agora. O conselho é de um filósofo, Schopenhauer, de acordo com Delpech (2007).
De acordo com Bruto da Costa (2008), há um ciclo vicioso associado à pobreza, discutido actualmente em vários espaços europeus, como em Portugal: porque as pessoas são pobres, como têm parcos recursos (económicos, mas também educacionais/culturais familiares), tendem, muitas vezes, a adquirir pouca qualificação (académica); pouco qualificadas, terão empregos com baixos salários e serão pobres. Com baixos salários, os descontos mensais resultam diminutos, o que, dadas as regras vigentes no domínio da Segurança Social, se traduzirá por minguadas pensões. Ou seja, como não raramente acontece, uma pessoa pode manter-se pobre da infância à velhice.
O lugar para cortar esta cadeia é, seguramente, a escola. Bruto da Costa (2008) expõe de modo muito claro como uma visão de combate à pobreza, em países com modelos de Estado-Providência de tipo mediterrânico, assente, exclusivamente, numa abordagem assistencial -a garantia, a todos, do que a sociedade conceba, a cada tempo, como mínimo(s) de dignidade humana- é extremamente redutora. Enquanto cada pessoa, cada cidadão não se autonomizar e alcançar a independência, mesmo que satisfeitas as necessidades normativamente plasmadas como básicas, continuará a ser pobre. A exigência ao Estado, longe de diminuir, propende a densificar-se: facultar aos cidadãos, nomeadamente através do ensino, a possibilidade de aquisição dos conhecimentos/instrumentos/ferramentas necessárias para que a liberdade de um estádio de não pobreza possa emergir, com o devido acesso ao mercado de trabalho. Citando o estudo acima referido (Bruto da Costa, 2008, 187) "o sistema educativo adquire uma importância decisiva que, para ser correspondida terá de assegurar não só o acesso normal das crianças pobres ao sistema escolar, certamente indispensável, mas também as condições de sucesso (que efectivamente se traduza na aquisição de conhecimentos e aptidões) e, ainda, o apoio à família, que permita «libertar» a criança da sua função de contribuir para o rendimento familiar".
Uma meritocracia, baseada numa igualdade de oportunidades que seja manto diáfano que esconda uma desigualdade pré-existente, de modo a apenas, ou sobretudo, recompensar os que "possuem contextos familiares afortunados ou dotes genéticos" seria injusta (como diria Crosland, assim descrito por Plant, 2006, em Espada, Plattner e Wolfson, 2006).
É necessário fazer funcionar, para com os mais desfavorecidos também no domínio da capacidade de aprendizagem, o princípio da compensação (Rawls, 1993), isto é, como em nenhum mérito concorreram aqueles que a natureza dotou de maiores faculdades (e de um contexto pessoal-social propício a desenvolvê-las), levando-os a maiores proventos, sem que o talento, propriedade individual, mas o rendimento/benefício acrescido resultante de uma desigualdade a priori que moralmente não se qualifica como meritória seja taxado e, ainda, na medida em que a prioridade à liberdade implica que tais capacidades (superiores) possam ser expressas sem que necessariamente sejam comercializáveis (Rawls, 2003), tudo resulte em benefício maior, concentrado na escola, dos menos dotados. Mas aqui importa não incorrer numa falácia igualitária: recompensas desiguais são necessárias "para mobilizar o talento, numa sociedade livre que não controle o trabalho" (Rawls, 2003, 110). Há um conjunto de actividades e/ou profissões, cujo esforço, rigor, treino, disciplina, trabalho, dedicação, estudo só serão apetecíveis para um amplo conjunto de cidadãos, caso exista uma boa recompensa. E não há que presumir, desde logo no momento do desenho de uma situação meramente hipotética, uma posição original, espécie de estado natureza onde se definem, através de representantes, as regras (societárias) mais justas, a coberto de um veú da ignorância.
A diferenciação de recompensas é justificada e legítima, mesmo do ponto de vista do princípio da diferença, em que tal desigualdade tem como escopo o benefício dos menos afortunados "os mais bem dotados (…) são estimulados a adquirir benefícios adicionais (…) com a condição de que treinem os seus talentos naturais e os utilizem com o intuito de contribuir para o bem dos menos bem dotados (…) A reciprocidade é uma ideia moral situada entre, por um lado, a imparcialidade, que é altruísta, e a vantagem mútua por outro" (Rawls, 2003, 108).
Quando nos referimos à aquisição de aptidões, ao treino dos talentos - que são, assim, observados, como estando, na pessoa humana, (apenas) em potência, dependendo da vontade e mobilização de cada um a sua concretização, e daí (a existência de) o mérito individual, não podemos deixar de perspectivar a escola como centro das atenções. Hoje, como ontem. Uma escola capaz de puxar para cima os mais desfavorecidos. Com menos estatísticas, menos relatórios burocráticos para fazer, mas com o livro que não queremos que desapareça.
Mas a escola também é nuclear na actualidade global. As teses de Keen (2008) sobre o modo como a Internet está a mudar a cultura e a economia globais podem ser parciais, olhando, unicamente, aos aspectos negativos da rede -e de facto, a crítica é apaixonada e parcial, com o seu quê de miopia para com os benefícios, largos, proporcionados pela net. Mas em boa medida é, igualmente, justa. A combinação da generalização de um conceito televisivo marcadamente tendente à mera satisfação dos gostos mais primários de um público pouco exigente, uma opção discutivelmente democrática- "nada no seio da democracia proíbe as pessoas mais instruídas de comunicarem o seu saber às que o são menos. Pelo contrário, a democracia sempre procurou elevar o nível de educação; é essa a sua aspiração", escreve Popper e Condry (1995): terá transformado o homo sapiens em sub espécie de Homo ludens, o homo videns que não evolui já pelo pensamento abstracto que conceitos como "Estado" ou "Democracia" inculcam, mas se fixa na vertigem do acesso directo a "mesas" e "cadeiras" ou "camas" visíveis (Sartori, 2000).
Desafios difíceis à escola: minada pela "ilusão democrática" (Keen, 2008) de que cada comentário e opinião -ainda que com diferenças abismais de conhecimentos e aptidões pelo meio- valem o mesmo (uma ilusão que, na verdade, a rede potencia); com o ruído do ver a sobrepor-se ao silêncio dos livros; onde o "convocar para o significado" - Steiner (2007), definindo o papel do professor de Humanidades- se torna mais difícil se o pensamento abstracto é desvalorizado, a transcendência uma impossibilidade, o útil, o pragmatismo asséptico o preceito, o único preceito.
Falar de escola é ainda e sempre perguntar o que é o homem (e não, como às vezes parece, para que serve o homem?). E encontrar lugar para as matérias entendidas como fundamentais ao seu desenvolvimento harmonioso. Uma visão global do humano a que os gregos chamavam Paideia. Desde logo, tarefa "para os próximos cinquenta anos", "definir o humano" (Tofler, 2011). Encontrar lugar para a bioética, informada, porventura, como sugere Steiner (2008) com a criação nos currículos escolares de uma "introdução à biologia molecular e à genética".
É importante, nestes termos, recuperar Rawls (2003) e o seu precioso conceito de razão pública como registo processual de organização do fórum público. O que propõe Rawls? Partindo da constatação de uma existência partilhada em que o pluralismo - ideológico, crente, ateu, agnóstico, mundividencial - é factor relevante, sociedades heterogéneas como regra, toda a proposta política jamais poderá ser justificada com base em uma verdade revelada. Sem embargo, e este é o ponto fulcral, "isso não significa, contudo, que doutrinas abrangentes razoáveis não possam ser introduzidas e discutidas na razão pública. Em geral, as pessoas têm a liberdade de fazer" (Rawls, 2003, 127). Sendo tal perfeitamente plausível, aceitável, mas, agindo e explicando tais motivações, "os cidadãos por assim dizer informam os outros de onde vêm, e com que base apoiam a concepção política pública de justiça".
A Escola segundo Rawls enquanto espaço redutor de desigualdades
O pensamento de Rawls sobre a Escola tem tido seguidores. Por exemplo, Esping-Andersen e Palier (2009) é uma obra que reflecte claramente essa influência.
Além dos benefícios do pré-escolar - que a investigação amplamente demonstra; há, em Aghion e Roullet (2012) uma crítica que se debruça sobre os métodos pedagógicos, dividindo-os em verticais -quando o professor dá aulas a alunos com fracos níveis de rendimento, que tiram apontamentos e têm de trabalhar sozinhos com os seus manuais-e horizontais- quando o professor pede aos alunos para trabalharem em grupo, para participarem em jogos, discussões, animações ou em qualquer outro projecto. Por países, vemos que a França tem um ensino mais vertical, enquanto os países nórdicos aplicam métodos mais horizontais. Duas conclusões, de sentido diverso, aqui a tirar:
1) A Suécia é um bom exemplo dos limites da generalização dos métodos «horizontais». Nos anos 1990, chegou-se a um consenso quanto à reforma do sistema educativo, centrando-o essencialmente na criatividade dos alunos. Todavia, ao contrário de todas as expectativas, esta mudança contribuiu, no fundo, para cavar o fosso entre as classes sociais. Os alunos de estratos sociais mais elevados, que podiam ser ajudados pelos pais (nos trabalhos de grupo ou em outros projectos), obtinham bons resultados, ao passo que os alunos filhos de emigrantes ou oriundos de estratos sociais mais desfavorecidos ficavam para trás. Parece, pois, que é necessário voltarmo-nos para uma mescla das denominadas práticas «horizontais» e «verticais».
2) O estudo mostra igualmente os efeitos a longo prazo dos métodos pedagógicos sobre os valores preponderantes na sociedade, nas instituições, no mercado de trabalho e na organização empresarial. Assim, os países que fomentam um ensino horizontal caracterizam-se, regra geral, por um nível de confiança mais elevado, um maior civismo e, inclusivamente, um melhor governo do que os países onde o ensino é mais vertical. Uma pedagogia mais horizontal está também associada a empresas organizadas mais «horizontalmente», isto é, de forma mais descentralizada, no sentido de a autoridade ser delegada mais facilmente e de existir uma maior entreajuda nas relações laborais
Uma das questões que sempre se colocaram ao debate político foi saber se a igualdade de oportunidades bastava, ou se seria necessária uma igualdade de resultados, como referido em Esping-Andersen e Palier (2009). Por mais que os esforços no sentido de promover importantes reformas no ensino fossem adiante, contudo, excepção feita aos países nórdicos, a repetição social, nos resultados escolares e, consequentemente, no tipo de empregabilidade e massa salarial, mostrou-se demasiado resiliente às mudanças. Aqueles a quem a lotaria natural havia proporcionado melhores condições de partida, estando depois em compita num plano aberto de igualdade de oportunidades na escola, viram, nos países europeus, largamente confirmada essa vantagem inicial. É, hoje, claro como os anos iniciais de cada pessoa, na aquisição de capacidades cognitivas e não cognitivas, pode ser tão determinante para um trajecto futuro. O investimento das políticas públicas centradas nas crianças entre o seu nascimento e os 6 anos tem um grau de reprodutividade -digamos, é um investimento tão seguro, multiplicado, aliás, nos casos de crianças oriundas de meios desfavorecidos-, que desde há vários anos, em diferentes estados europeus, o financiamento, por exemplo, de creches é entendido como uma boa despesa. Acontece que tal se verifica, com real apoio público, a partir dos três anos. E, no entanto, quer ao nível da aquisição de competências cognitivas - de estímulos vários, como por exemplo a leitura, mas não só -, como de competências não cognitivas -modos de comportamento, por exemplo- esses anos são, igualmente, fulcrais. Quem se preocupa com as questões da pobreza e atenuação de desigualdades não pode ignorar esta questão. Pensá-la quanto a um efectivo investimento que atenue gastos futuros, que incluem, por exemplo, a criminalidade juvenil. Para um gasto de 0,4% do PIB, com despesa nesta área, há um ganho de 4% na riqueza, avançam diferentes estudos norte-americanos e dinamarqueses, de que fala Esping-Anderson e Palier (2009), um dos maiores especialistas no Estado Providência, em Três Lições sobre o Estado Providência. No acesso a creches, o rendimento familiar a elas destinado é de 25% na França e 10% na Dinamarca. E em Portugal? Por outro lado, um financiamento universal de creches -e de creches com grande qualidade- poderia implicar já gastos na ordem dos 4 e 5 % do PIB, o que seria tremendo, e, por outro lado, desnecessário, na medida em que há famílias que as podem pagar sem dificuldade. Contudo, Esping-Andersen e Palier (2009) convida-nos a reflectir quanto a esta ideia: por um lado, porque tal gasto exigiria consenso social e, portanto, todos necessitariam de o consentir; por outro lado, porque as crianças mais desfavorecidas conseguem um salto de aprendizagens múltiplas ao lado dos que foram beneficiados com um leque de opções formativas maiores à partida. Mesmo que muitos considerem, e bem, que a ida, logo no primeiro ano de vida, de uma criança, para uma creche possa ser, para esta, prejudicial -a sua, ainda escassa, imunidade a todo o tipo de, digamos, viroses, ou o facto de porventura não se poder fixar tanto num único elemento de absoluta confiança, para lá dos pais, com passagens por diferentes educadores, em vez da tradicional avó-, a verdade é que numa creche de grande qualidade, que permite, nomeadamente, à mãe trabalhar, com os ganhos futuros para toda a família, criança incluída, e para a própria mulher no seio familiar -, essas desvantagens podem ser, claramente, menos evidentes quando comparadas com os benefícios trazidos. Na Dinamarca, por exemplo, onde já há várias décadas, estas políticas estão em cima da mesa, a exigência de boas creches é um facto e uma certa homogeneidade educativa -no pólo oposto, os EUA- uma realidade. Esta homogeneidade educativa é um elemento normalmente negligenciado na abordagem do problema: as transferências ou redistribuição são, geralmente, aceitas por um vasto consenso político, mas não se coloca, depois, a questão cultural. Ou seja, até podemos ter executivos com um grande rendimento que não gastam nem tanto tempo de tão boa qualidade como o que pais que são, por exemplo, professores (ou profissionais de outros ramos) que até ganham menos, mas que lêem para e com os filhos-crianças. E para lá das questões da pobreza e rendimento familiar, este factor cultural é determinante (p.ex., o número de livros em casa). De resto, gostaríamos aqui de citar um estudo (V.a., 2011) muito recente de Mark Taylor, da Universidade de Oxford, que ouviu 17200 pessoas, chegando à conclusão que o factor que de forma mais consistente esteve associado à ascenção social foi a leitura. Nenhuma outra actividade -cinema, desporto, visitas a museus ou galerias- teve um impacto relevante. O conhecimento de maior vocabulário e de conceitos abstractos a ser decisivo.
Em Portugal, uma percentagem significativa de mulheres trabalha; isso não sucede em outros países, o que faz com que, nestes, um divórcio, com a criança a ficar entregue à mãe, possa colocar ambas em grandes dificuldades.
Em síntese, igualdade efectiva de oportunidades, passaria, para Esping-Andersen e Palier (2009), numa grande aposta nas creches e jardins de infância. O investimento seria grande, mas ganho: nos primeiros anos de vida, multiplicado de sobremaneira, principalmente entre os mais desfavorecidos. Antes mesmo de qualquer descriminação positiva para estes, o princípio da universalidade garantir-lhes-ia consenso social e qualidade de estruturas (de estímulos e afectos). Diminuiria a delinquência juvenil, jovens mais capazes fariam parte de uma sociedade do conhecimento assente em grandes capacidades cognitivas e não cognitivas. Estes jovens seriam determinantes para assegurar a continuidade do Estado-Providência - que longe da ineficiência, daria, assim, lugar a jovens com formação, saudáveis, produtivos e com uma rede de segurança que, precisamente, os tornaria mais aptos à mudança, todo o contrário do conservadorismo triunfante. O retorno deste investimento seria, pois, tanto individual como colectivo. Num tempo em que as declarações nacionalistas e xenófobas voltam à luz do dia, Esping-Andersen e Palier (2009) deixa-nos, ainda, esta ideia a guardar: a ideia de superioridade genética de uma nação sobre outra é indefensável. É preciso atribuir a factores institucionais as enormes diferenças entre países em matéria de abandono escolar e de dispersão de capacidades cognitivas.
No entanto, observe-se o registo de sentido contrário de autores como Judt (2011).
Tony Judt não alinha no nivelamento por baixo na educação -como espécie, o êxito plasmado em diplomas, de direito natural à felicidade- e, de resto, liga-o a um aumento das desigualdades sociais e a um fosso verdadeiramente elitista. Novamente, acordo completo -no que a uma escala que transcende certamente o Reino Unido diz respeito- quando escreve: 'Durante 40 anos, o ensino britânico tem sido sujeito a uma sequência catastrófica de «reformas» que visam restringir o seu legado elitista e institucionalizar a «igualdade». Observe-se a seguinte transcrição (Judt, 2011, 145-147): "Hoje em dia, quando o governo britânico estipula que 50 por cento dos alunos que concluem o liceu devem ir para a faculdade, o fosso que separa a qualidade da educação da minoria que frequenta o ensino particular do restante é maior do que em qualquer outra altura desde a década de 40 (…) Entretanto, agora temos no governo britânico mais formados por escolas particulares do que nas últimas décadas (17, pelas minhas contas) -e o primeiro antigo aluno de Eton a ser primeiro-ministro desde 1964. Talvez devêssemos ficar pela meritocracia (…) As universidades são elitistas: o seu propósito é selecionar o grupo mais capaz de uma geração e educá-lo o melhor que sabe- aumentando a elite e renovando-a, constantemente. Igualdade de oportunidades e igualdade de resultados não são a mesma coisa. Uma sociedade dividida pela riqueza e pela herança não pode combater esta injustiça disfarçando-a em instituições de ensino -negando a distinção de capacidades ou restringindo a oportunidade seletiva- ao mesmo tempo que favorece um fosso de rendimento que, lenta e gradualmente, se vai cavando, em nome do mercado livre. Isto é mera falácia e hipocrisia. Na minha geração, considerávamo-nos simultaneamente radicais e membros de uma elite. Se isto parece incoerente, é a incoerência de um certo legado liberal que nós intuitivamente absorvemos nos nossos anos de faculdade. É a incoerência do aristocrata Keynes a criar o Royal Ballet e o Arts Council para benefício de todos, mas certificando-se de que era gerido por peritos. É a incoerência da meritocracia: dar a todos uma hipótese e depois premiar o talento. Era a incoerência do meu King's e tive a sorte de a viver'".
Finalmente, autores como Sen (2003), Dornelas, Oliveira, Veloso e Guerreiro (2010) ou Aguiar e Silva (2010) não escondem, no seu pensamento sobre o sistema escolar, a influência de Rawls.
Sen (2003) evidencia especificamente a conexão empírica entre a literacia feminina e a promoção de bem-estar social, mais concretamente, no aumento das taxas de sobrevivência infantil feminina nos países em que vigora a tradição da "preferência masculina" no seio familiar. Dornelas et al. (2010) alertam que, contrariando a sua vocação primária de veículo de promoção da igualdade de oportunidades, a escola pública comporta dinâmicas invisíveis de exclusão social, redundando no reforço das posições desfavorecidas de certos segmentos da população na sociedade portuguesa. Tal constatação é tanto mais grave quanto mais se acumula evidência de que melhores qualificações escolares e profissionais constituem um instrumento essencial de combate à exclusão social, já que permitem o acesso a mais oportunidades de emprego, como também a aquisição de recursos culturais e cognitivos essenciais à leitura da realidade em mudança. De entre as referidas dinâmicas, os autores salientam três: 1) os processos socialmente seletivos de admissão dos alunos nas escolas públicas; 2) os processos socialmente seletivos de distribuição de alunos por turmas; e 3) os modos de relação entre os professores e pais e Educadores de Educação. Estas dinâmicas evidenciam o papel da escola na manutenção e reprodução de desigualdades sociais e, paralelamente, a segregação de que são alvo os alunos oriundos de famílias desfavorecidas. Por sua vez, Aguiar e Silva (2010), mostra como a formação e o desenvolvimento da sensibilidade e do gosto estéticos não são um luxo, um privilégio ou um adorno supérfluos, aristocráticos ou burgueses, pois que constituem uma dimensão primordial e constante, antropológica e socialmente, do homem. A escola de massas, que acolhe nos nossos dias crianças e jovens de múltiplos estratos sociais, alguns deles culturalmente muito desfavorecidos, deve desempenhar também neste domínio um papel emancipatório, proporcionando a todos, a partir das suas diversidades culturais de origem e sem as humilhar ou rasurar, o acesso a um capital simbólico que transcende as clivagens das classes e dos grupos sociais. Os autores clássicos não pertencem, enquanto tais, a nenhuma classe social.
Síntese
Em síntese desta secção, podemos sublinhar que o pensamento de John Rawls é relevante para uma discussão actual das políticas educativas. Nomeadamente, o pensamento de John Rawls recorda-nos que:
1) Os resultados da acção política são uma função agregada do bem-estar de todos os indivíduos de uma sociedade;
2) Mas também que estes resultados da acção política são derivados do padrão/nível de desigualdade observada na sociedade, predominantemente numa função negativa (i. e., tendencialmente, um aumento da desigualdade, querseja sócio-económica, quer seja na detenção de direitos constitucionais, produz uma deterioração dos resultados finais);
3) E, finalmente, estes resultados da acção política são, incontornavelmente, influenciados pelo envolvimento institucional (considerando aqui o conceito institucional na abrangência sugerida por Mourão, 2007, isto é, compreende-se como 'instituição', todo o padrão de comportamento individual e social presente numa sociedade).
Nesta sequência, importa caminhar para o desenho de instrumentos de avaliação de políticas públicas que ultrapassem algumas limitações da generalidade dos instrumentos correntes. Assim, importa caminhar para o desenho de instrumentos de avaliação de políticas públicas que considerem este "triângulo" rawlsiano, composto por:
1) agregação dos níveis de bem-estar de todos e de cada um dos indivíduos;
2) observação do padrão de desigualdade endógeno à sociedade;
3) e consideração do complexo institucional envolvente.
A próxima secção discute uma sugestão de um instrumento (um modelo teórico) relevante para a avaliação de políticas públicas sob uma leitura rawlsiana.
UM MODELO TEÓRICO
A base para este modelo teórico foi inspirada em Mourão (2012). Desigualdade económica, crescimento económico e bem-estar social têm sido temas de debate intenso na literatura (Alesina e Rodrik, 1994; Bertola, 2000; Kuznets, 1955; Persson e Tabellini, 1994; Williamson, 1965). Desde os primeiros estudos que os investigadores têm tentado desenvolver modelos e encontrar resultados no modo como o padrão de desigualdade económica afecta o próprio crescimento económico e o bem-estar (ou como este sentido pode ser reverso3).
Através de uma breve revisão de literatura, observa-se que esta discussão começou com a colocação do foco dos modelos no comportamento dos indivíduos (Drazen, 2000). Outros estudos pioneiros incluem os modelos de Romer (1975), Roberts (1977) e Meltzer e Richard (1981)4. Estes modelos discutem como os sistemas de votação interferem com a definição das taxas de imposto sobre o rendimento e com a definição das transferências em favor dos indivíduos beneficiários. Cox e McCubbins (1986) desenvolveram uma análise que pretendia testar determinantes destas transferências redistributivas. Lindbeck e Weibull (1987) e Dixit e Londregan (1996) aperfeiçoaram os primeiros modelos através da extensão da discussão considerando diferentes preferências políticas por parte dos eleitores e diferentes preferências acerca da combinação de interesses públicos com interesses particulares.
Outro grupo de modelos considera especificamente políticas redistributivas em espaços descentralizados, políticas assumidas por um governo federal ou por um governo central. Este caso é referente aos designados modelos 'pork barrel', ou, em Português, modelos de nepotismo. Alguns dos modelos de nepotismo são os desenvolvidos por Safire (1978) ou Weingast, Shepsle e Johnsen (1981).
No entanto, todos estes modelos (quer focados nos indivíduos quer focados nos espaços) tendem a convergir para soluções de optimização que relacionam a evolução do rendimento com a evolução da distribuição do rendimento. Assim, de modo a definir esta função, usamos a função de bem-estar social de Bergson-Samuelson como um argumento sintético (Myles, 2002, 56-57).
Neste caso, a função de bem-estar W segue a equação 1.
[1] |
onde
g(.) é uma função homogénea de grau 1, , e
W significa que a função de bem-estar social depende da ponderação dos níveis de utilidade manifestados por H indivíduos, assim como depende da forma funcional do termo de desigualdade, g(.).
Afonso (2012) é um trabalho que discute o sentido de justiça em educação na obra de Rawls. Citando o próprio Rawls (1993, 95) alude que o papel da educação é o de promover "eficiência económica ou [de] bem-estar social".
Assim, uma derivação muito comum (Mourão, 2012) da equação 1 resulta na seguinte função de bem-estar social de inspiração rawlsiana (Rawls, 1993):
Neste caso, de uma função de bem-estar rawlsiana (função Max-min), se , então W é utilitarista (maximizada quando o nível médio das utilidades individuais é por sua vez maximizado); se g = 1, então W é tipicamente rawlsiana (maximizada quando o nível de desigualdade entre os indivíduos é minimizado).
A função de bem-estar de Bergson-Samuelson é uma função recorrente no teste em como o padrão de desigualdade entre os indivíduos afecta o nível de bem-estar agregado. Alguns autores (Mandal, 2009; Sen, 1973) reviram a natureza de W e de e identificaram estes elementos com recursos económicos (como valores de despesa efectiva ou de rendimento), assumindo a existência de uma correlação positiva entre bem-estar e rendimento.
Para os indivíduos educandos, vamos também seguir os trabalhos anteriores, e usar a função de bem-estar de Bergson-Samuelson como o nosso modelo teórico. Assumimos que os educandos podem ser considerados como unidades individuais cuja maximização de utilidade é importante para o Governo (ou para a Tutela). Adicionalmente, para propósitos de simplificação, assumimos que, maximizando a utilidade conjunta dos indivíduos educandos, o Governo maximiza a sua própria utilidade. Pretende-se, assim, testar o modo como o padrão de desigualdade no desempenho escolar dos educandos (i.e., o nosso g(.) medido por indicadores de desigualdade) influencia W, o total de bem-estar social que o Governo vai receber como resultado.
Sabemos que redistribuições de competências nunca são igualitárias (Hayek, 1944; Meltzer e Richard, 1981; Weingast et al., 1981). Muitas são as explicações teóricas para este facto, algumas propostas recentemente (Frieden, 2001; Neckerman e Torche, 2007). Apesar de Afonso (2012) reconhecer que o primeiro princípio de distribuição de Rawls é o de igual liberdade "Cada pessoa deve ter um direito igual ao mais amplo sistema total de liberdades básicas que seja compatível com um sistema semelhante de liberdades para todos (Rawls, 1993, 239)", na verdade outras razões impelem à diferenciação.
Uma dessas razões é a 'incerteza' (Mourão, 2012). Por exemplo, poderíamos adoptar uma perspectiva naïf (Buchanan, 1967) e assumir que o Governo estaria interessado (intrinsecamente) em maximizar o bem-estar final depois da redistribuição (W, na equação 1). No entanto, para este propósito, os decisores públicos encontram-se incertos face às respostas para as seguintes perguntas:
1) Onde se devem colocar as transferências discricionárias nos apoios escolares - nos Educandos com notas mais altas ou nos Educandos menos qualificados?
2) Que problemática deve ser atendida em primeiro lugar - combater as ameaças ao crescimento de competências escolares e científicas ou reduzir a desigualdade entre os educandos?
3) Que tipo de critérios redistributivos devem ser adoptados de modo a maximizar o bem-estar social - critérios utilitaristas, Rawlsianos ou de Nozick (Mourão, 2006)?
Devido a este género de incertezas e devido a falhas de informação relativamente aos comportamentos dos educandos, os decisores públicos optam por políticas educativas diferenciadas (realizando programas curriculares diferentes em função dos alunos, das realidades escolares e das expectativas). De modo a atingir-se o que Rawls (1993, 239) identificava como uma "igualdade equitativa de oportunidades", a diferenciação impõe-se na medida em que Rawls (1993, 95) reconhece "é justificado que se consagrem maiores recursos à educação das pessoas menos inteligentes do que àquelas que o são mais, pelo menos num certo período da sua vida, como é o caso dos primeiros anos de escolaridade".
No entanto, a legislação enquadradora coloca alguma rigidez neste processo de redistribuição. As versões mais recentes da legislação relativa a políticas escolares nos vários países usam um conjunto explícito de variáveis sócio-económicas para justificar a distribuição de transferências diferenciadas. Devido a esta distribuição desigual das variáveis explicativas observadas pelas unidades beneficiárias (por exemplo, capacidade de colecta fiscal e número de matrículas, no caso dos Estados brasileiros), a distribuição resultante das transferências é também ela uma distribuição desigual.
Assim, a nossa equação 1 é transformada na seguinte equação 2.
[2] |
De acordo com a equação 2, o montante final de transferências em favor dos educandos de um dado país (W) é uma função de utilidade agregada, u(.), da medida de desigualdade [(g.)], do conjunto de variáveis descritas constitucionalmente (X), e do conjunto de variáveis sócio-económicas que também exercem influência sobre W (nomeadamente, variáveis associadas à situação do défice público ou do crescimento económico verificado).
Como linhas finais desta secção, podemos reconhecer que procuramos concretizar um instrumento de avaliação de políticas públicas educativas, a partir da discussão teórica presente na secção 'Uma reflexão da escola à procura de Rawls'.
Assim, esta secção convergiu para o desenvolvimento da equação 2 que se torna relevante em três dimensões prioritárias. Em primeiro lugar, a equação 2 é relevante para a discussão de modelos académicos correlacionado com a avaliação social de políticas públicas. Em segundo lugar, a mesma equação permite o desenho de instrumentos derivados com direcção final na avaliação e estimação empírica (por exemplo, usando dados em séries temporais ou dados em painel). Finalmente, a nossa equação 2 assume-se como um instrumento claro que pode sugerir as principais dimensões para a avaliação prática dos resultados das políticas públicas.
Na sequência do disposto, esta equação sintetiza a anterior discussão inspirada em Rawls e que demonstra como, na avaliação das políticas públicas educativas, deve imperar a avaliação das três dimensões intrínsecas: o bem-estar de cada indivíduo beneficiário e do conjunto de indivíduos (sociedade intervencionada), o nível de desigualdade endógeno desta sociedade e, finalmente, o funcionamento institucional.
CONCLUSÃO
Este trabalho trouxe à discussão dos resultados de políticas públicas no campo da Educação o pensamento de John Rawls.
A importância da observação de cada indivíduo, mas simultaneamente do conjunto dos indivíduos, a par dos elementos primordiais como o 'véu de ignorância' na redacção dos direitos constitucionais e o desenho de políticas Max-min foram aqui importados numa discussão que reviu a influência de Rawls no pensamento actual.
Na secção 'Uma reflexão da escola à procura de Rawls', essa discussão centrou-se no levantamento de como a influência de Rawls se faz sentir na leitura que vários autores contemporâneos realizam sobre o papel actual das escolas e da Escola (enquanto instituição). Reconheceu-se que o pensamento rawlsiano obriga a uma reflexão conjunta de um conjunto tridimensional:
1) a aferição do bem-estar dos indivíduos e do bem-estar social;
2) o padrão de desigualdade endógeno;
3) e o conjunto de instituições envolventes.
Na secção 'Um modelo teórico', este resultado tridimensional da síntese do pensamento rawlsiano, possibilitou o desenvolvimento de uma equação (derivada da conhecida equação de Bergson-Samuelson) destinada a informar todo o processo de avaliação de políticas públicas educativas. Foi assim atingida uma equação que se destina a reformar as concepções enviesadas de instrumentos aferidores dos resultados educativos e que reúne a riqueza conceptual do pensamento rawlsiano.
Com este trabalho, os autores esperam não só a recuperação da discussão do pensamento rawlsiano sobre os processos de avaliação de políticas públicas educativas, mas também o desenho de caminhos futuros de investigação. Estes caminhos passam pela estimação da equação 2 deste trabalho usando dados próprios de avaliação de políticas educativas, recolhidos para diversos países e para vários períodos, assim como a exploração da causalidade associada nos parâmetros envolvidos.
NOTAS DE RODAPÉ
3 Alguns autores estudaram, particularmente, a direcção contrária (a direcção associada ao modo como o crescimento económico afecta a desigualdade económica). Três estudos pioneiros são os assinados por Lewis (1955), Kuznets (1955) e Williamson (1965). Os dois últimos sugerem uma curva em U invertido para descrever o modo como o crescimento económico leva a uma crescente desigualdade económica nos estádios iniciais de desenvolvimento e a uma diminuição da desigualdade nos estádios posteriores. Outros estudos influentes são os assinados por Atkinson (1997) ou Aghion e Bolton (1997).
4 Nos primeiros anos, encontramos ainda as referências dos trabalhos de Lowi (1964) ou de Wilson (1989) para uma discussão detalhada da terminologia envolvente de 'políticas redistributivas' ou de 'transferências redistributivas'.
REFERÊNCIAS
[1] Afonso, M. (2012). Justiça em educação. Um contributo a partir de Rawls. Brotéria - Cristianismo e Cultura, 175, 33-44.
[2] Aghion, P., & Bolton, P. (1997). Theory of trickle-down growth e development. Review of Economic Studies, 64, 151-172.
[3] Aghion, P., & Roulet, A. (2012). Repensar o Estado - por uma social-democracia da inovação. Lisboa: Temas e Debates.
[4] Aguiar e Silva, V. (2010). As humanidades, os estudos culturais, o ensino da literatura e a política da língua portuguesa. Coimbra: Almedina.
[5] Alesina, A., & Rodrik, D. (1994). Distributive politics e economic growth. Quarterly Journal of Economics, 109, 465-490.
[6] Atkinson, A. B. (1997). Bringing income distribution in from the cold. Economic Journal, 107, 297-321.
[7] Bertola, G. (2000). Macroeconomics of distribution e growth. In A. B. Atkinson & F. Bourguignon (Eds.), Handbook of Income Distribution (edition 1, volume 1, chapter 9, pp. 477-540). Amsterdam: Elsevier.
[8] Bruto da Costa, A. B. (2008). Um olhar sobre a pobreza - vulnerabilidade e exclusão social no Portugal contemporâneo. Lisboa: Gradiva.
[9] Buchanan, J. (1967). Public finance in democratic process: Fiscal institutions e individual choice. Chapel Hill: The University of North Carolina Press.
[10] Cox, G., & McCubbins, M. (1986). Electoral politics as a redistributive game. Journal of Politics, 48, 370-389
[11] Delpech, T. (2007). O regresso da barbárie. Vila do Conde: Quidnovi.
[12] Dixit, A., & Londregan, J. (1996). The determinants of success of special interests in redistributive politics. Journal of Politics, 58, 1132-1155.
[13] Dornelas, A., Oliveira, L., Veloso, L, & Guerreiro, M. (2010). Portugal invisível. Lisboa: Mundos Sociais.
[14] Drazen, A. (2000). Political economy in macroeconomics. New Jersey: Princeton University Press.
[15] Espada, J. C., Plattner, M. F., & Wolfson, A. (2006). Direita e esquerda? Divisões ideológicas no séc. XXI. Lisboa: Universidade Católica.
[16] Esping-Andersen, G., & Palier, B. (2009). Três lições sobre o Estado-Providência. Lisboa: Campo da Comunicação.
[17] Frieden, J. (2001). Inequality, causes e possible futures. International Social Science Review, 2(1), 33-40.
[18] Hayek, F. (1944). The rode to serfdom. Chicago: University of Chicago Press.
[19] Judt,T. (2011). O chalet da memória. Lisboa: Edições 70.
[20] Keen, A. (2008). O culto do amadorismo. Lisboa: Guerra e Paz.
[21] Kuznets, S. (1955). Economic growth e income inequality. American Economic Review, 45, 1-28.
[22] Lewis, W. A. (1955). The theory of economic growth (9th impression). Great Britain: George Allen & Unwin Ltd., edition used Unwin University Books.
[23] Lindbeck, A., & Weibull, J. (1987). Balanced budget redistribution as the outcome of political competition. Public Choice, 52, 272-297.
[24] Lowi, T. (1964). American business, public policy, case studies, e political theory. World Politics, 16, 677-715.
[25] Mandal, B. (2009). Global encyclopaedia of welfare economics. Delhi: Global Vision Publishing.
[26] Meltzer, A., & Richard, S. (1981). A rational theory of the size of government. Journal of Political Economy, 89, 914-927.
[27] Mourão, P. (2006). Que critérios redistributivos na lei das finanças locais? Redes, 11(1), 163-185.
[28] Mourão, P. (2012). How the cake is distributed. The case of Portuguese decentralized grants. Environment and Planning, A 44(2), 477-490.
[29] Mourão, P. (2007). El institucionalismo norteamericano-orígenes y presente. Revista de Economía Institucional, 9(16), 315-325.
[30] Myles, G. (2002). Public economics. Cambridge: Cambridge University Press.
[31] Neckerman, K., & Torche, F. (2007). Inequality: Causes e consequences. Annual Review of Sociology, 33, 335-357.
[32]. Persson, T., & Tabellini, G. (1994). Is inequality harmful for growth? American Economic Review, 84, 600-621.
[33] Plant, R. (2006). Entrevista in Espada. Plattner, J. C., & Wolfson, M. F. (2006). Direita e esquerda? Divisões ideológicas no século XXI. Lisboa: Universidade Católica.
[34] Popper, K., & Condry, J. (1995). Televisão - um perigo para a democracia. Lisboa: Gradiva.
[35] Rawls, J. (1993). Uma teoria da justiça. Lisboa: Presença.
[36] Rawls, J. (2003). A justiça como equidade. São Paulo: Martins Fontes.
[37] Roberts, K. (1977). Voting over income tax schedules. Journal of Public Economics, 8, 329-340.
[38] Romer, T. (1975). Individual welfare, majority voting, e the properties of a linear income tax. Journal of Public Economics, 4, 163-185.
[39] Safire, W. (1978). Safire's Political Dictionay. New York: Random House.
[40] Sartori, G. (2000). Homo videns - televisão e pós-pensamento. Lisboa: Terramar.
[41] Sen, A. (1973). On economic inequality. New York: Norton.
[42] Sen, A. (2003). O desenvolvimento como liberdade. Lisboa: Gradiva.
[43] Steiner, G. (2007). O silêncio dos livros. Lisboa: Gradiva.
[44] Steiner, G. (2008). Os livros que não escrevi. Lisboa: Gradiva.
[45] Tofler, A. (2011). http://www.youtube.com/watch?v=UK09hlZRNGM, consultado a 15 de Maio de 2011.
[46] V.a. (2011). Por que ler ainda é decisivo.Veja, 2217, Maio de 2011.
[47] Veiga, L.,& Veiga, F. (2010). Intergovernmental fiscal transfers as pork barrel (Working Paper 7/2010). NIPE, Universidade do Minho.
[48] Weingast, B., Shepsle, K., & Johnsen, C. (1981). The political economy of benefits e costs: A neoclassical approach to distributive politics. Journal of Political Economy, 89, 642-664.
[49] Williamson, J. G. (1965). Regional inequality e the process of national development a description of the patterns. Economic Development e Cultural Change, 13, 3-45.
[50] Wilson, J. (1989). American government. Lexington, D.C.: Heath e Company.
ACERCA DE LA CONDICIÓN NORMATIVA DE LA TEORÍA DE LA DECISIÓN RACIONAL
We hardly use the word ought in a metaphorical sense.
Charles Darwin, The Descent of Man (1874)
Giancarlo Romano G.1
1 Economista Universidad Nacional de Colombia. Estudiante de la Maestría en Filosofía de la Universidad Nacional de Colombia. Profesor becario, Facultad de Ciencias Económicas de la misma universidad. Miembro de los grupos de investigación Gitiace y GEAM. Correo electrónico gromanog@unal.edu.co. Dirección de correspondencia: carrera 30 No. 45-03, Universidad Nacional de Colombia, edificio 311, oficina 403 (Bogotá, Colombia).
Este artículo fue recibido el 14 de febrero de 2012, ajustado el 2 de julio de 2012 y su publicación aprobada el 28 de agosto de 2012.
Resumen
En este artículo se examina la condición normativa de la teoría de la decisión racional (TDR) en cuanto guía, marco analítico —para la evaluación normativa— y teoría —para la explicación/predicción— de la acción; además, se explica cuál es su justificación conceptual y preceptiva a través del concepto de racionalidad instrumental. Se controvierte la afirmación con la cual la Prospect Theory, de Kahneman & Tversky, pone en riesgo la condición normativa de la TDR, y se discuten algunas afirmaciones frecuentes y equivocadas acerca de su alcance teórico y su aplicación.
Palabras clave: normatividad, racionalidad, decisiones, utilidad esperada, Prospect Theory.
JEL: D03, D81.
Abstract
The article examines the normative condition of Rational Decision Theory (RDT) as a tool to guide the action, analytical framework for normative assessment of action and theory for the explanation/prediction of the action and give account of their conceptual and prescriptive justification by means of instrumental rationality. The paper argues against the claim according to which the Kahneman and Tversky's Prospect Theory threatens the normative status of the RDT. The article also discusses some common and mistaken claims about the proper theoretical scope and application of the RDT.
Keywords: Normativity, rationality, choice, expected utility, prospect theory.
JEL: D03, D81.
Résumé
Dans cet article on examine le caractère normatif de la théorie de la décision rationnelle [TDR] en tant que guide, cadre analytique –pour l'évaluation normative- et théorie –pour l'explication/prédiction- de l'action. Ensuite, on explique quelle est sa justification conceptuelle et préceptive à travers le concept de rationalité instrumentale. On contredit l'affirmation d'arpès laquelle la théorie Prospective [Prospect Theory] de Kahneman & Tversky met en péril la condition normative de la TDR, et on discute diverses affirmations fréquentes et erronées concernant sa portée théorique et son application.
Mots-clés: normativité, rationalité, décisions, gain espéré, Prospect Theory.
JEL: D03, D81.
INTRODUCCIÓN
En la vida cotidiana estamos habituados a los dictados normativos al realizar cualquier acción. Cuando jugamos ajedrez o póker seguimos las reglas de esos juegos, no de otra forma podríamos decir que los jugamos. El uso apropiado del lenguaje está regulado por normas formal o informalmente sancionadas. Al conducir por las calles de la ciudad nos acogemos a las leyes de tránsito y sabemos que seremos sancionados si las infringimos. De la misma manera, cuando tomamos decisiones acerca de qué elegir o qué curso de acción seguir, están presentes consideraciones normativas, tanto en la elaboración o en la formación misma de las decisiones como en su ejecución y en el contexto en el que se llevan a cabo.
Las consideraciones normativas son de especial importancia para entender las decisiones y las acciones de agentes a partir de la teoría de la decisión racional (TDR), en particular las relativas a su racionalidad, que son centrales para la comprensión cabal de la teoría y su apropiada aplicación. Sin embargo, el pensamiento y el lenguaje normativos con frecuencia tienen apariencia de ser descriptivos, lo que suele ocasionar confusiones y malentendidos que se expresan en críticas o defensas a la teoría, que no están soportadas en lo que la teoría puede legítimamente decir. Por ejemplo, Santiago & Cante (2009) (en adelante S & C) hacen una descripción y una crítica de la TDR en la que se evidencia el desconocimiento de la teoría y su estructura analítica; además, afirman que la Prospect Theory (PT) cuestiona el status normativo de la TDR sin mostrar en qué consiste tal estatus y cómo es que la PT lo cuestiona. En el caso de la TDR, tales equivocaciones se agravan cuando se confunden tres aspectos de la teoría que, si bien están estrechamente relacionados, son distintos: como guía, marco analítico -para la evaluación normativa- y teoría -para la explicación/predicción- de la acción 2. Dadas estas confusiones y la frecuencia con que se presentan, el presente trabajo tiene el propósito de formular qué es lo que se entiende por condición o estatus normativo de la TDR y su importancia para su adecuada comprensión. Además, se discute si dicho estatus es puesto o no en cuestión por la PT, como algunos analistas sostienen.
El artículo consta de cuatro partes adicionales a esta introducción. En la segunda se exponen los fundamentos de la TDR y el modelo de Utilidad Esperada (UE) siguiendo a Savage (1972), y se establece el estatus normativo de la TDR atendiendo a la distinción de los dominios explicativo/predictivo, normativo/evaluativo y prescriptivo de la teoría, teniendo presente el papel que juega en ellos el concepto de racionalidad práctica instrumental. En la tercera sección se discute y cuestiona el valor normativo de la PT, mostrando que a partir de ella se obtienen proposiciones en los dominios normativo/evaluativo y prescriptivo que conducen a serios problemas de evaluación y de deber. Esas proposiciones difícilmente pueden considerarse razonables y servir de base para construir principios que guíen la acción racional. En la cuarta sección se presenta una crítica a la concepción/descripción de la TDR realizada por S&C, cuyo propósito es hacer claridad en la exposición de ideas y contribuir a su debate informado y racional. En la quinta sección se concluye.
LA CONDICIÓN NORMATIVA DE LA TDR
El concepto de racionalidad se aplica a un amplio rango de cosas muy diferentes. En este trabajo nos centramos en la noción de racionalidad práctica, esto es, la relativa a qué hacer y cómo hacerlo de manera racional. En su acepción más básica, la noción de racionalidad práctica consiste en la resolución de problemas de decisión. Un problema de decisión surge cuando un agente cree que tiene un conjunto abierto de posibles acciones distintas, o que cada acción tiene un rango de posibles resultados, que pueden variar de acuerdo con ciertos estados del mundo y estar o no bajo el control del agente.
Un problema de decisión, entonces, tiene tres componentes: 1) los actos que un agente cree que tiene a disposición, 2) los resultados que un agente cree que pueden ocurrir y 3) los estados del mundo que, conjuntamente con el acto ejecutado, determinan un resultado. El problema de decisión consiste en decidir cuál de los posibles cursos de acción se llevará a cabo a la luz de la información disponible, esto corresponde al dominio de la TDR como guía para la acción (Bermúdez, 2009). Ahora bien, algunos cursos de acción son componentes de cursos de acción más extensos: ¿cómo ajustar dentro de esta descripción el hecho de que algunos cursos de acción hacen parte de otros más amplios?, ¿qué decir acerca de las ocasiones en las que no estamos seguros, no tenemos certeza, acerca de las características cruciales de nuestra situación?, ¿qué decir acerca de cursos de acción que se despliegan en el tiempo? La TDR ofrece una respuesta a estas preguntas y sugiere que los agentes han de elegir cursos de acción sobre la base de dos principios: ordenamiento débil e independencia.
La teoría de la decisión racional
Existen varias formulaciones de la TDR, aquí seguiremos (muy esquemáticamente) la de Savage (1972) en su Foundations of Statistics 3. En la teoría de Savage la incertidumbre se representa mediante un conjunto S de estados del mundo mutuamente excluyentes y conjuntamente exhaustivos que corresponden a descripciones completas de las circunstancias relevantes en el problema de decisión. Una vez se conoce el estado del mundo, toda incertidumbre se disipa, aunque el agente no sabe cuál estado se realizará. Los subconjuntos E de S se denominan eventos. El estado que se realiza se dice que es el verdadero estado. Asumimos que el agente no tiene influencia en la realización de estado alguno. El agente tiene a disposición un conjunto de acciones: . Los objetos de elección por parte de los agentes son actos f. El conjunto de todos los actos disponibles para la elección del agente es . A cada acto le siguen consecuencias, una para cada estado del mundo, que corresponden a los posibles resultados de una decisión después de que la incertidumbre se ha disipado, reunidas en el conjunto C. Formalmente, un acto en una función , que específica para cada estado la consecuencia que resulta si la acción a se elige y se realiza el estado s. Los resultados son estado-contingentes. Como los resultados que se siguen de un acto son inciertos ex ante, en la elección del agente los actos suelen llamarse apuestas (gambles), loterías o prospectos. Si la incertidumbre atañe a cuál de los países será el campeón de la próxima Copa Mundial de Fútbol, el conjunto de estados es donde si denota el estado el país i es el campeón, y es el evento en el que uno de los países 1, 2 o 3 gana la Copa.
Sobre el conjunto de actos el agente establece la relación binaria al menos tan bueno como, notada por , que determina sus preferencias sobre los actos. significa que el agente encuentra al menos tan preferible f a g, y que está dispuesto a elegir f (o posiblemente ambos) a partir del conjunto de elección . El principio de orden débil establece que el agente ordena el conjunto de actos con base en la relación binaria de preferencia , que es conexa (para todos los actos ) y transitiva (para cualesquiera actos , entonces ). Este orden es acontextualizado (context free), es decir, el ordenamiento completo de cualquier conjunto de prospectos puede construirse paso a paso mediante la combinación de información relativa a cómo el agente ordena vía preferencia pares de alternativas, cuando se le presentan de modo aislado unos de otros, hasta extender el orden sobre parejas a todo el conjunto de actos a elegir.
La idea detrás del principio de independencia, llamado por Savage la cosa segura (sure thing), es que la elección entre los actos f y g depende solo de las diferentes consecuencias en los estados en los que se comparan esos actos: estados en los que los actos tienen consecuencias idénticas no juegan ningún papel en la decisión. En el ejemplo anterior, supóngase que sabemos que el campeón de la Copa Mundial ha de encontrarse entre los países 1, 2 y 3. Un agente debe elegir entre las apuestas f y g que tienen los premios que se muestran en la Tabla 1.
Puesto que no importa cuál apuesta se elija si el país 1 gana, el principio de la cosa segura establece que la elección debe depender solo de los premios que esas apuestas tengan cuando gana un país distinto de 1. Si un agente prefiere f a g, y si el premio en s1 se incrementa en $10.000 tanto para f como para g, dando lugar a las apuestas f' y g', mientras que los premios bajo s2 y s3 permanecen iguales, entonces la elección de ese agente no debe cambiar. De manera formal, el principio de la cosa segura asevera que las preferencias entre dos prospectos son independientes de los estados en los que los dos tengan la misma consecuencia, esto es si y solo si , siempre que el conjunto de estados S pueda particionarse en dos: la parte I (el evento irrelevante) y la parte R (el evento relevante), de manera tal que f = g en I, y f = f' y g = g' en R (Fishburn & Wakker, 1995) (Tabla 2).
Es un resultado familiar que si las preferencias del agente y su comportamiento de elección satisfacen los principios de orden débil e independencia, así como otros requerimientos algo más técnicos -continuidad, reducción de prospectos, etc.-, entonces su comportamiento puede representarse mediante una función de utilidad sobre pagos monetarios o sobre prospectos bien definidos. Esto es, existe una función de valor real que representa la relación de preferencias , si para todo prospecto :
[1] |
Otro resultado es que, si las preferencias y el comportamiento de elección del agente satisfacen estos dos principios, en adición a un conjunto de postulados más técnicos, entonces sus creencias acerca de las posibilidades de realización de eventos pueden representarse mediante una medida de probabilidad subjetiva bien definida sobre conjuntos mutuamente excluyentes y conjuntamente exhaustivos de eventos. Es decir, estos axiomas implican que los grados de creencia subjetivos de los agentes acerca de la ocurrencia de tales eventos son representables como probabilidades que satisfacen los axiomas de una medida de probabilidad usual. Estos resultados se integran en un poderoso teorema: las preferencias del agente sobre consecuencias y acciones, y los grados de creencia respecto de los eventos condicionantes, pueden representarse respectivamente mediante una medida de utilidad y una medida de probabilidad subjetivas, tal que la valoración de cualquier acto, cuyos resultados están condicionados por eventos mutuamente excluyentes y conjuntamente exhaustivos, es equivalente a la utilidad esperada subjetiva de ese acto:
[2] |
Donde P(.) es una medida de probabilidad subjetiva sobre estados y es una función de utilidad que mide el grado en que los deseos del agente se satisfacen por la consecuencia resultante de la conjunción entre el estado s y la acción a. A U(.) se le puede entender como el estimativo o creencia que tiene el agente acerca de la posibilidad de que el acto f produzca las consecuencias que lo satisfacen.
Respecto de estos resultados, son necesarias tres observaciones de importancia para el apropiado entendimiento de la TDR.
Observación 1: Independencia probabilidades y utilidades
Ramsey (1990) y de Finetti (1980), en el espíritu del positivismo lógico, se propusieron ofrecer un fundamento que incluyera alguna clase de medición para las probabilidades subjetivas y las valoraciones de los resultados que hacen los individuos, con base en su disponibilidad para apostar. Esta última, a su vez, cimentada en las creencias que los individuos tienen acerca de la posibilidad de ocurrencia de eventos o en el grado de verdad que le confieren a una hipótesis de acuerdo con la evidencia que la apoya.
Ramsey y de Finetti sugirieron que un agente razonable se comporta como si tuviera una distribución de probabilidad subjetiva para guiar sus decisiones y derivaron el concepto de probabilidad subjetiva a partir de una noción de utilidad como idea primitiva.
Von Neumann & Morgenstern (2007) trabajaron en sentido inverso, derivaron una definición de utilidad, conjugada con la hipótesis de UE, basada en una noción de probabilidad objetiva y exógenamente dada como concepto primitivo de la teoría. Las nociones de utilidad y probabilidad definidas de esta manera son interdependientes, lo que puede ser problemático para la realización del trabajo empírico y de medición. Este problema fue resuelto por Savage (1972), quien no partió de nociones de probabilidad ni de utilidad, sino que elaboró la teoría a partir de lo que sería racional para un agente elegir. Savage parte de un patrón consistente de elecciones entre actos y después obtiene medidas de utilidad de probabilidad. Así, la racionalidad se entiende en términos de consistencia en las elecciones y los datos importantes provienen de la preferencia revelada a través de la elección. La noción de preferencia no tiene un contenido distinto a sus manifestaciones comportamentales en elecciones reales o en disposiciones a elegir de los agentes. Esta forma de concebir el problema tiene dos implicaciones importantes. Una asociada al problema de la medición como parte central del trabajo científico y, en particular, a la medición de utilidades requerido para el desarrollo de la teoría económica y de las políticas que se desprenden de ella (Observación 2), y otra asociada al supuesto de la maximización como precepto fundamental de comportamiento de los agentes económicos (Observación 3).
Observación 2: El problema de la medición y la medición de utilidades
Entender la racionalidad en términos de consistencia en las elecciones y de las disposiciones a elegir de los agentes vincula de modo automático, conceptual y lógicamente la TDR con la teoría representacionalista de la medición. Este es un aspecto clave para los desarrollos teóricos pero sobre todo empíricos de la TDR, por cuanto se le da una base firme a la cuestión de la medición de la utilidad e, igualmente, despeja las dudas y especulaciones acerca de la naturaleza de la utilidad, pues esta queda reducida a una escala de representación de las preferencias de los agentes.
El enfoque representacionalista concibe la medición como la asignación de números a entidades y eventos para representar sus propiedades y relaciones. La teoría considera el concepto de escala de medición, describe varios tipos de escalas, sus usos, y formula las condiciones necesarias para su existencia. En breve, la perspectiva representacionalista de la medición parte de considerar una estructura empírica relacional no-numérica, consistente en un conjunto de entidades no-numéricas D y un conjunto de relaciones que incluyen operaciones y objetos destacados, T1, T2, … , Tl, sobre D. Una estructura relacional numérica (abstracta) es un conjunto de entidades numéricas N, junto con las relaciones R1, R2, … , Rm sobre N. Una escala de medición, , es una función que preserva la relación (un homomorfismo) de la estructura relacional no-numérica en la estructura relacional numérica. El tipo de la estructura relacional es definido por el número y el grado de relaciones en la estructura, y el tipo de escala se define como el tipo de estructura relacional numérica mapeada por las transformaciones que soporta la escala y que preservan las relaciones subyacentes al mapeo.
La primera tarea de la teoría formal de la medición consiste en establecer de manera precisa las condiciones requeridas para la existencia de escalas de distintos tipos, esto es, establecer y probar los teoremas de representación que afirman la existencia de ciertos tipos de escalas y si las estructuras relacionales no-numéricas en consideración satisfacen cierto conjunto de condiciones. La segunda tarea estriba en determinar y precisar las clases de transformaciones de escala admisibles para los distintos tipos de escalas, es decir, las transformaciones que producen una nueva escala que mapea las mismas relaciones que la función original.
En la TDR el conjunto de entidades no-numéricas N se corresponde con los conjuntos de estados S, eventos E y actos . Las relaciones T1, T2, …, Tl se corresponden con la estructura de preferencias observables empíricamente en las elecciones de los agentes. Los teoremas de representación están dados por las expresiones [1] y [2], y las escalas por las funciones U(.) y . Ahora bien, si a partir del comportamiento observable de elección se define el concepto teórico de función utilidad, ¿hay una única función de utilidad compatible con un conjunto de datos de elección o pueden haber varias funciones, y cada una de ellas suministra una descripción de esa utilidad respecto a tal conjunto de datos?, esto es, ¿qué clase de escalas son estas funciones de utilidad?, ¿son empíricamente implementables, es decir, podemos medir efectivamente esas utilidades?
Por lo general, las magnitudes físicas pueden medirse con al menos un grado de libertad, es decir, eligiendo las unidades de medida en la escala de medición. Así, podemos medir el peso en kilos o en gramos, o la distancia en kilómetros o millas. En algunos casos se tienen más grados de libertad en la elección de la escala, como cuando se eligen las unidades de medida y la ubicación de un cero referencial, como es el caso de la temperatura (Celsius o Fahrenheit) o la altura de la superficie de la tierra sobre el nivel del mar. Cuando se trata de la medición de la utilidad lo que queremos representar mediante funciones o escalas de medición son órdenes de preferencia entre objetos contingentes, esto es, prospectos. Si para un agente el acto f es preferido al g y el g es preferido al h estamos diciendo que para él la utilidad del acto f es mayor que la utilidad de g, que a su vez tiene una utilidad mayor que h, y deberíamos obtener las mismas implicaciones observables si fijamos los respectivos valores de utilidad de esos actos en (10, 1, 0), (10, 7, 0) o (90, 54, 2). El hecho de que a la primera alternativa se le puede asignar el número 10 o 90, o que el rango de los valores de utilidad sea de 10 u 88, no tiene manifestaciones observables. Del mismo modo, no hay implicaciones observables para la comparación de una reducción en la utilidad entre f y g frente a una de g y h. Los valores de utilidad solo significan que la primera alternativa es preferible a la segunda y ambas son preferibles a la tercera. Esta es la escala ordinal de prospectos U(.), que no tiene unidades de medida y solo admite transformaciones monótonas que no alteran la validez de la representación del orden de la escala. Por tanto, , con creciente, representa el mismo orden que U(.).
Podemos pedirle a un agente que clasifique en orden de preferencia un conjunto de resultados y que después compare qué tanto más deseable es cada resultado que el siguiente en el orden. Si para un agente la diferencia de deseabilidad entre los resultados A y B es igual a la diferencia de deseabilidad entre los resultados B y C, entonces estas diferencias tienen implicaciones observables: a este agente le será indiferente obtener B con seguridad y una lotería que tiene por resultados A y C, cada uno de ellos con probabilidad de 50%. La igualdad entre estas dos diferencias tendrá que ser respetada por cualquier función de utilidad que pretenda tener en cuenta y representar adecuadamente estas diferencias en las preferencias. En consecuencia, una vez establecida una función de utilidad para los resultados descritos, la escala de medición que representa diferencias de deseabilidad es aquella a la que se le puede añadir cualquier número y multiplicarse por un número positivo, y los ordenamientos de tales diferencias se mantendrán inalterados. Esta es la escala de ordenamiento de preferencias sobre resultados, y ordenamiento de preferencias sobre diferencias entre resultados, cuya escala de medición es de intervalo: este tipo de escala solo admite transformaciones afines, u' = k1 u + k2 con , que no alteran la validez de la representación. En este caso se tienen unidades de medida (útiles, por ejemplo) y un cero referencial arbitrario.
De lo anterior se deduce que si queremos encontrar una función de utilidad real para un agente real y concreto, podemos hacerlo eligiendo los valores de utilidad de dos alternativas de forma arbitraria, siempre y cuando se le asigne a la mejor alternativa un número mayor. No importa si estos dos números son 0 y 1, 5 y 23 o -7, 6 y 1, 8. Lo que importa es que el segundo número sea mayor que el primero. Los valores de utilidad de todas las alternativas estarán definidos de forma única dados estos dos números, y los teoremas de representación en [1] y [2] sugieren las formas en que podemos encontrar esos valores intermedios, con el grado de precisión deseado. Si sabemos cuáles son las preferencias de un agente entre los pares de prospectos que involucran solo tres resultados, tendremos una única manera de definir sus preferencias entre cualquier par de prospectos. Más aun, para medir esas preferencias basta con conocer, de un lado, las preferencias del agente sobre resultados seguros, y de otro, sus preferencias sobre un par de loterías con dos posibles resultados.
Observación 3: Maximización como precepto comportamental
De otra parte, la TDR no prescribe maximizar la utilidad esperada de las elecciones de los agentes. Si las preferencias de un agente están en conformidad con los axiomas de la teoría, esta permite construir una función expectacional de utilidad para él. La función siempre asignará un mayor número a las opciones que él prefiere y a cada opción contingente le asignará su utilidad esperada. Si sus preferencias están en consonancia con los axiomas de la teoría, la maximización se hará cargo de sí misma, por así decirlo, en la medida en que el agente elige lo que prefiere. Si las preferencias del agente no se ajustan a los axiomas de la teoría, entonces la construcción de una función expectacional de utilidad fallará. Lo único que la teoría les pide a los agentes es que sus elecciones sean coherentes. Desde esta perspectiva, una labor de carácter normativo de la racionalidad práctica en la TDR, es fijar, como de hecho lo hacen los axiomas, las condiciones de coherencia en las elecciones. Estamos en el dominio de la TDR como marco analítico para la evaluación normativa de la acción.
La condición normativa de la TDR
La noción de racionalidad práctica consiste en la resolución de problemas de decisión, esto es, decidir cuál de los posibles cursos de acción se llevará a cabo a la luz de la información disponible, estamos en el dominio de la TDR como guía para la acción (Bermúdez, 2009). El material de trabajo para una teoría de la racionalidad práctica en este dominio es la información que el agente tiene acerca de los actos disponibles y de las posibles condiciones del mundo, relevantes para el problema de decisión que quiere resolver, en conjunto con sus actitudes hacia los posibles resultados. Una primera labor que se le encomienda a la racionalidad práctica en la teoría es la de identificar un subconjunto de opciones disponibles en un problema de decisión, que le proporcionen al agente el mejor prospecto para realizar sus objetivos, en relación con la información de que dispone. Esto es, una noción de racionalidad instrumental que permita la resolución de problemas de decisión mediante un razonamiento de la siguiente estructura. El agente tiene la intención de conseguir un fin. Se forma unas creencias acerca de qué medios están disponibles para conseguirlo y cuáles de esos medios son mejores o peores en relación con otros. Además, elegirá aquellos que cree que no son peores que otros. ¿Qué es creer que cierto curso de acción está disponible? Creer que cierto curso de acción está disponible tiene dos componentes: a) el agente debe considerar que es al menos epistémicamente posible que tenga la intención de un cierto curso de acción, y b) el agente debe tener una creencia condicional confiable según la cual, de hecho, tomará ese curso de acción si tiene la intención de hacerlo.
¿Qué es creer que uno de esos posibles medios para alcanzar el fin es mejor que otro? No es necesario creer que ese medio es el más eficaz en la consecución del fin. La manera más efectiva de lograr un objetivo, con no poca frecuencia, puede ser demasiado costosa para contar como la mejor, ni siquiera como una de las mejores maneras de lograr el objetivo. Basta con que para el agente lo mejor o lo más sea aquello que es valioso o digno de ser elegido por él. Así, tomar un cierto curso de acción A como medio para cierto fin F es llevar a cabo una intención de tomar dicho curso de acción A con el fin de conseguir el fin F. Cuando el agente tiene la intención de tomar el curso de acción A con el fin de lograr un fin F, su intención de tomar A es, de alguna manera, subordinada a su intención de conseguir F. La intención del agente de conseguir el fin F controla o guía el modo en que toma el curso de acción A. Esto no implica, por supuesto, que dos agentes distintos se formen las mismas creencias y elijan los mismos cursos de acción, aun cuando persigan el mismo fin y cuenten con la misma información.
Así, y de acuerdo con la Observación 3, la TDR puede pensarse normativamente como una teoría de la coherencia de la racionalidad práctica. Ahora bien, desde una perspectiva pragmática, esto es, que atiende a las consecuencias que se siguen de las elecciones, la falta de coherencia de sus elecciones ponen al agente en una situación en la que falla en el logro de los objetivos que tiene la intención de alcanzar. Esto conduce a un principio de racionalidad normativo que expande la noción de racionalidad práctica más allá de la simple consistencia en la elección a una concepción pragmática de la elección: un principio de elección es válido si el fracaso de un agente en su adhesión a este resulta en la elección de medios insuficientes para la consecución de los fines deseados, en la persecución menos efectiva de esos fines de lo que podría, bajo las circunstancias en las que actúa el agente (McClennen, 2008, p. 4).
Nótese que hemos vuelto a una noción de racionalidad instrumental, pero ampliada. Ejemplos claros de este punto de vista son las consecuencias que se desprenden de la violación de los principios de orden débil e independencia. Así, un agente puede verse en una situación en la que acepta una combinación de apuestas monetarias que, independientemente de cómo se desenvuelvan los eventos que condicionan sus apuestas, indefectiblemente termina perdiendo dinero (the Money Pump argument); o puede encontrarse en una situación de elección dinámica en la que lo que preferiría elegir ahora en un momento posterior no es lo que preferiría elegir una vez llegado ese momento. En consecuencia, normativamente hablando, un agente racional debe adherir a estos principios: ello le garantiza consistencia en las elecciones y no le impide la consecución de sus fines.
Además de identificar un subconjunto de opciones disponibles en un problema de decisión, que proporcione al agente la mejor manera de cristalizar sus objetivos en relación con la información de que dispone, de manera tal que sea consistente en sus elecciones, a la racionalidad práctica en la TDR también se le confía que suministre los criterios para determinar cómo se resuelven los problemas de decisión. A partir del dominio de guía para la acción de las elecciones racionales se han mantenido estables los fines del agente y la información que posee. También se han dado por sentadas sus evaluaciones de los actos disponibles, las posibles condiciones relevantes del mundo y sus actitudes hacia los resultados esperados. Así, las actitudes y evaluaciones de los agentes fijan los parámetros de los problemas de decisión, y la noción de racionalidad práctica en el dominio de guía para la acción solo puede aplicarse una vez tales parámetros se fijan (Bermúdez, 2009).
Pero, podemos preguntarnos acerca de la racionalidad de cómo se fijan esos parámetros, y de la racionalidad de cómo se realizan las elecciones una vez los parámetros han sido fijados. Esto nos lleva considerar: cómo y qué tan bien el agente recaba información pertinente acerca de los resultados; cómo determina sus valoraciones de los estados y contingencias y los estimativos de sus posibilidades de ocurrencia; y cómo se conectan estos con los primeros, dada la subordinación de todo ello a la consecución de sus fines. Lo que nos conduce, por último, a conectar las motivaciones para la acción de un agente y la acción misma expresada en su comportamiento de elección.
De acuerdo con Davidson (1995), una acción se explica si las creencias, deseos y otros estados mentales ofrecen una caracterización psicológica de lo que dio lugar a la acción del agente. En la identificación de tales estados psicológicos, se supone que quien explica la acción está guiado por una hipótesis de racionalidad, esto es, los estados psicológicos a los que apela deben ser tales que la acción es racional a la luz del perfil psicológico del agente. También en la predicción de la acción de un agente, quien predice está guiado por el supuesto de lo que sería racional para ese agente hacer. Ciertamente, una acción es compatible con una infinidad de perfiles psicológicos, y cualquiera de estos puede expresarse en una infinidad de acciones. La hipótesis de racionalidad, entonces, actúa como una restricción que reduce las dimensiones de variación de la acción. La satisfacción de una condición de racionalidad es una condición necesaria, más no suficiente para la explicación y la predicción de la acción.
Así, la hipótesis de racionalidad es la única manera de cerrar la brecha entre el perfil psicológico del agente y su comportamiento. Esto es, requerimos de una noción de racionalidad para explicar y predecir el comportamiento de elección, necesaria para establecer los vínculos entre deseos, creencias y acciones, en función de los fines a lograr y los medios requeridos para conseguirlos. La TDR es una teoría formal en la que se conjugan esos elementos.
Nótese cómo el razonamiento, en distintos niveles y enfocado en distintas necesidades normativas, gravita alrededor de la noción de racionalidad instrumental y la refina. En síntesis, y a la luz de las Observaciones 1, 2 y 3, podemos establecer el estándar normativo de la TDR como sigue. Un agente es racional cuando responde a la información que tiene, con a) creencias racionales acerca de qué medios están disponibles para conseguir un fin, b) creencias racionales acerca de cuáles de esos medios son mejores y cuáles peores, y c) que las intenciones sean consistentes con tales creencias racionales. Además, que las intenciones del agente sean consistentes con sus creencias implica que él nunca debe tener: a) la intención de conseguir un fin, b) creer que en un cierto conjunto de alternativas cada una de ellas es un medio disponible y óptimo para ese fin y, a pesar de ello, c) no tener la intención de elegir entre ninguno de esos medios, por lo menos en tanto que d) él también crea que no conseguirá ese fin de manera óptima, a menos que se decida por uno de esos medios. El estándar requiere que las preferencias, determinadas a partir del comportamiento de elección de los agentes, estén en conformidad con los axiomas de la TDR, de manera que sus elecciones sean consistentes sin impedir la consecución de sus fines.
ALGUNAS IMPLICACIONES NORMATIVAS DE LA PROSPECT THEORY
Para ciertos analistas, por ejemplo S&C, la falta de congruencia con los hechos de algunas proposiciones descriptivo/explicativas de la TDR pone en entredicho su condición normativa, tal y como se formuló en la sección anterior. Esto es equivocado, veamos por qué. La condición normativa de una teoría se pone en cuestión si 1) la extensión del dominio normativo/evaluativo de la teoría es insuficiente para los propósitos de la misma, esto es, no abarca casos importantes para los que se espera una formulación normativa por parte de la teoría que ella no permite, 2) tiene implicaciones normativas indeseables, es decir, que contradicen nuestros juicios de deber mejor fundamentados y 3) se muestra que los fundamentos justificativos de la condición normativa son insostenibles. Cuestionar el estatus normativo de la TDR requiere hacer evidentes los puntos 1) a 3). La PT, en cuanto teoría de la toma de decisiones, no tiene el propósito de socavar normativamente la TDR, como lo veremos más adelante. No obstante, podemos mostrar que hay implicaciones normativas de la PT inconvenientes en términos de deber y guía de la acción. Para ello, describamos la PT primero. La descripción de la PT y las citas que siguen se basan en Kahneman & Tversky (2000) (en adelante K&T).
Una característica fundamental de la PT, a diferencia de la UE, es que los agentes perciben los resultados como pérdidas y ganancias con respecto a un punto de referencia r es decir, no evalúan estados finales sino los cambios respecto a un estado referente, generalmente un statu quo dado por la situación en la que se encuentra el agente. Una ganancia es estrictamente preferida al punto de referencia y una pérdida se prefiere menos que el punto de referencia. La desutilidad de una pérdida x es mayor que la utilidad de una ganancia x, sean unas u otras efectivas o potenciales, fenómeno que es conocido como aversión a las pérdidas. Esto implica que los agentes son aversos al riesgo en el dominio de las ganancias y propensos al riesgo en el dominio de las pérdidas. La PT asume que las contingencias se evalúan no por probabilidades sino por ponderaciones de probabilidad, modeladas por funciones w(p) no lineales, no aditivas, continuas y crecientes que asignan ponderación 0 a p = 0 y ponderación 1a p = 1; generalmente, de acuerdo con la evidencia empírica, son cóncavas para probabilidades bajas (usualmente menores a 0,2, interpretadas como sobrestimación de la contingencia de eventos poco probables) y convexas para probabilidades altas (mayores a 0,2, interpretadas como subestimación de la contingencia de eventos significativamente probables).
Estas ponderaciones de probabilidad no pueden tomarse como probabilidades ni medidas de grados de creencia, pues miden el impacto de eventos en la deseabilidad de los prospectos, además de ser evaluaciones de las posibilidades de ocurrencia de contingencias. La PT admite que las ponderaciones de probabilidad asociadas a ganancias sean diferentes a las ponderaciones asociadas a pérdidas (w–). Bajo PT los prospectos L = (A:p, B:1 – p) con resultados A o B y probabilidad p de que se obtenga A cuando involucran ganancias y pérdidas , se evalúan así:
[3] |
Donde V(.) es una función de utilidad sobre prospectos correspondiente a una escala de medida ordinal; u(.) es una función de utilidad sobre resultados correspondiente a una escala de medida de intervalo y es un coeficiente que refleja la aversión a las pérdidas. Por último, K&T postulan que los agentes están a merced de distintos sesgos cognitivos y perceptuales que afectan sus decisiones. ¿Qué consecuencias normativas pueden derivarse de esta perspectiva de la decisión? Veamos dos casos ilustrativos, suficientes para mostrar los serios problemas de evaluación y de deber a que conduce la PT.
Caso 1: Framing effects
Uno de los sesgos más frecuentes en las decisiones es el framing effect, el cual expresa que las variaciones irrelevantes en la descripción de problemas de decisión, que no cambian su estructura lógica o conceptual subyacente, tienden a modificar las decisiones de los agentes -como consecuencia de las variaciones en la descripción-. En particular, puede inducirse a los individuos a ver los mismos hechos, bien como una ganancia o bien como una pérdida, variando la descripción del problema de decisión, de tal manera que se altere el punto de referencia. Así, lo que era una ganancia con respecto a la referencia inicial será una pérdida con respecto a la referencia redescrita, sin que haya cambiado la estructura del problema. Debido a la susceptibilidad de los framing effects, las personas escogerán de manera inconsistente, esto es, realizarán elecciones diferentes y opuestas en problemas de decisión esencialmente idénticos, como ocurre en el famoso caso de la enfermedad asiática (Kahneman & Tversky, 2000).
Si juicios acerca de lo correcto o incorrecto, debido o indebido, justo o injusto, permisible o impermisible, o del mayor o menor valor de una decisión dependen de la percepción de pérdidas y ganancias, y si los framing effects afectan esas percepciones, entonces esos juicios no tienen ningún significado normativo, por cuanto no hay una guía prescriptiva clara de qué hacer ni de cómo evaluar lo hecho, pues una y otra cosa son contingentes a la descripción que se haga del problema de decisión. Esto es algo que requiere de especial cuidado, por ejemplo, en el diseño, implementación y evaluación de políticas públicas, en las que con frecuencia se deben establecer pérdidas y ganancias, incluir los intereses, grupos, etc. concernidos por ellas y que, por lo mismo, requieren, en principio, partir de valoraciones normativas claras de la situación a cambiar y de la naturaleza del cambio a realizar. Estos problemas se agudizan cuando hay interacción estratégica, pues los puntos de referencia, las pérdidas y las ganancias son estratégicamente manipulables. Esto muestra, de paso, una importante debilidad teórica de la PT: la indeterminación de los puntos de referencia y, por implicación, de las pérdidas y ganancias, y de los efectos e incidencia de la aversión a la pérdida en las decisiones.
Caso 2: Pérdidas y ganancias como portadores de utilidad
Suponiendo que riqueza y bienestar estén asociados, consideremos las siguientes situaciones. Un individuo a) acaudalado ve reducida su riqueza a un nivel medio, debido a que sufre una gran pérdida, o b) se mantiene en un nivel medio de riqueza debido a que no ganó una suma que lo haría muy rico, y c) un individuo se mantiene en un nivel bajo de riqueza debido a que no ganó una suma moderada. Bajo PT nos vemos forzados a concluir que el individuo en las situaciones a) y b) está en peor condición de bienestar que el individuo en c), aun cuando en c) la persona permanece en un nivel mucho más bajo de riqueza en términos absolutos que la persona en a) o b).
Ahora consideremos dos individuos (1 y 2), uno con riqueza A y otro con riqueza B, con . Al primero se le impone un tributo sobre A, con el fin de transferirlo al segundo. Supongamos que al primer individuo la tributación le genera una pérdida de x, mientras que al segundo la transferencia le genera una ganancia de x + a, tal que la situación final es . Bajo PT, la mayor ganancia de 2 se valora menos que la menor pérdida de 1, esto es, la PT puede proscribir la tributación progresiva.
En las situaciones descritas, la razón que sustenta tales valoraciones normativas es que en la PT son los cambios en los resultados y no los resultados finales los portadores de utilidad, y que las pérdidas cuentan más que las ganancias. Más aun, las medidas que se ocupen de los individuos en peor situación son claramente no favorecidas por la PT, por cuanto no hay forma de justificar un criterio maximin a partir de ella. No obstante, debido a que las pérdidas y ganancias se ven afectadas por ponderaciones de decisión distintas, puede ser que la importancia que se le asigna a reducciones en el decrecimiento del ingreso sea mayor que la asignada a los aumentos en el crecimiento del ingreso.
Estos casos sugieren que las teorías centradas en los estados finales como portadores de utilidad, como la UE -en vez de estar centradas en cambios en los estados finales, también como portadores de la utilidad, como la PT-, son normativamente más razonables y, en ciertos casos, pueden ser descriptivamente más útiles.
CRÍTICA A SANTIAGO & CANTE
Juan Santiago y Freddy Cante publicaron en Cuadernos de Economía el artículo "Intuición, sesgos y heurísticas en la elección" (2009), en el que hacen una crítica a la TDR y al modelo de UE. La crítica se basa en la insostenibilidad de lo que llaman racionalidad perfecta (p. 2) y los supuestos que la sustentan. La racionalidad perfecta consiste en "que los individuos tienen una consistencia lógica entre medios y fines y, por tanto, suponen la posibilidad de optimizar en el momento que el agente decide, y a medida que pasa el tiempo […] sea en un contexto de certeza, en uno riesgoso o en uno incierto" (p. 5).
De acuerdo con S&C, la racionalidad perfecta se materializa en el modelo UE, y la insostenibilidad de una y otro obedece a un problema de incongruencia empírica: los postulados de la teoría acerca de las capacidades de los agentes no son consistentes con los hechos, debido a "las limitaciones cognitivas de los agentes en el proceso de elección observadas", y a que las decisiones humanas "son producto de la intuición (escogencia automática), y no de prolongados y sofisticados procesos de elección racional [y] la inconsistencia de las preferencias a lo largo del tiempo" (p. 3). En consecuencia "la racionalidad, en el sentido estrecho que la define la Teoría de la Elección Racional, no puede explicar todos los fenómenos que se le pide que explique" (p. 2), en particular el equity premium puzzle, el efecto disposición, entre otros (pp. 25-28).
Además de la crítica a la TDR, S&C hacen un contraste entre el modelo de UE con el modelo PT de K&T, en sus versiones sencilla y acumulativa. A partir del contraste entre las dos teorías, S&C invitan a pensar en el abandono del modelo UE y en la adopción del modelo PT, por cuanto este permite superar las limitaciones y fallas explicativas/predictivas de la UE, a través de la introducción de ciertas características de la psicología de la decisión, como la racionalidad limitada de los agentes, los puntos de referencia, la evaluación diferencial de pérdidas y ganancias, entre otras, que hacen a la PT descriptivamente mejor que la UE.
Sin duda la TDR y el modelo de UE son problemáticos, y una muestra de ello es la incongruencia empírica que los autores denuncian. Sin embargo, tanto la descripción como la crítica que hacen S&C de la TDR evidencian un profundo desconocimiento de la teoría, de su estructura analítica, del sentido conceptual de sus elementos componentes, de las relaciones entre los mismos y de sus implicaciones en la explicación de la elección de los agentes y, en consecuencia, del alcance y las limitaciones de la teoría, de lo que ella puede decir legítimamente. Así, confunden los dominios de la TDR como guía, marco analítico -para la evaluación normativa- y teoría -para la explicación/predicción- de la acción.
Los autores también hacen afirmaciones fuertes sin ofrecer razones y argumentos que las justifiquen, tales como "la Teoría de Prospectos enfocada en los aspectos psicológicos que afectan la elección individual, cuestionan el status normativo de la Teoría de la Elección Racional" (extraído del resumen del artículo, p. IX), sin mostrar en qué consiste tal estatus normativo y cómo es que la PT lo cuestiona. No obstante las deficiencias del artículo, su publicación constituye una oportunidad para hacer claridad en la exposición de ideas y su debate informado y racional.
De acuerdo con Anscombe (2000), podemos distinguir dos tipos de estados mentales. De un lado están las creencias o estados cognitivos, en los que la intención del agente es adaptarse al mundo tal como es; si una creencia no se ajusta al mundo, es falsa y tiene que rechazarse. De otro lado están los deseos o estados conativos, en los que la dirección de ajuste con el mundo es inversa a la de las creencias, un deseo se satisface o realiza cuando el mundo se ajusta a este. Reconocer esta distinción es entender por qué los deseos y las creencias son distintos, y que lo que motiva a actuar a las personas son sus deseos, metas y aspiraciones. En la TDR las creencias se forman sobre los medios para realizar esos deseos y cómo aquellos se conectan con sus fines. Asimismo, hay tantos fines como agentes, y aun más, un mismo agente puede tener más de un fin (p. ej., una persona puede querer ser a la vez un gran actor y un buen padre, una empresa puede querer tener la mayor cuota de mercado y proteger el ambiente, etc.). Por tanto, cuando S&C afirman que la TDR "evita considerar la diversidad de valores" (p. 6), no reconocen que las personas tienen fines diversos distintos a la maximización de la utilidad; además, no solo afirman algo contrario a lo postulado por la teoría, que reconoce la infinidad de fines y valores que los agentes puedan perseguir, también confunden deseos con creencias, cómo unos y otros se articulan en la acción de los agentes y qué juicios se forman ellos acerca de los medios para su consecución.
Igualmente, S&C se contradicen cuando acusan a la teoría de no permitir diversidad de valores, pero a su vez le reclaman que pueda servir a valores distintos como los de Hitler y Gandhi (p. 6), que son diversos, independientemente de su contenido moral. La contradicción de S&C es aun más patente cuando afirman, en acuerdo con Herbert Simon, que "por su parte H. Simon (1989, p. 22) muestra que la teoría de la utilidad esperada abarca toda la diversidad de valores humanos (razones, sentimientos, pasiones e intereses diversos) dentro de una sola función" (p. 15). ¿Si la TDR "evita considerar la diversidad de valores" como es que también "abarca toda la diversidad de valores humanos"?
Respecto a si la PT cuestiona la condición normativa de la TDR, S&C no advierten que cuestionar tal condición requiere mostrar los puntos 1) a 3) de la sección anterior, cosa que no hacen, y no se percatan de que la PT no tiene el propósito de subvertir los fundamentos normativos de la TDR, de hecho K&T tratan el modelo UE como estándar normativo, pese a que lo rechazan como modelo explicativo/predictivo de las decisiones:
These departures from expected utility theory [certainty effect, isolation effect] must lead to normatively unacceptable consequences, such as inconsistencies, intransitivities, and violations of dominance. Such anomalies of preference are normally corrected by the decision maker when he realizes that his preferences are inconsistent, intransitive, or inadmissible. (Kahneman & Tversky, 2000, p. 31, énfasis añadido)
Más aún, K&T reconocen que los dominios explicativo/predictivo y normativo/evaluativo no solo son distintos, sino irreconciliables el uno con el otro. El primero atañe a lo que es y el segundo a lo que debe ser, y lo que afecta a un dominio no tiene implicaciones sobre el otro, debido a la incomunicabilidad lógica y empírica entre ambos:
We argue that the deviations of actual behavior from the normative model are too widespread to be ignored, too systematic to be dismissed as random error, and too fundamental to be accommodated by relaxing the normative system. […] We conclude from these findings that the normative and the descriptive analyses cannot be reconciled (p. 210, énfasis añadido) […] Consequently, the dream of constructing a theory that is acceptable both descriptively and normatively appears unrealizable (p. 220).
Por tanto, contrario a lo sostenido por S&C, que la TDR presente incongruencias empíricas entre las predicciones que resultan de ella y la evidencia de su contraste efectivo no afectan el estatus normativo de la teoría, independientemente de donde venga el reclamo empírico.
Incluso S&C suelen confundir los dominios normativo/evaluativo y descriptivo/explicativo, dos ejemplos claros son: "Uno de los méritos de Kahneman & Tversky es su trabajo empírico […], lo cual rompe con la estéril metodología de la abstracción suprema (mediante la cual se supone, cual un acto de fe, que los individuos se comportan conforme a los principios prescriptivos de la teoría de la elección racional)" (p. 15, énfasis añadido); "Divergencias entre teorías positivas y normativas surgen a cada momento […] La Teoría de Prospectos contiene al menos tres elementos que pueden explicar varias predicciones contraintuitivas ofrecidas por los modelos normativos" (p. 28). Por tanto, la PT no pone, no puede poner en cuestión el estatus normativo de la TDR. Sin embargo, dadas las cualidades explicativas/predictivas de la PT, Bleichrodt, Pinto & Wakker (2001) han hecho uso de ella para mejorar la capacidad prescriptiva de la UE. Allí, dado que los distintos métodos de obtención y medición de utilidades bajo UE generan resultados significativamente distintos cuando deberían ser los mismos (no hay invarianza procedimental), es posible corregir los sesgos de obtención y medición de utilidades bajo UE, mediante cuidadosas aplicaciones de las funciones de ponderación de decisiones y coeficientes de aversión a las pérdidas. Los resultados experimentales de estos autores sugieren que esas correcciones mejoran de manera importante la capacidad prescriptiva de las aplicaciones de la UE, en especial en la toma de decisiones en salud, en el análisis costo-utilidad de tecnologías sanitarias.
De otra parte, S&C afirman que "dentro de la Teoría de la Utilidad Esperada, un problema persistente ha sido la noción de la utilidad y la posibilidad de su medición, problema soslayado asumiendo la imposibilidad de una medición 'objetiva' para un fenómeno 'subjetivo'." (p. 3, énfasis añadido). Esta afirmación solo puede obedecer al desconocimiento de los desarrollos de las teorías económica, de la decisión y la medición. De acuerdo con lo expuesto en la Observación 2, en los enfoques de la medición es irrelevante que las entidades a medir sean objetivas o subjetivas, pues de lo que se trata es de asignar números a un conjunto de entidades y de relaciones, cualquiera que sea su naturaleza. Por ejemplo, medir la carga eléctrica de una partícula atómica, la energía liberada por una reacción química, el grado de adaptación de una especie a su entorno, el nivel general de precios, la inteligencia o las actitudes de un agente, son en última instancia lo mismo: lo que cambia son los métodos de medición, los instrumentos utilizados y lo considerado como error de medición.
Por otra parte, las preocupaciones epistémicas, pragmáticas y de política económica por medir la utilidad no han sido un problema soslayado, por el contrario, ha ocupado buena parte de las reflexiones de los economistas y los teóricos de la decisión. Dos ejemplos prominentes son Edgeworth y Fisher, quienes discutieron el problema de la medición de la utilidad y la relevancia de fundamentarla en la psicología de los agentes o en su comportamiento de elección. Edgeworth fue partidario de lo primero, dado su compromiso con el utilitarismo, mientras que Fisher fue partidario de lo segundo (Colander, 2007).
Desde el paso del cardinalismo utilitarista al ordinalismo abstracto y hasta hoy los fundamentos de la teoría de la utilidad y su medición han sido parte central de la labor teórica y empírica de los economistas, naturalmente aun hay problemas por resolver (Mandler, 1999). A manera de ejemplo, tal vez el área donde más se hacen mediciones de utilidad y en la que mejor se conjugan los propósitos teóricos y aplicados, epistémicos y pragmáticos, es en la economía de la salud, en particular en la valoración de estados de salud y la evaluación de calidad de vida asociados a ellos (Brazier, Racliff, Salomon & Tsuchiya, 2007).
Por último, son importantes algunas observaciones generales respecto a la relación entre la TDR y las decisiones morales, tópico sobre el que S&C hacen declaraciones objetables, bajo la tutela de la autoridad intelectual, sin preguntarse si tales declaraciones tienen fundamento o no. La condición normativa/evaluativa de la TDR establece cómo debemos elegir racionalmente bajo condiciones de riesgo o incertidumbre. Uno de los campos de decisión racional, y el normativo por antonomasia, es el moral, y la TDR podría ser útil en la comprensión y solución de problemas de decisión en los que lo moral es crucial. No lo creen así S&C cuando afirman, apoyados en la autoridad de Herbert Simon, que:
Simon (1989) sostiene que la teoría de la elección racional es un doble fraude y un instrumento mercenario. El doble timo de la teoría se produce porque omite tratar el problema de las creencias (no reconoce que unos mismos hechos pueden ser interpretados de manera distinta por personas diferentes) y, además evita considerar la diversidad de valores (no reconoce que las personas tienen fines diversos distintos a la maximización de la utilidad). En consecuencia, tal teoría, en el mejor de los casos (es decir, que funcionara en realidad), ayudaría a responder cómo decidir y, por tanto, estaría al servicio de seres con finalidades y valores tan disímiles como Hitler y Gandhi.(Santiago & Cante, 2009, p. 6).
De nuevo, S&C -y Simon (1989)- ven las cosas desde una perspectiva incorrecta como consecuencia de una falacia que es imperativo disolver. El trabajo en la TDR se centra en proporcionar una caracterización formal de la toma de decisiones racionales, tanto en el contexto de decisiones individuales contra la naturaleza como en el contexto de interacciones con otros agentes, y no en los fundamentos de los principios morales. La teoría se elabora en términos de elección, impulsada por el deseo de parte del agente de ver realizado el resultado que más prefiere. Así, dadas las preferencias del individuo sobre varios posibles resultados, la pregunta que surge es ¿cuál es la elección que sería racional tomar? Cuando se estudia con atención ese trabajo, es evidente que el concepto de preferencias empleado es susceptible de un amplio rango de interpretaciones. Las preferencias del agente pueden ser egoístas en el sentido más estrecho o reflejar concernimiento por los demás, esto es, preocupaciones por el bienestar o los intereses de otros individuos e incluso por ideales impersonales.
Así, emerge una perspectiva de la toma de decisiones racional que es esencialmente neutral con respecto a la clase de fines o propósitos que deben tener los agentes, pues la racionalidad es, sencillamente, una cuestión de persecución consistente y efectiva de los propósitos que un individuo tiene. Desde esta perspectiva, la TDR no es más que una herramienta para la toma de decisiones, de la misma manera que la física es una herramienta para la construcción de máquinas. Ahora bien, esas herramientas pueden ser susceptibles, como cualquier otra, de uso indebido, pero eso es un problema distinto. Y aquí S&C y Simon(1989) incurren en una falacia: juzgar la virtud de algo por el uso que se haga de ello. A la TDR la califican de mercenaria, porque puede usarse para propósitos malévolos como los de Hitler. Y es cierto, de la misma manera que la física puede usarse para hacer bombas atómicas. Pero no por eso decimos, y menos aun podemos decir, que la física es un instrumento mercenario al servicio del mal. Una cosa son los instrumentos y otra el uso que se haga de estos. Son dos cuestiones distintas y nadie niega que lo uno y lo otro pueden estar relacionados, pero esa relación no es de necesidad.
No obstante, hay individuos cuyas preferencias obedecen los postulados de la TDR, que prefieren el genocidio al asesinato y el asesinato a la tortura, y persiguen de manera consistente y efectiva sus propósitos de exterminio. En tales casos, las condiciones de consistencia de la TDR son insuficientes para la toma de decisiones que involucren consideraciones morales, por lo que se hace necesario imponer alguna clase de condiciones adicionales en la estructura analítica. De la misma manera, cuando se requiera, las decisiones no solo deben lograr para el agente lo que él más prefiera, también lo que no sea moralmente impropio. Así, de una parte, es posible introducir contenidos consecuencialistas, deontológicos e incluso asociados con las virtudes en los ordenamientos de preferencias (Colyvan, Cox & Steele, 2010).
De otra parte, lo que debe y puede contribuir la TDR a la ética depende en gran medida de qué tipo de justificación moral pueda suministrar, con los medios propios de su aparataje analítico, y de qué tan válidas y razonables resulten esas justificaciones. En ese orden de ideas, la TDR proporciona justificación, de una u otra manera, a doctrinas morales como (Lumer, 2010): la ética de la cooperación (p.ej., Gauthier, 1986; Skyrms, 1996, 2004; Binmore, 1994, 1998, 2005), la ética del valor moral racional (p.ej., Rescher, 1975; Margolis, 1982; Lumer, 2000, 2011), la ética de la decisión imparcial racional (Harsanyi, 1955; Rawls 1971) y la ética del riesgo (Fritzsche, 1986; Hansson, 2003; Lewens, 2007), entre otras.
Sin embargo, todo hay que decirlo, introducir restricciones como las mencionadas, o hacer uso de uno u otro de estos tipos de modelos para abordar cuestiones morales a veces plantea más problemas que los que resuelve. Pues, de un lado se generan teorías que apoyan principios en conflicto y, de otro, los resultados suelen depender de la utilización de principios o axiomas distintos, y no hay consenso acerca de cuáles son apropiados para los problemas éticos bajo investigación (McClennen, 2010). El punto, no obstante, es que la TDR no está lejos ni es contraria a la reflexión moral como lo aseveran S&C.
CONCLUSIONES
El desarrollo de nuestra disciplina, la economía, como de cualquier otra, depende de comprender bien lo que se puede y no se puede decir con los modelos de que disponemos, de cómo estos atacan distintos problemas, de los métodos que utilizan para ello y los problemas, tanto analíticos como empíricos en esa labor. En las lagunas y en los problemas hay fuentes de avance y mejora, sin descartar, por supuesto, la completa revaluación y abandono cuando el desarrollo mismo de la disciplina así lo exige. Es incuestionable que la TDR no explica todo lo que se espera que explique. No cabe duda de que la economía requiere de modelos de decisión empíricamente más satisfactorios que el de la TDR, y que un camino prometedor es la PT. Sin embargo, hay por lo menos un dominio, el normativo/evaluativo, donde la TDR aún continúa teniendo vigencia y relevancia, y en el que los modelos rivales distan de superar y remplazar.
En este ensayo no he querido ni criticar la PT ni defender la TDR, sino dar claridad a los argumentos y hacer patente lo que está en juego teórica y normativamente en algunas teorías de la decisión, con el propósito de que el debate sea riguroso y fructífero. No solo para quienes estamos profesionalmente involucrados en el estudio de las teorías y las prácticas de decisión de agentes reales en contextos reales, sino también para quienes hacen uso de ellas y, de manera muy importante, para que los jóvenes economistas en formación tengan un panorama equilibrado de los distintos argumentos del debate y de sus implicaciones.
NOTAS AL PIE
2 Esta distinción ha sido usual en las teorías de la decisión, recientemente Bermúdez (2009) ha elaborado una propuesta interesante sobre la misma, en la cual nos basaremos en algunas partes de este trabajo.
3 Hay distintos enfoques de la TDR, varios de ellos resumidos en Weirich (2004), capítulo 1. Una buena razón para presentar la TDR en la formulación de Savage es que ella dio una estructura analítica coherente del bayesianismo.
REFERENCIAS
[1] Anand, P. (1993). Foundations of rational choice under risk. Oxford [England]: Clarendon Press.
[2] Anscombe, G. E. M. (2000). Intention. Cambridge, Mass.: Harvard University Press.
[3] Bermúdez, J. L. (2009). Decision theory and rationality. Oxford: Oxford University Press.
[4] Bleichrodt, H., Pinto, J. L., & Wakker, P. P. (2001). Making descriptive use of prospect theory to improve the prescriptive use of expected utility. Management Science, 47(11), 1498-1514.
[5] Brazier, J., Racliff, J., Salomon, J. A., & Tsuchiya, A. (2007). Measuring and valuing health benefits for economic evaluation. Oxford; Nueva York: Oxford University Press.
[6] Colyvan, M., Cox, D., & Steele, K. (2010). Modelling the moral dimension of decisions. Noûs, 44(3), 503-529.
[7] Davidson, D. (1995). Acciones, razones y causas. En Ensayos sobre acciones y sucesos. México D. F.: Instituto de Investigaciones Filosóficas, Universidad Nacional Autónoma de México; Crítica Grijalbo Mondadori.
[8] De Finetti, B. (1980). Foresight. Its logical laws, its subjective sources. En J. Kyburg & H. E. Smokler (Eds.), Studies in subjective probability. (pp. 53–121). Huntingdon, N.Y.: Robert E. Krieger Publishing Company.
[9] Fishburn, P., & Wakker, P. P. (1995).The invention of independence condition for preferences. Management Science, 41(7), 1130-1144.
[10] Hampton, J., & Healey, R. (1998). The authority of reason. Cambridge; Nueva York: Cambridge University Press.
[11] Jeffrey, R. C. (1990). The logic of decision. Chicago: University of Chicago Press.
[12] Kahneman, D., & Tversky, A. (Eds.) (2000). Choices, Values, and Frames. Nueva York; Cambridge, UK: Russell Sage Foundation; Cambridge University Press.
[13] Köbberling, V., & Wakker, P. P. (2003). Preference foundations for nonexpected utility: A generalized and simplified technique. Mathematics of Operations Research, 28(3), 395-423.
[14] Lumer, C. (2010). Introduction: The relevance of rational decision theory for ethics. Ethical Theory & Moral Practice, 13(5), 485-496.
[15] Mandler, M. (1999). Dilemmas in economic theory: Persisting foundational problems of microeconomics. Nueva York: Oxford University Press.
[16] McClennen, E. F. (2008). Rationality and dynamic choice: Foundational explorations. Cambridge: Cambridge University Press.
[17] McClennen, E. F. (2010). Rational choice and moral theory. Ethical Theory & Moral Practice, 13(5), 521-540.
[18] Mongin, P. (2000). Does optimization imply rationality? Synthese, 124(1), 73-111.
[19] Ramsey, F. P. (1990). Philosophical papers (D. H. Mellor, Ed.). Cambridge [England]: Cambridge UniversityPress.
[20] Resnik, M. D. (1998). Elecciones: una introducción a la teoría de la decisión. Barcelona: Gedisa.
[21] Roberts, F. S. (2009). Measurement theory: With applications to decision making, utility and the social sciences. Cambridge: Cambridge University Press.
[22] Santiago, J. M., & Cante, F. (2009). Intuición, sesgos y heurísticas en la elección. Cuadernos de Economía, 28(50), 1-34.
[23] Savage, C. W., & Ehrlich, P. (1992). A brief introduction to measurement theory and to the essays. En L. J. Savage & P. Ehrlich (Eds.), Philosophical and foundational issues in measurement theory. Hillsdale, N.J.: L. Erlbaum Associates.
[24] Savage, L. J. (1972). The foundations of statistics. Nueva York: Dover Publications.
[25] Simon, H. (1989). Naturaleza y límites de la razón humana. (E. Guerrero Tapia, Trans.). México DF [Mexico]: Fondo de Cultura Económica.
[26] Von Neumann, J., & Morgenstern, O. (2007). Theory of games and economic behavior. Princeton: Princeton University Press.
[27] Wakker, P. P. (2010). Prospect theory: For risk and ambiguity. Cambridge; Nueva York: Cambridge University Press.
[28] Wakker, P., & Tversky, A. (1993). An axiomatization of cumulative prospect theory. Journal of Risk and Uncertainty, 7(2), 147-175.
[29] Weirich, P. (2004). Realistic decision theory. Rules for non ideal agents in nonideal circumstances. Nueva York: Oxford University Press.
ACERCA DE LA CONDICIÓN NORMATIVA DE LA TEORÍA DE LA DECISIÓN RACIONAL
We hardly use the word ought in a metaphorical sense.
Charles Darwin, The Descent of Man (1874)
Giancarlo Romano G.1
1 Economista Universidad Nacional de Colombia. Estudiante de la Maestría en Filosofía de la Universidad Nacional de Colombia. Profesor becario, Facultad de Ciencias Económicas de la misma universidad. Miembro de los grupos de investigación Gitiace y GEAM. Correo electrónico gromanog@unal.edu.co. Dirección de correspondencia: carrera 30 No. 45-03, Universidad Nacional de Colombia, edificio 311, oficina 403 (Bogotá, Colombia).
Este artículo fue recibido el 14 de febrero de 2012, ajustado el 2 de julio de 2012 y su publicación aprobada el 28 de agosto de 2012.
Resumen
En este artículo se examina la condición normativa de la teoría de la decisión racional (TDR) en cuanto guía, marco analítico —para la evaluación normativa— y teoría —para la explicación/predicción— de la acción; además, se explica cuál es su justificación conceptual y preceptiva a través del concepto de racionalidad instrumental. Se controvierte la afirmación con la cual la Prospect Theory, de Kahneman & Tversky, pone en riesgo la condición normativa de la TDR, y se discuten algunas afirmaciones frecuentes y equivocadas acerca de su alcance teórico y su aplicación.
Palabras clave: normatividad, racionalidad, decisiones, utilidad esperada, Prospect Theory.
JEL: D03, D81.
Abstract
The article examines the normative condition of Rational Decision Theory (RDT) as a tool to guide the action, analytical framework for normative assessment of action and theory for the explanation/prediction of the action and give account of their conceptual and prescriptive justification by means of instrumental rationality. The paper argues against the claim according to which the Kahneman and Tversky's Prospect Theory threatens the normative status of the RDT. The article also discusses some common and mistaken claims about the proper theoretical scope and application of the RDT.
Keywords: Normativity, rationality, choice, expected utility, prospect theory.
JEL: D03, D81.
Résumé
Dans cet article on examine le caractère normatif de la théorie de la décision rationnelle [TDR] en tant que guide, cadre analytique –pour l'évaluation normative- et théorie –pour l'explication/prédiction- de l'action. Ensuite, on explique quelle est sa justification conceptuelle et préceptive à travers le concept de rationalité instrumentale. On contredit l'affirmation d'arpès laquelle la théorie Prospective [Prospect Theory] de Kahneman & Tversky met en péril la condition normative de la TDR, et on discute diverses affirmations fréquentes et erronées concernant sa portée théorique et son application.
Mots-clés: normativité, rationalité, décisions, gain espéré, Prospect Theory.
JEL: D03, D81.
INTRODUCCIÓN
En la vida cotidiana estamos habituados a los dictados normativos al realizar cualquier acción. Cuando jugamos ajedrez o póker seguimos las reglas de esos juegos, no de otra forma podríamos decir que los jugamos. El uso apropiado del lenguaje está regulado por normas formal o informalmente sancionadas. Al conducir por las calles de la ciudad nos acogemos a las leyes de tránsito y sabemos que seremos sancionados si las infringimos. De la misma manera, cuando tomamos decisiones acerca de qué elegir o qué curso de acción seguir, están presentes consideraciones normativas, tanto en la elaboración o en la formación misma de las decisiones como en su ejecución y en el contexto en el que se llevan a cabo.
Las consideraciones normativas son de especial importancia para entender las decisiones y las acciones de agentes a partir de la teoría de la decisión racional (TDR), en particular las relativas a su racionalidad, que son centrales para la comprensión cabal de la teoría y su apropiada aplicación. Sin embargo, el pensamiento y el lenguaje normativos con frecuencia tienen apariencia de ser descriptivos, lo que suele ocasionar confusiones y malentendidos que se expresan en críticas o defensas a la teoría, que no están soportadas en lo que la teoría puede legítimamente decir. Por ejemplo, Santiago & Cante (2009) (en adelante S & C) hacen una descripción y una crítica de la TDR en la que se evidencia el desconocimiento de la teoría y su estructura analítica; además, afirman que la Prospect Theory (PT) cuestiona el status normativo de la TDR sin mostrar en qué consiste tal estatus y cómo es que la PT lo cuestiona. En el caso de la TDR, tales equivocaciones se agravan cuando se confunden tres aspectos de la teoría que, si bien están estrechamente relacionados, son distintos: como guía, marco analítico -para la evaluación normativa- y teoría -para la explicación/predicción- de la acción 2. Dadas estas confusiones y la frecuencia con que se presentan, el presente trabajo tiene el propósito de formular qué es lo que se entiende por condición o estatus normativo de la TDR y su importancia para su adecuada comprensión. Además, se discute si dicho estatus es puesto o no en cuestión por la PT, como algunos analistas sostienen.
El artículo consta de cuatro partes adicionales a esta introducción. En la segunda se exponen los fundamentos de la TDR y el modelo de Utilidad Esperada (UE) siguiendo a Savage (1972), y se establece el estatus normativo de la TDR atendiendo a la distinción de los dominios explicativo/predictivo, normativo/evaluativo y prescriptivo de la teoría, teniendo presente el papel que juega en ellos el concepto de racionalidad práctica instrumental. En la tercera sección se discute y cuestiona el valor normativo de la PT, mostrando que a partir de ella se obtienen proposiciones en los dominios normativo/evaluativo y prescriptivo que conducen a serios problemas de evaluación y de deber. Esas proposiciones difícilmente pueden considerarse razonables y servir de base para construir principios que guíen la acción racional. En la cuarta sección se presenta una crítica a la concepción/descripción de la TDR realizada por S&C, cuyo propósito es hacer claridad en la exposición de ideas y contribuir a su debate informado y racional. En la quinta sección se concluye.
LA CONDICIÓN NORMATIVA DE LA TDR
El concepto de racionalidad se aplica a un amplio rango de cosas muy diferentes. En este trabajo nos centramos en la noción de racionalidad práctica, esto es, la relativa a qué hacer y cómo hacerlo de manera racional. En su acepción más básica, la noción de racionalidad práctica consiste en la resolución de problemas de decisión. Un problema de decisión surge cuando un agente cree que tiene un conjunto abierto de posibles acciones distintas, o que cada acción tiene un rango de posibles resultados, que pueden variar de acuerdo con ciertos estados del mundo y estar o no bajo el control del agente.
Un problema de decisión, entonces, tiene tres componentes: 1) los actos que un agente cree que tiene a disposición, 2) los resultados que un agente cree que pueden ocurrir y 3) los estados del mundo que, conjuntamente con el acto ejecutado, determinan un resultado. El problema de decisión consiste en decidir cuál de los posibles cursos de acción se llevará a cabo a la luz de la información disponible, esto corresponde al dominio de la TDR como guía para la acción (Bermúdez, 2009). Ahora bien, algunos cursos de acción son componentes de cursos de acción más extensos: ¿cómo ajustar dentro de esta descripción el hecho de que algunos cursos de acción hacen parte de otros más amplios?, ¿qué decir acerca de las ocasiones en las que no estamos seguros, no tenemos certeza, acerca de las características cruciales de nuestra situación?, ¿qué decir acerca de cursos de acción que se despliegan en el tiempo? La TDR ofrece una respuesta a estas preguntas y sugiere que los agentes han de elegir cursos de acción sobre la base de dos principios: ordenamiento débil e independencia.
La teoría de la decisión racional
Existen varias formulaciones de la TDR, aquí seguiremos (muy esquemáticamente) la de Savage (1972) en su Foundations of Statistics 3. En la teoría de Savage la incertidumbre se representa mediante un conjunto S de estados del mundo mutuamente excluyentes y conjuntamente exhaustivos que corresponden a descripciones completas de las circunstancias relevantes en el problema de decisión. Una vez se conoce el estado del mundo, toda incertidumbre se disipa, aunque el agente no sabe cuál estado se realizará. Los subconjuntos E de S se denominan eventos. El estado que se realiza se dice que es el verdadero estado. Asumimos que el agente no tiene influencia en la realización de estado alguno. El agente tiene a disposición un conjunto de acciones: . Los objetos de elección por parte de los agentes son actos f. El conjunto de todos los actos disponibles para la elección del agente es . A cada acto le siguen consecuencias, una para cada estado del mundo, que corresponden a los posibles resultados de una decisión después de que la incertidumbre se ha disipado, reunidas en el conjunto C. Formalmente, un acto en una función , que específica para cada estado la consecuencia que resulta si la acción a se elige y se realiza el estado s. Los resultados son estado-contingentes. Como los resultados que se siguen de un acto son inciertos ex ante, en la elección del agente los actos suelen llamarse apuestas (gambles), loterías o prospectos. Si la incertidumbre atañe a cuál de los países será el campeón de la próxima Copa Mundial de Fútbol, el conjunto de estados es donde si denota el estado el país i es el campeón, y es el evento en el que uno de los países 1, 2 o 3 gana la Copa.
Sobre el conjunto de actos el agente establece la relación binaria al menos tan bueno como, notada por , que determina sus preferencias sobre los actos. significa que el agente encuentra al menos tan preferible f a g, y que está dispuesto a elegir f (o posiblemente ambos) a partir del conjunto de elección . El principio de orden débil establece que el agente ordena el conjunto de actos con base en la relación binaria de preferencia , que es conexa (para todos los actos ) y transitiva (para cualesquiera actos , entonces ). Este orden es acontextualizado (context free), es decir, el ordenamiento completo de cualquier conjunto de prospectos puede construirse paso a paso mediante la combinación de información relativa a cómo el agente ordena vía preferencia pares de alternativas, cuando se le presentan de modo aislado unos de otros, hasta extender el orden sobre parejas a todo el conjunto de actos a elegir.
La idea detrás del principio de independencia, llamado por Savage la cosa segura (sure thing), es que la elección entre los actos f y g depende solo de las diferentes consecuencias en los estados en los que se comparan esos actos: estados en los que los actos tienen consecuencias idénticas no juegan ningún papel en la decisión. En el ejemplo anterior, supóngase que sabemos que el campeón de la Copa Mundial ha de encontrarse entre los países 1, 2 y 3. Un agente debe elegir entre las apuestas f y g que tienen los premios que se muestran en la Tabla 1.
Puesto que no importa cuál apuesta se elija si el país 1 gana, el principio de la cosa segura establece que la elección debe depender solo de los premios que esas apuestas tengan cuando gana un país distinto de 1. Si un agente prefiere f a g, y si el premio en s1 se incrementa en $10.000 tanto para f como para g, dando lugar a las apuestas f' y g', mientras que los premios bajo s2 y s3 permanecen iguales, entonces la elección de ese agente no debe cambiar. De manera formal, el principio de la cosa segura asevera que las preferencias entre dos prospectos son independientes de los estados en los que los dos tengan la misma consecuencia, esto es si y solo si , siempre que el conjunto de estados S pueda particionarse en dos: la parte I (el evento irrelevante) y la parte R (el evento relevante), de manera tal que f = g en I, y f = f' y g = g' en R (Fishburn & Wakker, 1995) (Tabla 2).
Es un resultado familiar que si las preferencias del agente y su comportamiento de elección satisfacen los principios de orden débil e independencia, así como otros requerimientos algo más técnicos -continuidad, reducción de prospectos, etc.-, entonces su comportamiento puede representarse mediante una función de utilidad sobre pagos monetarios o sobre prospectos bien definidos. Esto es, existe una función de valor real que representa la relación de preferencias , si para todo prospecto :
[1] |
Otro resultado es que, si las preferencias y el comportamiento de elección del agente satisfacen estos dos principios, en adición a un conjunto de postulados más técnicos, entonces sus creencias acerca de las posibilidades de realización de eventos pueden representarse mediante una medida de probabilidad subjetiva bien definida sobre conjuntos mutuamente excluyentes y conjuntamente exhaustivos de eventos. Es decir, estos axiomas implican que los grados de creencia subjetivos de los agentes acerca de la ocurrencia de tales eventos son representables como probabilidades que satisfacen los axiomas de una medida de probabilidad usual. Estos resultados se integran en un poderoso teorema: las preferencias del agente sobre consecuencias y acciones, y los grados de creencia respecto de los eventos condicionantes, pueden representarse respectivamente mediante una medida de utilidad y una medida de probabilidad subjetivas, tal que la valoración de cualquier acto, cuyos resultados están condicionados por eventos mutuamente excluyentes y conjuntamente exhaustivos, es equivalente a la utilidad esperada subjetiva de ese acto:
[2] |
Donde P(.) es una medida de probabilidad subjetiva sobre estados y es una función de utilidad que mide el grado en que los deseos del agente se satisfacen por la consecuencia resultante de la conjunción entre el estado s y la acción a. A U(.) se le puede entender como el estimativo o creencia que tiene el agente acerca de la posibilidad de que el acto f produzca las consecuencias que lo satisfacen.
Respecto de estos resultados, son necesarias tres observaciones de importancia para el apropiado entendimiento de la TDR.
Observación 1: Independencia probabilidades y utilidades
Ramsey (1990) y de Finetti (1980), en el espíritu del positivismo lógico, se propusieron ofrecer un fundamento que incluyera alguna clase de medición para las probabilidades subjetivas y las valoraciones de los resultados que hacen los individuos, con base en su disponibilidad para apostar. Esta última, a su vez, cimentada en las creencias que los individuos tienen acerca de la posibilidad de ocurrencia de eventos o en el grado de verdad que le confieren a una hipótesis de acuerdo con la evidencia que la apoya.
Ramsey y de Finetti sugirieron que un agente razonable se comporta como si tuviera una distribución de probabilidad subjetiva para guiar sus decisiones y derivaron el concepto de probabilidad subjetiva a partir de una noción de utilidad como idea primitiva.
Von Neumann & Morgenstern (2007) trabajaron en sentido inverso, derivaron una definición de utilidad, conjugada con la hipótesis de UE, basada en una noción de probabilidad objetiva y exógenamente dada como concepto primitivo de la teoría. Las nociones de utilidad y probabilidad definidas de esta manera son interdependientes, lo que puede ser problemático para la realización del trabajo empírico y de medición. Este problema fue resuelto por Savage (1972), quien no partió de nociones de probabilidad ni de utilidad, sino que elaboró la teoría a partir de lo que sería racional para un agente elegir. Savage parte de un patrón consistente de elecciones entre actos y después obtiene medidas de utilidad de probabilidad. Así, la racionalidad se entiende en términos de consistencia en las elecciones y los datos importantes provienen de la preferencia revelada a través de la elección. La noción de preferencia no tiene un contenido distinto a sus manifestaciones comportamentales en elecciones reales o en disposiciones a elegir de los agentes. Esta forma de concebir el problema tiene dos implicaciones importantes. Una asociada al problema de la medición como parte central del trabajo científico y, en particular, a la medición de utilidades requerido para el desarrollo de la teoría económica y de las políticas que se desprenden de ella (Observación 2), y otra asociada al supuesto de la maximización como precepto fundamental de comportamiento de los agentes económicos (Observación 3).
Observación 2: El problema de la medición y la medición de utilidades
Entender la racionalidad en términos de consistencia en las elecciones y de las disposiciones a elegir de los agentes vincula de modo automático, conceptual y lógicamente la TDR con la teoría representacionalista de la medición. Este es un aspecto clave para los desarrollos teóricos pero sobre todo empíricos de la TDR, por cuanto se le da una base firme a la cuestión de la medición de la utilidad e, igualmente, despeja las dudas y especulaciones acerca de la naturaleza de la utilidad, pues esta queda reducida a una escala de representación de las preferencias de los agentes.
El enfoque representacionalista concibe la medición como la asignación de números a entidades y eventos para representar sus propiedades y relaciones. La teoría considera el concepto de escala de medición, describe varios tipos de escalas, sus usos, y formula las condiciones necesarias para su existencia. En breve, la perspectiva representacionalista de la medición parte de considerar una estructura empírica relacional no-numérica, consistente en un conjunto de entidades no-numéricas D y un conjunto de relaciones que incluyen operaciones y objetos destacados, T1, T2, … , Tl, sobre D. Una estructura relacional numérica (abstracta) es un conjunto de entidades numéricas N, junto con las relaciones R1, R2, … , Rm sobre N. Una escala de medición, , es una función que preserva la relación (un homomorfismo) de la estructura relacional no-numérica en la estructura relacional numérica. El tipo de la estructura relacional es definido por el número y el grado de relaciones en la estructura, y el tipo de escala se define como el tipo de estructura relacional numérica mapeada por las transformaciones que soporta la escala y que preservan las relaciones subyacentes al mapeo.
La primera tarea de la teoría formal de la medición consiste en establecer de manera precisa las condiciones requeridas para la existencia de escalas de distintos tipos, esto es, establecer y probar los teoremas de representación que afirman la existencia de ciertos tipos de escalas y si las estructuras relacionales no-numéricas en consideración satisfacen cierto conjunto de condiciones. La segunda tarea estriba en determinar y precisar las clases de transformaciones de escala admisibles para los distintos tipos de escalas, es decir, las transformaciones que producen una nueva escala que mapea las mismas relaciones que la función original.
En la TDR el conjunto de entidades no-numéricas N se corresponde con los conjuntos de estados S, eventos E y actos . Las relaciones T1, T2, …, Tl se corresponden con la estructura de preferencias observables empíricamente en las elecciones de los agentes. Los teoremas de representación están dados por las expresiones [1] y [2], y las escalas por las funciones U(.) y . Ahora bien, si a partir del comportamiento observable de elección se define el concepto teórico de función utilidad, ¿hay una única función de utilidad compatible con un conjunto de datos de elección o pueden haber varias funciones, y cada una de ellas suministra una descripción de esa utilidad respecto a tal conjunto de datos?, esto es, ¿qué clase de escalas son estas funciones de utilidad?, ¿son empíricamente implementables, es decir, podemos medir efectivamente esas utilidades?
Por lo general, las magnitudes físicas pueden medirse con al menos un grado de libertad, es decir, eligiendo las unidades de medida en la escala de medición. Así, podemos medir el peso en kilos o en gramos, o la distancia en kilómetros o millas. En algunos casos se tienen más grados de libertad en la elección de la escala, como cuando se eligen las unidades de medida y la ubicación de un cero referencial, como es el caso de la temperatura (Celsius o Fahrenheit) o la altura de la superficie de la tierra sobre el nivel del mar. Cuando se trata de la medición de la utilidad lo que queremos representar mediante funciones o escalas de medición son órdenes de preferencia entre objetos contingentes, esto es, prospectos. Si para un agente el acto f es preferido al g y el g es preferido al h estamos diciendo que para él la utilidad del acto f es mayor que la utilidad de g, que a su vez tiene una utilidad mayor que h, y deberíamos obtener las mismas implicaciones observables si fijamos los respectivos valores de utilidad de esos actos en (10, 1, 0), (10, 7, 0) o (90, 54, 2). El hecho de que a la primera alternativa se le puede asignar el número 10 o 90, o que el rango de los valores de utilidad sea de 10 u 88, no tiene manifestaciones observables. Del mismo modo, no hay implicaciones observables para la comparación de una reducción en la utilidad entre f y g frente a una de g y h. Los valores de utilidad solo significan que la primera alternativa es preferible a la segunda y ambas son preferibles a la tercera. Esta es la escala ordinal de prospectos U(.), que no tiene unidades de medida y solo admite transformaciones monótonas que no alteran la validez de la representación del orden de la escala. Por tanto, , con creciente, representa el mismo orden que U(.).
Podemos pedirle a un agente que clasifique en orden de preferencia un conjunto de resultados y que después compare qué tanto más deseable es cada resultado que el siguiente en el orden. Si para un agente la diferencia de deseabilidad entre los resultados A y B es igual a la diferencia de deseabilidad entre los resultados B y C, entonces estas diferencias tienen implicaciones observables: a este agente le será indiferente obtener B con seguridad y una lotería que tiene por resultados A y C, cada uno de ellos con probabilidad de 50%. La igualdad entre estas dos diferencias tendrá que ser respetada por cualquier función de utilidad que pretenda tener en cuenta y representar adecuadamente estas diferencias en las preferencias. En consecuencia, una vez establecida una función de utilidad para los resultados descritos, la escala de medición que representa diferencias de deseabilidad es aquella a la que se le puede añadir cualquier número y multiplicarse por un número positivo, y los ordenamientos de tales diferencias se mantendrán inalterados. Esta es la escala de ordenamiento de preferencias sobre resultados, y ordenamiento de preferencias sobre diferencias entre resultados, cuya escala de medición es de intervalo: este tipo de escala solo admite transformaciones afines, u' = k1 u + k2 con , que no alteran la validez de la representación. En este caso se tienen unidades de medida (útiles, por ejemplo) y un cero referencial arbitrario.
De lo anterior se deduce que si queremos encontrar una función de utilidad real para un agente real y concreto, podemos hacerlo eligiendo los valores de utilidad de dos alternativas de forma arbitraria, siempre y cuando se le asigne a la mejor alternativa un número mayor. No importa si estos dos números son 0 y 1, 5 y 23 o -7, 6 y 1, 8. Lo que importa es que el segundo número sea mayor que el primero. Los valores de utilidad de todas las alternativas estarán definidos de forma única dados estos dos números, y los teoremas de representación en [1] y [2] sugieren las formas en que podemos encontrar esos valores intermedios, con el grado de precisión deseado. Si sabemos cuáles son las preferencias de un agente entre los pares de prospectos que involucran solo tres resultados, tendremos una única manera de definir sus preferencias entre cualquier par de prospectos. Más aun, para medir esas preferencias basta con conocer, de un lado, las preferencias del agente sobre resultados seguros, y de otro, sus preferencias sobre un par de loterías con dos posibles resultados.
Observación 3: Maximización como precepto comportamental
De otra parte, la TDR no prescribe maximizar la utilidad esperada de las elecciones de los agentes. Si las preferencias de un agente están en conformidad con los axiomas de la teoría, esta permite construir una función expectacional de utilidad para él. La función siempre asignará un mayor número a las opciones que él prefiere y a cada opción contingente le asignará su utilidad esperada. Si sus preferencias están en consonancia con los axiomas de la teoría, la maximización se hará cargo de sí misma, por así decirlo, en la medida en que el agente elige lo que prefiere. Si las preferencias del agente no se ajustan a los axiomas de la teoría, entonces la construcción de una función expectacional de utilidad fallará. Lo único que la teoría les pide a los agentes es que sus elecciones sean coherentes. Desde esta perspectiva, una labor de carácter normativo de la racionalidad práctica en la TDR, es fijar, como de hecho lo hacen los axiomas, las condiciones de coherencia en las elecciones. Estamos en el dominio de la TDR como marco analítico para la evaluación normativa de la acción.
La condición normativa de la TDR
La noción de racionalidad práctica consiste en la resolución de problemas de decisión, esto es, decidir cuál de los posibles cursos de acción se llevará a cabo a la luz de la información disponible, estamos en el dominio de la TDR como guía para la acción (Bermúdez, 2009). El material de trabajo para una teoría de la racionalidad práctica en este dominio es la información que el agente tiene acerca de los actos disponibles y de las posibles condiciones del mundo, relevantes para el problema de decisión que quiere resolver, en conjunto con sus actitudes hacia los posibles resultados. Una primera labor que se le encomienda a la racionalidad práctica en la teoría es la de identificar un subconjunto de opciones disponibles en un problema de decisión, que le proporcionen al agente el mejor prospecto para realizar sus objetivos, en relación con la información de que dispone. Esto es, una noción de racionalidad instrumental que permita la resolución de problemas de decisión mediante un razonamiento de la siguiente estructura. El agente tiene la intención de conseguir un fin. Se forma unas creencias acerca de qué medios están disponibles para conseguirlo y cuáles de esos medios son mejores o peores en relación con otros. Además, elegirá aquellos que cree que no son peores que otros. ¿Qué es creer que cierto curso de acción está disponible? Creer que cierto curso de acción está disponible tiene dos componentes: a) el agente debe considerar que es al menos epistémicamente posible que tenga la intención de un cierto curso de acción, y b) el agente debe tener una creencia condicional confiable según la cual, de hecho, tomará ese curso de acción si tiene la intención de hacerlo.
¿Qué es creer que uno de esos posibles medios para alcanzar el fin es mejor que otro? No es necesario creer que ese medio es el más eficaz en la consecución del fin. La manera más efectiva de lograr un objetivo, con no poca frecuencia, puede ser demasiado costosa para contar como la mejor, ni siquiera como una de las mejores maneras de lograr el objetivo. Basta con que para el agente lo mejor o lo más sea aquello que es valioso o digno de ser elegido por él. Así, tomar un cierto curso de acción A como medio para cierto fin F es llevar a cabo una intención de tomar dicho curso de acción A con el fin de conseguir el fin F. Cuando el agente tiene la intención de tomar el curso de acción A con el fin de lograr un fin F, su intención de tomar A es, de alguna manera, subordinada a su intención de conseguir F. La intención del agente de conseguir el fin F controla o guía el modo en que toma el curso de acción A. Esto no implica, por supuesto, que dos agentes distintos se formen las mismas creencias y elijan los mismos cursos de acción, aun cuando persigan el mismo fin y cuenten con la misma información.
Así, y de acuerdo con la Observación 3, la TDR puede pensarse normativamente como una teoría de la coherencia de la racionalidad práctica. Ahora bien, desde una perspectiva pragmática, esto es, que atiende a las consecuencias que se siguen de las elecciones, la falta de coherencia de sus elecciones ponen al agente en una situación en la que falla en el logro de los objetivos que tiene la intención de alcanzar. Esto conduce a un principio de racionalidad normativo que expande la noción de racionalidad práctica más allá de la simple consistencia en la elección a una concepción pragmática de la elección: un principio de elección es válido si el fracaso de un agente en su adhesión a este resulta en la elección de medios insuficientes para la consecución de los fines deseados, en la persecución menos efectiva de esos fines de lo que podría, bajo las circunstancias en las que actúa el agente (McClennen, 2008, p. 4).
Nótese que hemos vuelto a una noción de racionalidad instrumental, pero ampliada. Ejemplos claros de este punto de vista son las consecuencias que se desprenden de la violación de los principios de orden débil e independencia. Así, un agente puede verse en una situación en la que acepta una combinación de apuestas monetarias que, independientemente de cómo se desenvuelvan los eventos que condicionan sus apuestas, indefectiblemente termina perdiendo dinero (the Money Pump argument); o puede encontrarse en una situación de elección dinámica en la que lo que preferiría elegir ahora en un momento posterior no es lo que preferiría elegir una vez llegado ese momento. En consecuencia, normativamente hablando, un agente racional debe adherir a estos principios: ello le garantiza consistencia en las elecciones y no le impide la consecución de sus fines.
Además de identificar un subconjunto de opciones disponibles en un problema de decisión, que proporcione al agente la mejor manera de cristalizar sus objetivos en relación con la información de que dispone, de manera tal que sea consistente en sus elecciones, a la racionalidad práctica en la TDR también se le confía que suministre los criterios para determinar cómo se resuelven los problemas de decisión. A partir del dominio de guía para la acción de las elecciones racionales se han mantenido estables los fines del agente y la información que posee. También se han dado por sentadas sus evaluaciones de los actos disponibles, las posibles condiciones relevantes del mundo y sus actitudes hacia los resultados esperados. Así, las actitudes y evaluaciones de los agentes fijan los parámetros de los problemas de decisión, y la noción de racionalidad práctica en el dominio de guía para la acción solo puede aplicarse una vez tales parámetros se fijan (Bermúdez, 2009).
Pero, podemos preguntarnos acerca de la racionalidad de cómo se fijan esos parámetros, y de la racionalidad de cómo se realizan las elecciones una vez los parámetros han sido fijados. Esto nos lleva considerar: cómo y qué tan bien el agente recaba información pertinente acerca de los resultados; cómo determina sus valoraciones de los estados y contingencias y los estimativos de sus posibilidades de ocurrencia; y cómo se conectan estos con los primeros, dada la subordinación de todo ello a la consecución de sus fines. Lo que nos conduce, por último, a conectar las motivaciones para la acción de un agente y la acción misma expresada en su comportamiento de elección.
De acuerdo con Davidson (1995), una acción se explica si las creencias, deseos y otros estados mentales ofrecen una caracterización psicológica de lo que dio lugar a la acción del agente. En la identificación de tales estados psicológicos, se supone que quien explica la acción está guiado por una hipótesis de racionalidad, esto es, los estados psicológicos a los que apela deben ser tales que la acción es racional a la luz del perfil psicológico del agente. También en la predicción de la acción de un agente, quien predice está guiado por el supuesto de lo que sería racional para ese agente hacer. Ciertamente, una acción es compatible con una infinidad de perfiles psicológicos, y cualquiera de estos puede expresarse en una infinidad de acciones. La hipótesis de racionalidad, entonces, actúa como una restricción que reduce las dimensiones de variación de la acción. La satisfacción de una condición de racionalidad es una condición necesaria, más no suficiente para la explicación y la predicción de la acción.
Así, la hipótesis de racionalidad es la única manera de cerrar la brecha entre el perfil psicológico del agente y su comportamiento. Esto es, requerimos de una noción de racionalidad para explicar y predecir el comportamiento de elección, necesaria para establecer los vínculos entre deseos, creencias y acciones, en función de los fines a lograr y los medios requeridos para conseguirlos. La TDR es una teoría formal en la que se conjugan esos elementos.
Nótese cómo el razonamiento, en distintos niveles y enfocado en distintas necesidades normativas, gravita alrededor de la noción de racionalidad instrumental y la refina. En síntesis, y a la luz de las Observaciones 1, 2 y 3, podemos establecer el estándar normativo de la TDR como sigue. Un agente es racional cuando responde a la información que tiene, con a) creencias racionales acerca de qué medios están disponibles para conseguir un fin, b) creencias racionales acerca de cuáles de esos medios son mejores y cuáles peores, y c) que las intenciones sean consistentes con tales creencias racionales. Además, que las intenciones del agente sean consistentes con sus creencias implica que él nunca debe tener: a) la intención de conseguir un fin, b) creer que en un cierto conjunto de alternativas cada una de ellas es un medio disponible y óptimo para ese fin y, a pesar de ello, c) no tener la intención de elegir entre ninguno de esos medios, por lo menos en tanto que d) él también crea que no conseguirá ese fin de manera óptima, a menos que se decida por uno de esos medios. El estándar requiere que las preferencias, determinadas a partir del comportamiento de elección de los agentes, estén en conformidad con los axiomas de la TDR, de manera que sus elecciones sean consistentes sin impedir la consecución de sus fines.
ALGUNAS IMPLICACIONES NORMATIVAS DE LA PROSPECT THEORY
Para ciertos analistas, por ejemplo S&C, la falta de congruencia con los hechos de algunas proposiciones descriptivo/explicativas de la TDR pone en entredicho su condición normativa, tal y como se formuló en la sección anterior. Esto es equivocado, veamos por qué. La condición normativa de una teoría se pone en cuestión si 1) la extensión del dominio normativo/evaluativo de la teoría es insuficiente para los propósitos de la misma, esto es, no abarca casos importantes para los que se espera una formulación normativa por parte de la teoría que ella no permite, 2) tiene implicaciones normativas indeseables, es decir, que contradicen nuestros juicios de deber mejor fundamentados y 3) se muestra que los fundamentos justificativos de la condición normativa son insostenibles. Cuestionar el estatus normativo de la TDR requiere hacer evidentes los puntos 1) a 3). La PT, en cuanto teoría de la toma de decisiones, no tiene el propósito de socavar normativamente la TDR, como lo veremos más adelante. No obstante, podemos mostrar que hay implicaciones normativas de la PT inconvenientes en términos de deber y guía de la acción. Para ello, describamos la PT primero. La descripción de la PT y las citas que siguen se basan en Kahneman & Tversky (2000) (en adelante K&T).
Una característica fundamental de la PT, a diferencia de la UE, es que los agentes perciben los resultados como pérdidas y ganancias con respecto a un punto de referencia r es decir, no evalúan estados finales sino los cambios respecto a un estado referente, generalmente un statu quo dado por la situación en la que se encuentra el agente. Una ganancia es estrictamente preferida al punto de referencia y una pérdida se prefiere menos que el punto de referencia. La desutilidad de una pérdida x es mayor que la utilidad de una ganancia x, sean unas u otras efectivas o potenciales, fenómeno que es conocido como aversión a las pérdidas. Esto implica que los agentes son aversos al riesgo en el dominio de las ganancias y propensos al riesgo en el dominio de las pérdidas. La PT asume que las contingencias se evalúan no por probabilidades sino por ponderaciones de probabilidad, modeladas por funciones w(p) no lineales, no aditivas, continuas y crecientes que asignan ponderación 0 a p = 0 y ponderación 1a p = 1; generalmente, de acuerdo con la evidencia empírica, son cóncavas para probabilidades bajas (usualmente menores a 0,2, interpretadas como sobrestimación de la contingencia de eventos poco probables) y convexas para probabilidades altas (mayores a 0,2, interpretadas como subestimación de la contingencia de eventos significativamente probables).
Estas ponderaciones de probabilidad no pueden tomarse como probabilidades ni medidas de grados de creencia, pues miden el impacto de eventos en la deseabilidad de los prospectos, además de ser evaluaciones de las posibilidades de ocurrencia de contingencias. La PT admite que las ponderaciones de probabilidad asociadas a ganancias sean diferentes a las ponderaciones asociadas a pérdidas (w–). Bajo PT los prospectos L = (A:p, B:1 – p) con resultados A o B y probabilidad p de que se obtenga A cuando involucran ganancias y pérdidas , se evalúan así:
[3] |
Donde V(.) es una función de utilidad sobre prospectos correspondiente a una escala de medida ordinal; u(.) es una función de utilidad sobre resultados correspondiente a una escala de medida de intervalo y es un coeficiente que refleja la aversión a las pérdidas. Por último, K&T postulan que los agentes están a merced de distintos sesgos cognitivos y perceptuales que afectan sus decisiones. ¿Qué consecuencias normativas pueden derivarse de esta perspectiva de la decisión? Veamos dos casos ilustrativos, suficientes para mostrar los serios problemas de evaluación y de deber a que conduce la PT.
Caso 1: Framing effects
Uno de los sesgos más frecuentes en las decisiones es el framing effect, el cual expresa que las variaciones irrelevantes en la descripción de problemas de decisión, que no cambian su estructura lógica o conceptual subyacente, tienden a modificar las decisiones de los agentes -como consecuencia de las variaciones en la descripción-. En particular, puede inducirse a los individuos a ver los mismos hechos, bien como una ganancia o bien como una pérdida, variando la descripción del problema de decisión, de tal manera que se altere el punto de referencia. Así, lo que era una ganancia con respecto a la referencia inicial será una pérdida con respecto a la referencia redescrita, sin que haya cambiado la estructura del problema. Debido a la susceptibilidad de los framing effects, las personas escogerán de manera inconsistente, esto es, realizarán elecciones diferentes y opuestas en problemas de decisión esencialmente idénticos, como ocurre en el famoso caso de la enfermedad asiática (Kahneman & Tversky, 2000).
Si juicios acerca de lo correcto o incorrecto, debido o indebido, justo o injusto, permisible o impermisible, o del mayor o menor valor de una decisión dependen de la percepción de pérdidas y ganancias, y si los framing effects afectan esas percepciones, entonces esos juicios no tienen ningún significado normativo, por cuanto no hay una guía prescriptiva clara de qué hacer ni de cómo evaluar lo hecho, pues una y otra cosa son contingentes a la descripción que se haga del problema de decisión. Esto es algo que requiere de especial cuidado, por ejemplo, en el diseño, implementación y evaluación de políticas públicas, en las que con frecuencia se deben establecer pérdidas y ganancias, incluir los intereses, grupos, etc. concernidos por ellas y que, por lo mismo, requieren, en principio, partir de valoraciones normativas claras de la situación a cambiar y de la naturaleza del cambio a realizar. Estos problemas se agudizan cuando hay interacción estratégica, pues los puntos de referencia, las pérdidas y las ganancias son estratégicamente manipulables. Esto muestra, de paso, una importante debilidad teórica de la PT: la indeterminación de los puntos de referencia y, por implicación, de las pérdidas y ganancias, y de los efectos e incidencia de la aversión a la pérdida en las decisiones.
Caso 2: Pérdidas y ganancias como portadores de utilidad
Suponiendo que riqueza y bienestar estén asociados, consideremos las siguientes situaciones. Un individuo a) acaudalado ve reducida su riqueza a un nivel medio, debido a que sufre una gran pérdida, o b) se mantiene en un nivel medio de riqueza debido a que no ganó una suma que lo haría muy rico, y c) un individuo se mantiene en un nivel bajo de riqueza debido a que no ganó una suma moderada. Bajo PT nos vemos forzados a concluir que el individuo en las situaciones a) y b) está en peor condición de bienestar que el individuo en c), aun cuando en c) la persona permanece en un nivel mucho más bajo de riqueza en términos absolutos que la persona en a) o b).
Ahora consideremos dos individuos (1 y 2), uno con riqueza A y otro con riqueza B, con . Al primero se le impone un tributo sobre A, con el fin de transferirlo al segundo. Supongamos que al primer individuo la tributación le genera una pérdida de x, mientras que al segundo la transferencia le genera una ganancia de x + a, tal que la situación final es . Bajo PT, la mayor ganancia de 2 se valora menos que la menor pérdida de 1, esto es, la PT puede proscribir la tributación progresiva.
En las situaciones descritas, la razón que sustenta tales valoraciones normativas es que en la PT son los cambios en los resultados y no los resultados finales los portadores de utilidad, y que las pérdidas cuentan más que las ganancias. Más aun, las medidas que se ocupen de los individuos en peor situación son claramente no favorecidas por la PT, por cuanto no hay forma de justificar un criterio maximin a partir de ella. No obstante, debido a que las pérdidas y ganancias se ven afectadas por ponderaciones de decisión distintas, puede ser que la importancia que se le asigna a reducciones en el decrecimiento del ingreso sea mayor que la asignada a los aumentos en el crecimiento del ingreso.
Estos casos sugieren que las teorías centradas en los estados finales como portadores de utilidad, como la UE -en vez de estar centradas en cambios en los estados finales, también como portadores de la utilidad, como la PT-, son normativamente más razonables y, en ciertos casos, pueden ser descriptivamente más útiles.
CRÍTICA A SANTIAGO & CANTE
Juan Santiago y Freddy Cante publicaron en Cuadernos de Economía el artículo "Intuición, sesgos y heurísticas en la elección" (2009), en el que hacen una crítica a la TDR y al modelo de UE. La crítica se basa en la insostenibilidad de lo que llaman racionalidad perfecta (p. 2) y los supuestos que la sustentan. La racionalidad perfecta consiste en "que los individuos tienen una consistencia lógica entre medios y fines y, por tanto, suponen la posibilidad de optimizar en el momento que el agente decide, y a medida que pasa el tiempo […] sea en un contexto de certeza, en uno riesgoso o en uno incierto" (p. 5).
De acuerdo con S&C, la racionalidad perfecta se materializa en el modelo UE, y la insostenibilidad de una y otro obedece a un problema de incongruencia empírica: los postulados de la teoría acerca de las capacidades de los agentes no son consistentes con los hechos, debido a "las limitaciones cognitivas de los agentes en el proceso de elección observadas", y a que las decisiones humanas "son producto de la intuición (escogencia automática), y no de prolongados y sofisticados procesos de elección racional [y] la inconsistencia de las preferencias a lo largo del tiempo" (p. 3). En consecuencia "la racionalidad, en el sentido estrecho que la define la Teoría de la Elección Racional, no puede explicar todos los fenómenos que se le pide que explique" (p. 2), en particular el equity premium puzzle, el efecto disposición, entre otros (pp. 25-28).
Además de la crítica a la TDR, S&C hacen un contraste entre el modelo de UE con el modelo PT de K&T, en sus versiones sencilla y acumulativa. A partir del contraste entre las dos teorías, S&C invitan a pensar en el abandono del modelo UE y en la adopción del modelo PT, por cuanto este permite superar las limitaciones y fallas explicativas/predictivas de la UE, a través de la introducción de ciertas características de la psicología de la decisión, como la racionalidad limitada de los agentes, los puntos de referencia, la evaluación diferencial de pérdidas y ganancias, entre otras, que hacen a la PT descriptivamente mejor que la UE.
Sin duda la TDR y el modelo de UE son problemáticos, y una muestra de ello es la incongruencia empírica que los autores denuncian. Sin embargo, tanto la descripción como la crítica que hacen S&C de la TDR evidencian un profundo desconocimiento de la teoría, de su estructura analítica, del sentido conceptual de sus elementos componentes, de las relaciones entre los mismos y de sus implicaciones en la explicación de la elección de los agentes y, en consecuencia, del alcance y las limitaciones de la teoría, de lo que ella puede decir legítimamente. Así, confunden los dominios de la TDR como guía, marco analítico -para la evaluación normativa- y teoría -para la explicación/predicción- de la acción.
Los autores también hacen afirmaciones fuertes sin ofrecer razones y argumentos que las justifiquen, tales como "la Teoría de Prospectos enfocada en los aspectos psicológicos que afectan la elección individual, cuestionan el status normativo de la Teoría de la Elección Racional" (extraído del resumen del artículo, p. IX), sin mostrar en qué consiste tal estatus normativo y cómo es que la PT lo cuestiona. No obstante las deficiencias del artículo, su publicación constituye una oportunidad para hacer claridad en la exposición de ideas y su debate informado y racional.
De acuerdo con Anscombe (2000), podemos distinguir dos tipos de estados mentales. De un lado están las creencias o estados cognitivos, en los que la intención del agente es adaptarse al mundo tal como es; si una creencia no se ajusta al mundo, es falsa y tiene que rechazarse. De otro lado están los deseos o estados conativos, en los que la dirección de ajuste con el mundo es inversa a la de las creencias, un deseo se satisface o realiza cuando el mundo se ajusta a este. Reconocer esta distinción es entender por qué los deseos y las creencias son distintos, y que lo que motiva a actuar a las personas son sus deseos, metas y aspiraciones. En la TDR las creencias se forman sobre los medios para realizar esos deseos y cómo aquellos se conectan con sus fines. Asimismo, hay tantos fines como agentes, y aun más, un mismo agente puede tener más de un fin (p. ej., una persona puede querer ser a la vez un gran actor y un buen padre, una empresa puede querer tener la mayor cuota de mercado y proteger el ambiente, etc.). Por tanto, cuando S&C afirman que la TDR "evita considerar la diversidad de valores" (p. 6), no reconocen que las personas tienen fines diversos distintos a la maximización de la utilidad; además, no solo afirman algo contrario a lo postulado por la teoría, que reconoce la infinidad de fines y valores que los agentes puedan perseguir, también confunden deseos con creencias, cómo unos y otros se articulan en la acción de los agentes y qué juicios se forman ellos acerca de los medios para su consecución.
Igualmente, S&C se contradicen cuando acusan a la teoría de no permitir diversidad de valores, pero a su vez le reclaman que pueda servir a valores distintos como los de Hitler y Gandhi (p. 6), que son diversos, independientemente de su contenido moral. La contradicción de S&C es aun más patente cuando afirman, en acuerdo con Herbert Simon, que "por su parte H. Simon (1989, p. 22) muestra que la teoría de la utilidad esperada abarca toda la diversidad de valores humanos (razones, sentimientos, pasiones e intereses diversos) dentro de una sola función" (p. 15). ¿Si la TDR "evita considerar la diversidad de valores" como es que también "abarca toda la diversidad de valores humanos"?
Respecto a si la PT cuestiona la condición normativa de la TDR, S&C no advierten que cuestionar tal condición requiere mostrar los puntos 1) a 3) de la sección anterior, cosa que no hacen, y no se percatan de que la PT no tiene el propósito de subvertir los fundamentos normativos de la TDR, de hecho K&T tratan el modelo UE como estándar normativo, pese a que lo rechazan como modelo explicativo/predictivo de las decisiones:
These departures from expected utility theory [certainty effect, isolation effect] must lead to normatively unacceptable consequences, such as inconsistencies, intransitivities, and violations of dominance. Such anomalies of preference are normally corrected by the decision maker when he realizes that his preferences are inconsistent, intransitive, or inadmissible. (Kahneman & Tversky, 2000, p. 31, énfasis añadido)
Más aún, K&T reconocen que los dominios explicativo/predictivo y normativo/evaluativo no solo son distintos, sino irreconciliables el uno con el otro. El primero atañe a lo que es y el segundo a lo que debe ser, y lo que afecta a un dominio no tiene implicaciones sobre el otro, debido a la incomunicabilidad lógica y empírica entre ambos:
We argue that the deviations of actual behavior from the normative model are too widespread to be ignored, too systematic to be dismissed as random error, and too fundamental to be accommodated by relaxing the normative system. […] We conclude from these findings that the normative and the descriptive analyses cannot be reconciled (p. 210, énfasis añadido) […] Consequently, the dream of constructing a theory that is acceptable both descriptively and normatively appears unrealizable (p. 220).
Por tanto, contrario a lo sostenido por S&C, que la TDR presente incongruencias empíricas entre las predicciones que resultan de ella y la evidencia de su contraste efectivo no afectan el estatus normativo de la teoría, independientemente de donde venga el reclamo empírico.
Incluso S&C suelen confundir los dominios normativo/evaluativo y descriptivo/explicativo, dos ejemplos claros son: "Uno de los méritos de Kahneman & Tversky es su trabajo empírico […], lo cual rompe con la estéril metodología de la abstracción suprema (mediante la cual se supone, cual un acto de fe, que los individuos se comportan conforme a los principios prescriptivos de la teoría de la elección racional)" (p. 15, énfasis añadido); "Divergencias entre teorías positivas y normativas surgen a cada momento […] La Teoría de Prospectos contiene al menos tres elementos que pueden explicar varias predicciones contraintuitivas ofrecidas por los modelos normativos" (p. 28). Por tanto, la PT no pone, no puede poner en cuestión el estatus normativo de la TDR. Sin embargo, dadas las cualidades explicativas/predictivas de la PT, Bleichrodt, Pinto & Wakker (2001) han hecho uso de ella para mejorar la capacidad prescriptiva de la UE. Allí, dado que los distintos métodos de obtención y medición de utilidades bajo UE generan resultados significativamente distintos cuando deberían ser los mismos (no hay invarianza procedimental), es posible corregir los sesgos de obtención y medición de utilidades bajo UE, mediante cuidadosas aplicaciones de las funciones de ponderación de decisiones y coeficientes de aversión a las pérdidas. Los resultados experimentales de estos autores sugieren que esas correcciones mejoran de manera importante la capacidad prescriptiva de las aplicaciones de la UE, en especial en la toma de decisiones en salud, en el análisis costo-utilidad de tecnologías sanitarias.
De otra parte, S&C afirman que "dentro de la Teoría de la Utilidad Esperada, un problema persistente ha sido la noción de la utilidad y la posibilidad de su medición, problema soslayado asumiendo la imposibilidad de una medición 'objetiva' para un fenómeno 'subjetivo'." (p. 3, énfasis añadido). Esta afirmación solo puede obedecer al desconocimiento de los desarrollos de las teorías económica, de la decisión y la medición. De acuerdo con lo expuesto en la Observación 2, en los enfoques de la medición es irrelevante que las entidades a medir sean objetivas o subjetivas, pues de lo que se trata es de asignar números a un conjunto de entidades y de relaciones, cualquiera que sea su naturaleza. Por ejemplo, medir la carga eléctrica de una partícula atómica, la energía liberada por una reacción química, el grado de adaptación de una especie a su entorno, el nivel general de precios, la inteligencia o las actitudes de un agente, son en última instancia lo mismo: lo que cambia son los métodos de medición, los instrumentos utilizados y lo considerado como error de medición.
Por otra parte, las preocupaciones epistémicas, pragmáticas y de política económica por medir la utilidad no han sido un problema soslayado, por el contrario, ha ocupado buena parte de las reflexiones de los economistas y los teóricos de la decisión. Dos ejemplos prominentes son Edgeworth y Fisher, quienes discutieron el problema de la medición de la utilidad y la relevancia de fundamentarla en la psicología de los agentes o en su comportamiento de elección. Edgeworth fue partidario de lo primero, dado su compromiso con el utilitarismo, mientras que Fisher fue partidario de lo segundo (Colander, 2007).
Desde el paso del cardinalismo utilitarista al ordinalismo abstracto y hasta hoy los fundamentos de la teoría de la utilidad y su medición han sido parte central de la labor teórica y empírica de los economistas, naturalmente aun hay problemas por resolver (Mandler, 1999). A manera de ejemplo, tal vez el área donde más se hacen mediciones de utilidad y en la que mejor se conjugan los propósitos teóricos y aplicados, epistémicos y pragmáticos, es en la economía de la salud, en particular en la valoración de estados de salud y la evaluación de calidad de vida asociados a ellos (Brazier, Racliff, Salomon & Tsuchiya, 2007).
Por último, son importantes algunas observaciones generales respecto a la relación entre la TDR y las decisiones morales, tópico sobre el que S&C hacen declaraciones objetables, bajo la tutela de la autoridad intelectual, sin preguntarse si tales declaraciones tienen fundamento o no. La condición normativa/evaluativa de la TDR establece cómo debemos elegir racionalmente bajo condiciones de riesgo o incertidumbre. Uno de los campos de decisión racional, y el normativo por antonomasia, es el moral, y la TDR podría ser útil en la comprensión y solución de problemas de decisión en los que lo moral es crucial. No lo creen así S&C cuando afirman, apoyados en la autoridad de Herbert Simon, que:
Simon (1989) sostiene que la teoría de la elección racional es un doble fraude y un instrumento mercenario. El doble timo de la teoría se produce porque omite tratar el problema de las creencias (no reconoce que unos mismos hechos pueden ser interpretados de manera distinta por personas diferentes) y, además evita considerar la diversidad de valores (no reconoce que las personas tienen fines diversos distintos a la maximización de la utilidad). En consecuencia, tal teoría, en el mejor de los casos (es decir, que funcionara en realidad), ayudaría a responder cómo decidir y, por tanto, estaría al servicio de seres con finalidades y valores tan disímiles como Hitler y Gandhi.(Santiago & Cante, 2009, p. 6).
De nuevo, S&C -y Simon (1989)- ven las cosas desde una perspectiva incorrecta como consecuencia de una falacia que es imperativo disolver. El trabajo en la TDR se centra en proporcionar una caracterización formal de la toma de decisiones racionales, tanto en el contexto de decisiones individuales contra la naturaleza como en el contexto de interacciones con otros agentes, y no en los fundamentos de los principios morales. La teoría se elabora en términos de elección, impulsada por el deseo de parte del agente de ver realizado el resultado que más prefiere. Así, dadas las preferencias del individuo sobre varios posibles resultados, la pregunta que surge es ¿cuál es la elección que sería racional tomar? Cuando se estudia con atención ese trabajo, es evidente que el concepto de preferencias empleado es susceptible de un amplio rango de interpretaciones. Las preferencias del agente pueden ser egoístas en el sentido más estrecho o reflejar concernimiento por los demás, esto es, preocupaciones por el bienestar o los intereses de otros individuos e incluso por ideales impersonales.
Así, emerge una perspectiva de la toma de decisiones racional que es esencialmente neutral con respecto a la clase de fines o propósitos que deben tener los agentes, pues la racionalidad es, sencillamente, una cuestión de persecución consistente y efectiva de los propósitos que un individuo tiene. Desde esta perspectiva, la TDR no es más que una herramienta para la toma de decisiones, de la misma manera que la física es una herramienta para la construcción de máquinas. Ahora bien, esas herramientas pueden ser susceptibles, como cualquier otra, de uso indebido, pero eso es un problema distinto. Y aquí S&C y Simon(1989) incurren en una falacia: juzgar la virtud de algo por el uso que se haga de ello. A la TDR la califican de mercenaria, porque puede usarse para propósitos malévolos como los de Hitler. Y es cierto, de la misma manera que la física puede usarse para hacer bombas atómicas. Pero no por eso decimos, y menos aun podemos decir, que la física es un instrumento mercenario al servicio del mal. Una cosa son los instrumentos y otra el uso que se haga de estos. Son dos cuestiones distintas y nadie niega que lo uno y lo otro pueden estar relacionados, pero esa relación no es de necesidad.
No obstante, hay individuos cuyas preferencias obedecen los postulados de la TDR, que prefieren el genocidio al asesinato y el asesinato a la tortura, y persiguen de manera consistente y efectiva sus propósitos de exterminio. En tales casos, las condiciones de consistencia de la TDR son insuficientes para la toma de decisiones que involucren consideraciones morales, por lo que se hace necesario imponer alguna clase de condiciones adicionales en la estructura analítica. De la misma manera, cuando se requiera, las decisiones no solo deben lograr para el agente lo que él más prefiera, también lo que no sea moralmente impropio. Así, de una parte, es posible introducir contenidos consecuencialistas, deontológicos e incluso asociados con las virtudes en los ordenamientos de preferencias (Colyvan, Cox & Steele, 2010).
De otra parte, lo que debe y puede contribuir la TDR a la ética depende en gran medida de qué tipo de justificación moral pueda suministrar, con los medios propios de su aparataje analítico, y de qué tan válidas y razonables resulten esas justificaciones. En ese orden de ideas, la TDR proporciona justificación, de una u otra manera, a doctrinas morales como (Lumer, 2010): la ética de la cooperación (p.ej., Gauthier, 1986; Skyrms, 1996, 2004; Binmore, 1994, 1998, 2005), la ética del valor moral racional (p.ej., Rescher, 1975; Margolis, 1982; Lumer, 2000, 2011), la ética de la decisión imparcial racional (Harsanyi, 1955; Rawls 1971) y la ética del riesgo (Fritzsche, 1986; Hansson, 2003; Lewens, 2007), entre otras.
Sin embargo, todo hay que decirlo, introducir restricciones como las mencionadas, o hacer uso de uno u otro de estos tipos de modelos para abordar cuestiones morales a veces plantea más problemas que los que resuelve. Pues, de un lado se generan teorías que apoyan principios en conflicto y, de otro, los resultados suelen depender de la utilización de principios o axiomas distintos, y no hay consenso acerca de cuáles son apropiados para los problemas éticos bajo investigación (McClennen, 2010). El punto, no obstante, es que la TDR no está lejos ni es contraria a la reflexión moral como lo aseveran S&C.
CONCLUSIONES
El desarrollo de nuestra disciplina, la economía, como de cualquier otra, depende de comprender bien lo que se puede y no se puede decir con los modelos de que disponemos, de cómo estos atacan distintos problemas, de los métodos que utilizan para ello y los problemas, tanto analíticos como empíricos en esa labor. En las lagunas y en los problemas hay fuentes de avance y mejora, sin descartar, por supuesto, la completa revaluación y abandono cuando el desarrollo mismo de la disciplina así lo exige. Es incuestionable que la TDR no explica todo lo que se espera que explique. No cabe duda de que la economía requiere de modelos de decisión empíricamente más satisfactorios que el de la TDR, y que un camino prometedor es la PT. Sin embargo, hay por lo menos un dominio, el normativo/evaluativo, donde la TDR aún continúa teniendo vigencia y relevancia, y en el que los modelos rivales distan de superar y remplazar.
En este ensayo no he querido ni criticar la PT ni defender la TDR, sino dar claridad a los argumentos y hacer patente lo que está en juego teórica y normativamente en algunas teorías de la decisión, con el propósito de que el debate sea riguroso y fructífero. No solo para quienes estamos profesionalmente involucrados en el estudio de las teorías y las prácticas de decisión de agentes reales en contextos reales, sino también para quienes hacen uso de ellas y, de manera muy importante, para que los jóvenes economistas en formación tengan un panorama equilibrado de los distintos argumentos del debate y de sus implicaciones.
NOTAS AL PIE
2 Esta distinción ha sido usual en las teorías de la decisión, recientemente Bermúdez (2009) ha elaborado una propuesta interesante sobre la misma, en la cual nos basaremos en algunas partes de este trabajo.
3 Hay distintos enfoques de la TDR, varios de ellos resumidos en Weirich (2004), capítulo 1. Una buena razón para presentar la TDR en la formulación de Savage es que ella dio una estructura analítica coherente del bayesianismo.
REFERENCIAS
[1] Anand, P. (1993). Foundations of rational choice under risk. Oxford [England]: Clarendon Press.
[2] Anscombe, G. E. M. (2000). Intention. Cambridge, Mass.: Harvard University Press.
[3] Bermúdez, J. L. (2009). Decision theory and rationality. Oxford: Oxford University Press.
[4] Bleichrodt, H., Pinto, J. L., & Wakker, P. P. (2001). Making descriptive use of prospect theory to improve the prescriptive use of expected utility. Management Science, 47(11), 1498-1514.
[5] Brazier, J., Racliff, J., Salomon, J. A., & Tsuchiya, A. (2007). Measuring and valuing health benefits for economic evaluation. Oxford; Nueva York: Oxford University Press.
[6] Colyvan, M., Cox, D., & Steele, K. (2010). Modelling the moral dimension of decisions. Noûs, 44(3), 503-529.
[7] Davidson, D. (1995). Acciones, razones y causas. En Ensayos sobre acciones y sucesos. México D. F.: Instituto de Investigaciones Filosóficas, Universidad Nacional Autónoma de México; Crítica Grijalbo Mondadori.
[8] De Finetti, B. (1980). Foresight. Its logical laws, its subjective sources. En J. Kyburg & H. E. Smokler (Eds.), Studies in subjective probability. (pp. 53–121). Huntingdon, N.Y.: Robert E. Krieger Publishing Company.
[9] Fishburn, P., & Wakker, P. P. (1995).The invention of independence condition for preferences. Management Science, 41(7), 1130-1144.
[10] Hampton, J., & Healey, R. (1998). The authority of reason. Cambridge; Nueva York: Cambridge University Press.
[11] Jeffrey, R. C. (1990). The logic of decision. Chicago: University of Chicago Press.
[12] Kahneman, D., & Tversky, A. (Eds.) (2000). Choices, Values, and Frames. Nueva York; Cambridge, UK: Russell Sage Foundation; Cambridge University Press.
[13] Köbberling, V., & Wakker, P. P. (2003). Preference foundations for nonexpected utility: A generalized and simplified technique. Mathematics of Operations Research, 28(3), 395-423.
[14] Lumer, C. (2010). Introduction: The relevance of rational decision theory for ethics. Ethical Theory & Moral Practice, 13(5), 485-496.
[15] Mandler, M. (1999). Dilemmas in economic theory: Persisting foundational problems of microeconomics. Nueva York: Oxford University Press.
[16] McClennen, E. F. (2008). Rationality and dynamic choice: Foundational explorations. Cambridge: Cambridge University Press.
[17] McClennen, E. F. (2010). Rational choice and moral theory. Ethical Theory & Moral Practice, 13(5), 521-540.
[18] Mongin, P. (2000). Does optimization imply rationality? Synthese, 124(1), 73-111.
[19] Ramsey, F. P. (1990). Philosophical papers (D. H. Mellor, Ed.). Cambridge [England]: Cambridge UniversityPress.
[20] Resnik, M. D. (1998). Elecciones: una introducción a la teoría de la decisión. Barcelona: Gedisa.
[21] Roberts, F. S. (2009). Measurement theory: With applications to decision making, utility and the social sciences. Cambridge: Cambridge University Press.
[22] Santiago, J. M., & Cante, F. (2009). Intuición, sesgos y heurísticas en la elección. Cuadernos de Economía, 28(50), 1-34.
[23] Savage, C. W., & Ehrlich, P. (1992). A brief introduction to measurement theory and to the essays. En L. J. Savage & P. Ehrlich (Eds.), Philosophical and foundational issues in measurement theory. Hillsdale, N.J.: L. Erlbaum Associates.
[24] Savage, L. J. (1972). The foundations of statistics. Nueva York: Dover Publications.
[25] Simon, H. (1989). Naturaleza y límites de la razón humana. (E. Guerrero Tapia, Trans.). México DF [Mexico]: Fondo de Cultura Económica.
[26] Von Neumann, J., & Morgenstern, O. (2007). Theory of games and economic behavior. Princeton: Princeton University Press.
[27] Wakker, P. P. (2010). Prospect theory: For risk and ambiguity. Cambridge; Nueva York: Cambridge University Press.
[28] Wakker, P., & Tversky, A. (1993). An axiomatization of cumulative prospect theory. Journal of Risk and Uncertainty, 7(2), 147-175.
[29] Weirich, P. (2004). Realistic decision theory. Rules for non ideal agents in nonideal circumstances. Nueva York: Oxford University Press.
Cómo citar
APA
ACM
ACS
ABNT
Chicago
Harvard
IEEE
MLA
Turabian
Vancouver
Descargar cita
Visitas a la página del resumen del artículo
Descargas
Licencia
Derechos de autor 2013 Cuadernos de EconomíaCuadernos de Economía a través de la División de Bibliotecas de la Universidad Nacional de Colombia promueve y garantiza el acceso abierto de todos sus contenidos. Los artículos publicados por la revista se encuentran disponibles globalmente con acceso abierto y licenciados bajo los términos de Creative Commons Atribución-No_Comercial-Sin_Derivadas 4.0 Internacional (CC BY-NC-ND 4.0), lo que implica lo siguiente: