ACERCA DE LA CONDICIÓN NORMATIVA DE LA TEORÍA DE LA DECISIÓN RACIONAL

We hardly use the word ought in a metaphorical sense.

Charles Darwin, The Descent of Man (1874)

Giancarlo Romano G.1

1 Economista Universidad Nacional de Colombia. Estudiante de la Maestría en Filosofía de la Universidad Nacional de Colombia. Profesor becario, Facultad de Ciencias Económicas de la misma universidad. Miembro de los grupos de investigación Gitiace y GEAM. Correo electrónico gromanog@unal.edu.co. Dirección de correspondencia: carrera 30 No. 45-03, Universidad Nacional de Colombia, edificio 311, oficina 403 (Bogotá, Colombia).

Este artículo fue recibido el 14 de febrero de 2012, ajustado el 2 de julio de 2012 y su publicación aprobada el 28 de agosto de 2012.


Resumen

En este artículo se examina la condición normativa de la teoría de la decisión racional (TDR) en cuanto guía, marco analítico —para la evaluación normativa— y teoría —para la explicación/predicción— de la acción; además, se explica cuál es su justificación conceptual y preceptiva a través del concepto de racionalidad instrumental. Se controvierte la afirmación con la cual la Prospect Theory, de Kahneman & Tversky, pone en riesgo la condición normativa de la TDR, y se discuten algunas afirmaciones frecuentes y equivocadas acerca de su alcance teórico y su aplicación.

Palabras clave: normatividad, racionalidad, decisiones, utilidad esperada, Prospect Theory.

JEL: D03, D81.

Abstract

The article examines the normative condition of Rational Decision Theory (RDT) as a tool to guide the action, analytical framework for normative assessment of action and theory for the explanation/prediction of the action and give account of their conceptual and prescriptive justification by means of instrumental rationality. The paper argues against the claim according to which the Kahneman and Tversky's Prospect Theory threatens the normative status of the RDT. The article also discusses some common and mistaken claims about the proper theoretical scope and application of the RDT.

Keywords: Normativity, rationality, choice, expected utility, prospect theory.

JEL: D03, D81.

Résumé

Dans cet article on examine le caractère normatif de la théorie de la décision rationnelle [TDR] en tant que guide, cadre analytique –pour l'évaluation normative- et théorie –pour l'explication/prédiction- de l'action. Ensuite, on explique quelle est sa justification conceptuelle et préceptive à travers le concept de rationalité instrumentale. On contredit l'affirmation d'arpès laquelle la théorie Prospective [Prospect Theory] de Kahneman & Tversky met en péril la condition normative de la TDR, et on discute diverses affirmations fréquentes et erronées concernant sa portée théorique et son application.

Mots-clés: normativité, rationalité, décisions, gain espéré, Prospect Theory.

JEL: D03, D81.

INTRODUCCIÓN

En la vida cotidiana estamos habituados a los dictados normativos al realizar cualquier acción. Cuando jugamos ajedrez o póker seguimos las reglas de esos juegos, no de otra forma podríamos decir que los jugamos. El uso apropiado del lenguaje está regulado por normas formal o informalmente sancionadas. Al conducir por las calles de la ciudad nos acogemos a las leyes de tránsito y sabemos que seremos sancionados si las infringimos. De la misma manera, cuando tomamos decisiones acerca de qué elegir o qué curso de acción seguir, están presentes consideraciones normativas, tanto en la elaboración o en la formación misma de las decisiones como en su ejecución y en el contexto en el que se llevan a cabo.

Las consideraciones normativas son de especial importancia para entender las decisiones y las acciones de agentes a partir de la teoría de la decisión racional (TDR), en particular las relativas a su racionalidad, que son centrales para la comprensión cabal de la teoría y su apropiada aplicación. Sin embargo, el pensamiento y el lenguaje normativos con frecuencia tienen apariencia de ser descriptivos, lo que suele ocasionar confusiones y malentendidos que se expresan en críticas o defensas a la teoría, que no están soportadas en lo que la teoría puede legítimamente decir. Por ejemplo, Santiago & Cante (2009) (en adelante S & C) hacen una descripción y una crítica de la TDR en la que se evidencia el desconocimiento de la teoría y su estructura analítica; además, afirman que la Prospect Theory (PT) cuestiona el status normativo de la TDR sin mostrar en qué consiste tal estatus y cómo es que la PT lo cuestiona. En el caso de la TDR, tales equivocaciones se agravan cuando se confunden tres aspectos de la teoría que, si bien están estrechamente relacionados, son distintos: como guía, marco analítico -para la evaluación normativa- y teoría -para la explicación/predicción- de la acción 2. Dadas estas confusiones y la frecuencia con que se presentan, el presente trabajo tiene el propósito de formular qué es lo que se entiende por condición o estatus normativo de la TDR y su importancia para su adecuada comprensión. Además, se discute si dicho estatus es puesto o no en cuestión por la PT, como algunos analistas sostienen.

El artículo consta de cuatro partes adicionales a esta introducción. En la segunda se exponen los fundamentos de la TDR y el modelo de Utilidad Esperada (UE) siguiendo a Savage (1972), y se establece el estatus normativo de la TDR atendiendo a la distinción de los dominios explicativo/predictivo, normativo/evaluativo y prescriptivo de la teoría, teniendo presente el papel que juega en ellos el concepto de racionalidad práctica instrumental. En la tercera sección se discute y cuestiona el valor normativo de la PT, mostrando que a partir de ella se obtienen proposiciones en los dominios normativo/evaluativo y prescriptivo que conducen a serios problemas de evaluación y de deber. Esas proposiciones difícilmente pueden considerarse razonables y servir de base para construir principios que guíen la acción racional. En la cuarta sección se presenta una crítica a la concepción/descripción de la TDR realizada por S&C, cuyo propósito es hacer claridad en la exposición de ideas y contribuir a su debate informado y racional. En la quinta sección se concluye.

LA CONDICIÓN NORMATIVA DE LA TDR

El concepto de racionalidad se aplica a un amplio rango de cosas muy diferentes. En este trabajo nos centramos en la noción de racionalidad práctica, esto es, la relativa a qué hacer y cómo hacerlo de manera racional. En su acepción más básica, la noción de racionalidad práctica consiste en la resolución de problemas de decisión. Un problema de decisión surge cuando un agente cree que tiene un conjunto abierto de posibles acciones distintas, o que cada acción tiene un rango de posibles resultados, que pueden variar de acuerdo con ciertos estados del mundo y estar o no bajo el control del agente.

Un problema de decisión, entonces, tiene tres componentes: 1) los actos que un agente cree que tiene a disposición, 2) los resultados que un agente cree que pueden ocurrir y 3) los estados del mundo que, conjuntamente con el acto ejecutado, determinan un resultado. El problema de decisión consiste en decidir cuál de los posibles cursos de acción se llevará a cabo a la luz de la información disponible, esto corresponde al dominio de la TDR como guía para la acción (Bermúdez, 2009). Ahora bien, algunos cursos de acción son componentes de cursos de acción más extensos: ¿cómo ajustar dentro de esta descripción el hecho de que algunos cursos de acción hacen parte de otros más amplios?, ¿qué decir acerca de las ocasiones en las que no estamos seguros, no tenemos certeza, acerca de las características cruciales de nuestra situación?, ¿qué decir acerca de cursos de acción que se despliegan en el tiempo? La TDR ofrece una respuesta a estas preguntas y sugiere que los agentes han de elegir cursos de acción sobre la base de dos principios: ordenamiento débil e independencia.

La teoría de la decisión racional

Existen varias formulaciones de la TDR, aquí seguiremos (muy esquemáticamente) la de Savage (1972) en su Foundations of Statistics 3. En la teoría de Savage la incertidumbre se representa mediante un conjunto S de estados del mundo mutuamente excluyentes y conjuntamente exhaustivos que corresponden a descripciones completas de las circunstancias relevantes en el problema de decisión. Una vez se conoce el estado del mundo, toda incertidumbre se disipa, aunque el agente no sabe cuál estado se realizará. Los subconjuntos E de S se denominan eventos. El estado que se realiza se dice que es el verdadero estado. Asumimos que el agente no tiene influencia en la realización de estado alguno. El agente tiene a disposición un conjunto de acciones: . Los objetos de elección por parte de los agentes son actos f. El conjunto de todos los actos disponibles para la elección del agente es . A cada acto le siguen consecuencias, una para cada estado del mundo, que corresponden a los posibles resultados de una decisión después de que la incertidumbre se ha disipado, reunidas en el conjunto C. Formalmente, un acto en una función , que específica para cada estado la consecuencia que resulta si la acción a se elige y se realiza el estado s. Los resultados son estado-contingentes. Como los resultados que se siguen de un acto son inciertos ex ante, en la elección del agente los actos suelen llamarse apuestas (gambles), loterías o prospectos. Si la incertidumbre atañe a cuál de los países será el campeón de la próxima Copa Mundial de Fútbol, el conjunto de estados es donde si denota el estado el país i es el campeón, y es el evento en el que uno de los países 1, 2 o 3 gana la Copa.

Sobre el conjunto de actos el agente establece la relación binaria al menos tan bueno como, notada por , que determina sus preferencias sobre los actos. significa que el agente encuentra al menos tan preferible f a g, y que está dispuesto a elegir f (o posiblemente ambos) a partir del conjunto de elección . El principio de orden débil establece que el agente ordena el conjunto de actos con base en la relación binaria de preferencia , que es conexa (para todos los actos ) y transitiva (para cualesquiera actos , entonces ). Este orden es acontextualizado (context free), es decir, el ordenamiento completo de cualquier conjunto de prospectos puede construirse paso a paso mediante la combinación de información relativa a cómo el agente ordena vía preferencia pares de alternativas, cuando se le presentan de modo aislado unos de otros, hasta extender el orden sobre parejas a todo el conjunto de actos a elegir.

La idea detrás del principio de independencia, llamado por Savage la cosa segura (sure thing), es que la elección entre los actos f y g depende solo de las diferentes consecuencias en los estados en los que se comparan esos actos: estados en los que los actos tienen consecuencias idénticas no juegan ningún papel en la decisión. En el ejemplo anterior, supóngase que sabemos que el campeón de la Copa Mundial ha de encontrarse entre los países 1, 2 y 3. Un agente debe elegir entre las apuestas f y g que tienen los premios que se muestran en la Tabla 1.

Puesto que no importa cuál apuesta se elija si el país 1 gana, el principio de la cosa segura establece que la elección debe depender solo de los premios que esas apuestas tengan cuando gana un país distinto de 1. Si un agente prefiere f a g, y si el premio en s1 se incrementa en $10.000 tanto para f como para g, dando lugar a las apuestas f' y g', mientras que los premios bajo s2 y s3 permanecen iguales, entonces la elección de ese agente no debe cambiar. De manera formal, el principio de la cosa segura asevera que las preferencias entre dos prospectos son independientes de los estados en los que los dos tengan la misma consecuencia, esto es si y solo si , siempre que el conjunto de estados S pueda particionarse en dos: la parte I (el evento irrelevante) y la parte R (el evento relevante), de manera tal que f = g en I, y f = f' y g = g' en R (Fishburn & Wakker, 1995) (Tabla 2).

Es un resultado familiar que si las preferencias del agente y su comportamiento de elección satisfacen los principios de orden débil e independencia, así como otros requerimientos algo más técnicos -continuidad, reducción de prospectos, etc.-, entonces su comportamiento puede representarse mediante una función de utilidad sobre pagos monetarios o sobre prospectos bien definidos. Esto es, existe una función de valor real que representa la relación de preferencias , si para todo prospecto :

[1]

Otro resultado es que, si las preferencias y el comportamiento de elección del agente satisfacen estos dos principios, en adición a un conjunto de postulados más técnicos, entonces sus creencias acerca de las posibilidades de realización de eventos pueden representarse mediante una medida de probabilidad subjetiva bien definida sobre conjuntos mutuamente excluyentes y conjuntamente exhaustivos de eventos. Es decir, estos axiomas implican que los grados de creencia subjetivos de los agentes acerca de la ocurrencia de tales eventos son representables como probabilidades que satisfacen los axiomas de una medida de probabilidad usual. Estos resultados se integran en un poderoso teorema: las preferencias del agente sobre consecuencias y acciones, y los grados de creencia respecto de los eventos condicionantes, pueden representarse respectivamente mediante una medida de utilidad y una medida de probabilidad subjetivas, tal que la valoración de cualquier acto, cuyos resultados están condicionados por eventos mutuamente excluyentes y conjuntamente exhaustivos, es equivalente a la utilidad esperada subjetiva de ese acto:

[2]

Donde P(.) es una medida de probabilidad subjetiva sobre estados y es una función de utilidad que mide el grado en que los deseos del agente se satisfacen por la consecuencia resultante de la conjunción entre el estado s y la acción a. A U(.) se le puede entender como el estimativo o creencia que tiene el agente acerca de la posibilidad de que el acto f produzca las consecuencias que lo satisfacen.

Respecto de estos resultados, son necesarias tres observaciones de importancia para el apropiado entendimiento de la TDR.

Observación 1: Independencia probabilidades y utilidades

Ramsey (1990) y de Finetti (1980), en el espíritu del positivismo lógico, se propusieron ofrecer un fundamento que incluyera alguna clase de medición para las probabilidades subjetivas y las valoraciones de los resultados que hacen los individuos, con base en su disponibilidad para apostar. Esta última, a su vez, cimentada en las creencias que los individuos tienen acerca de la posibilidad de ocurrencia de eventos o en el grado de verdad que le confieren a una hipótesis de acuerdo con la evidencia que la apoya.

Ramsey y de Finetti sugirieron que un agente razonable se comporta como si tuviera una distribución de probabilidad subjetiva para guiar sus decisiones y derivaron el concepto de probabilidad subjetiva a partir de una noción de utilidad como idea primitiva.

Von Neumann & Morgenstern (2007) trabajaron en sentido inverso, derivaron una definición de utilidad, conjugada con la hipótesis de UE, basada en una noción de probabilidad objetiva y exógenamente dada como concepto primitivo de la teoría. Las nociones de utilidad y probabilidad definidas de esta manera son interdependientes, lo que puede ser problemático para la realización del trabajo empírico y de medición. Este problema fue resuelto por Savage (1972), quien no partió de nociones de probabilidad ni de utilidad, sino que elaboró la teoría a partir de lo que sería racional para un agente elegir. Savage parte de un patrón consistente de elecciones entre actos y después obtiene medidas de utilidad de probabilidad. Así, la racionalidad se entiende en términos de consistencia en las elecciones y los datos importantes provienen de la preferencia revelada a través de la elección. La noción de preferencia no tiene un contenido distinto a sus manifestaciones comportamentales en elecciones reales o en disposiciones a elegir de los agentes. Esta forma de concebir el problema tiene dos implicaciones importantes. Una asociada al problema de la medición como parte central del trabajo científico y, en particular, a la medición de utilidades requerido para el desarrollo de la teoría económica y de las políticas que se desprenden de ella (Observación 2), y otra asociada al supuesto de la maximización como precepto fundamental de comportamiento de los agentes económicos (Observación 3).

Observación 2: El problema de la medición y la medición de utilidades

Entender la racionalidad en términos de consistencia en las elecciones y de las disposiciones a elegir de los agentes vincula de modo automático, conceptual y lógicamente la TDR con la teoría representacionalista de la medición. Este es un aspecto clave para los desarrollos teóricos pero sobre todo empíricos de la TDR, por cuanto se le da una base firme a la cuestión de la medición de la utilidad e, igualmente, despeja las dudas y especulaciones acerca de la naturaleza de la utilidad, pues esta queda reducida a una escala de representación de las preferencias de los agentes.

El enfoque representacionalista concibe la medición como la asignación de números a entidades y eventos para representar sus propiedades y relaciones. La teoría considera el concepto de escala de medición, describe varios tipos de escalas, sus usos, y formula las condiciones necesarias para su existencia. En breve, la perspectiva representacionalista de la medición parte de considerar una estructura empírica relacional no-numérica, consistente en un conjunto de entidades no-numéricas D y un conjunto de relaciones que incluyen operaciones y objetos destacados, T1, T2, … , Tl, sobre D. Una estructura relacional numérica (abstracta) es un conjunto de entidades numéricas N, junto con las relaciones R1, R2, … , Rm sobre N. Una escala de medición, , es una función que preserva la relación (un homomorfismo) de la estructura relacional no-numérica en la estructura relacional numérica. El tipo de la estructura relacional es definido por el número y el grado de relaciones en la estructura, y el tipo de escala se define como el tipo de estructura relacional numérica mapeada por las transformaciones que soporta la escala y que preservan las relaciones subyacentes al mapeo.

La primera tarea de la teoría formal de la medición consiste en establecer de manera precisa las condiciones requeridas para la existencia de escalas de distintos tipos, esto es, establecer y probar los teoremas de representación que afirman la existencia de ciertos tipos de escalas y si las estructuras relacionales no-numéricas en consideración satisfacen cierto conjunto de condiciones. La segunda tarea estriba en determinar y precisar las clases de transformaciones de escala admisibles para los distintos tipos de escalas, es decir, las transformaciones que producen una nueva escala que mapea las mismas relaciones que la función original.

En la TDR el conjunto de entidades no-numéricas N se corresponde con los conjuntos de estados S, eventos E y actos . Las relaciones T1, T2, …, Tl se corresponden con la estructura de preferencias observables empíricamente en las elecciones de los agentes. Los teoremas de representación están dados por las expresiones [1] y [2], y las escalas por las funciones U(.) y . Ahora bien, si a partir del comportamiento observable de elección se define el concepto teórico de función utilidad, ¿hay una única función de utilidad compatible con un conjunto de datos de elección o pueden haber varias funciones, y cada una de ellas suministra una descripción de esa utilidad respecto a tal conjunto de datos?, esto es, ¿qué clase de escalas son estas funciones de utilidad?, ¿son empíricamente implementables, es decir, podemos medir efectivamente esas utilidades?

Por lo general, las magnitudes físicas pueden medirse con al menos un grado de libertad, es decir, eligiendo las unidades de medida en la escala de medición. Así, podemos medir el peso en kilos o en gramos, o la distancia en kilómetros o millas. En algunos casos se tienen más grados de libertad en la elección de la escala, como cuando se eligen las unidades de medida y la ubicación de un cero referencial, como es el caso de la temperatura (Celsius o Fahrenheit) o la altura de la superficie de la tierra sobre el nivel del mar. Cuando se trata de la medición de la utilidad lo que queremos representar mediante funciones o escalas de medición son órdenes de preferencia entre objetos contingentes, esto es, prospectos. Si para un agente el acto f es preferido al g y el g es preferido al h estamos diciendo que para él la utilidad del acto f es mayor que la utilidad de g, que a su vez tiene una utilidad mayor que h, y deberíamos obtener las mismas implicaciones observables si fijamos los respectivos valores de utilidad de esos actos en (10, 1, 0), (10, 7, 0) o (90, 54, 2). El hecho de que a la primera alternativa se le puede asignar el número 10 o 90, o que el rango de los valores de utilidad sea de 10 u 88, no tiene manifestaciones observables. Del mismo modo, no hay implicaciones observables para la comparación de una reducción en la utilidad entre f y g frente a una de g y h. Los valores de utilidad solo significan que la primera alternativa es preferible a la segunda y ambas son preferibles a la tercera. Esta es la escala ordinal de prospectos U(.), que no tiene unidades de medida y solo admite transformaciones monótonas que no alteran la validez de la representación del orden de la escala. Por tanto, , con creciente, representa el mismo orden que U(.).

Podemos pedirle a un agente que clasifique en orden de preferencia un conjunto de resultados y que después compare qué tanto más deseable es cada resultado que el siguiente en el orden. Si para un agente la diferencia de deseabilidad entre los resultados A y B es igual a la diferencia de deseabilidad entre los resultados B y C, entonces estas diferencias tienen implicaciones observables: a este agente le será indiferente obtener B con seguridad y una lotería que tiene por resultados A y C, cada uno de ellos con probabilidad de 50%. La igualdad entre estas dos diferencias tendrá que ser respetada por cualquier función de utilidad que pretenda tener en cuenta y representar adecuadamente estas diferencias en las preferencias. En consecuencia, una vez establecida una función de utilidad para los resultados descritos, la escala de medición que representa diferencias de deseabilidad es aquella a la que se le puede añadir cualquier número y multiplicarse por un número positivo, y los ordenamientos de tales diferencias se mantendrán inalterados. Esta es la escala de ordenamiento de preferencias sobre resultados, y ordenamiento de preferencias sobre diferencias entre resultados, cuya escala de medición es de intervalo: este tipo de escala solo admite transformaciones afines, u' = k1 u + k2 con , que no alteran la validez de la representación. En este caso se tienen unidades de medida (útiles, por ejemplo) y un cero referencial arbitrario.

De lo anterior se deduce que si queremos encontrar una función de utilidad real para un agente real y concreto, podemos hacerlo eligiendo los valores de utilidad de dos alternativas de forma arbitraria, siempre y cuando se le asigne a la mejor alternativa un número mayor. No importa si estos dos números son 0 y 1, 5 y 23 o -7, 6 y 1, 8. Lo que importa es que el segundo número sea mayor que el primero. Los valores de utilidad de todas las alternativas estarán definidos de forma única dados estos dos números, y los teoremas de representación en [1] y [2] sugieren las formas en que podemos encontrar esos valores intermedios, con el grado de precisión deseado. Si sabemos cuáles son las preferencias de un agente entre los pares de prospectos que involucran solo tres resultados, tendremos una única manera de definir sus preferencias entre cualquier par de prospectos. Más aun, para medir esas preferencias basta con conocer, de un lado, las preferencias del agente sobre resultados seguros, y de otro, sus preferencias sobre un par de loterías con dos posibles resultados.

Observación 3: Maximización como precepto comportamental

De otra parte, la TDR no prescribe maximizar la utilidad esperada de las elecciones de los agentes. Si las preferencias de un agente están en conformidad con los axiomas de la teoría, esta permite construir una función expectacional de utilidad para él. La función siempre asignará un mayor número a las opciones que él prefiere y a cada opción contingente le asignará su utilidad esperada. Si sus preferencias están en consonancia con los axiomas de la teoría, la maximización se hará cargo de sí misma, por así decirlo, en la medida en que el agente elige lo que prefiere. Si las preferencias del agente no se ajustan a los axiomas de la teoría, entonces la construcción de una función expectacional de utilidad fallará. Lo único que la teoría les pide a los agentes es que sus elecciones sean coherentes. Desde esta perspectiva, una labor de carácter normativo de la racionalidad práctica en la TDR, es fijar, como de hecho lo hacen los axiomas, las condiciones de coherencia en las elecciones. Estamos en el dominio de la TDR como marco analítico para la evaluación normativa de la acción.

La condición normativa de la TDR

La noción de racionalidad práctica consiste en la resolución de problemas de decisión, esto es, decidir cuál de los posibles cursos de acción se llevará a cabo a la luz de la información disponible, estamos en el dominio de la TDR como guía para la acción (Bermúdez, 2009). El material de trabajo para una teoría de la racionalidad práctica en este dominio es la información que el agente tiene acerca de los actos disponibles y de las posibles condiciones del mundo, relevantes para el problema de decisión que quiere resolver, en conjunto con sus actitudes hacia los posibles resultados. Una primera labor que se le encomienda a la racionalidad práctica en la teoría es la de identificar un subconjunto de opciones disponibles en un problema de decisión, que le proporcionen al agente el mejor prospecto para realizar sus objetivos, en relación con la información de que dispone. Esto es, una noción de racionalidad instrumental que permita la resolución de problemas de decisión mediante un razonamiento de la siguiente estructura. El agente tiene la intención de conseguir un fin. Se forma unas creencias acerca de qué medios están disponibles para conseguirlo y cuáles de esos medios son mejores o peores en relación con otros. Además, elegirá aquellos que cree que no son peores que otros. ¿Qué es creer que cierto curso de acción está disponible? Creer que cierto curso de acción está disponible tiene dos componentes: a) el agente debe considerar que es al menos epistémicamente posible que tenga la intención de un cierto curso de acción, y b) el agente debe tener una creencia condicional confiable según la cual, de hecho, tomará ese curso de acción si tiene la intención de hacerlo.

¿Qué es creer que uno de esos posibles medios para alcanzar el fin es mejor que otro? No es necesario creer que ese medio es el más eficaz en la consecución del fin. La manera más efectiva de lograr un objetivo, con no poca frecuencia, puede ser demasiado costosa para contar como la mejor, ni siquiera como una de las mejores maneras de lograr el objetivo. Basta con que para el agente lo mejor o lo más sea aquello que es valioso o digno de ser elegido por él. Así, tomar un cierto curso de acción A como medio para cierto fin F es llevar a cabo una intención de tomar dicho curso de acción A con el fin de conseguir el fin F. Cuando el agente tiene la intención de tomar el curso de acción A con el fin de lograr un fin F, su intención de tomar A es, de alguna manera, subordinada a su intención de conseguir F. La intención del agente de conseguir el fin F controla o guía el modo en que toma el curso de acción A. Esto no implica, por supuesto, que dos agentes distintos se formen las mismas creencias y elijan los mismos cursos de acción, aun cuando persigan el mismo fin y cuenten con la misma información.

Así, y de acuerdo con la Observación 3, la TDR puede pensarse normativamente como una teoría de la coherencia de la racionalidad práctica. Ahora bien, desde una perspectiva pragmática, esto es, que atiende a las consecuencias que se siguen de las elecciones, la falta de coherencia de sus elecciones ponen al agente en una situación en la que falla en el logro de los objetivos que tiene la intención de alcanzar. Esto conduce a un principio de racionalidad normativo que expande la noción de racionalidad práctica más allá de la simple consistencia en la elección a una concepción pragmática de la elección: un principio de elección es válido si el fracaso de un agente en su adhesión a este resulta en la elección de medios insuficientes para la consecución de los fines deseados, en la persecución menos efectiva de esos fines de lo que podría, bajo las circunstancias en las que actúa el agente (McClennen, 2008, p. 4).

Nótese que hemos vuelto a una noción de racionalidad instrumental, pero ampliada. Ejemplos claros de este punto de vista son las consecuencias que se desprenden de la violación de los principios de orden débil e independencia. Así, un agente puede verse en una situación en la que acepta una combinación de apuestas monetarias que, independientemente de cómo se desenvuelvan los eventos que condicionan sus apuestas, indefectiblemente termina perdiendo dinero (the Money Pump argument); o puede encontrarse en una situación de elección dinámica en la que lo que preferiría elegir ahora en un momento posterior no es lo que preferiría elegir una vez llegado ese momento. En consecuencia, normativamente hablando, un agente racional debe adherir a estos principios: ello le garantiza consistencia en las elecciones y no le impide la consecución de sus fines.

Además de identificar un subconjunto de opciones disponibles en un problema de decisión, que proporcione al agente la mejor manera de cristalizar sus objetivos en relación con la información de que dispone, de manera tal que sea consistente en sus elecciones, a la racionalidad práctica en la TDR también se le confía que suministre los criterios para determinar cómo se resuelven los problemas de decisión. A partir del dominio de guía para la acción de las elecciones racionales se han mantenido estables los fines del agente y la información que posee. También se han dado por sentadas sus evaluaciones de los actos disponibles, las posibles condiciones relevantes del mundo y sus actitudes hacia los resultados esperados. Así, las actitudes y evaluaciones de los agentes fijan los parámetros de los problemas de decisión, y la noción de racionalidad práctica en el dominio de guía para la acción solo puede aplicarse una vez tales parámetros se fijan (Bermúdez, 2009).

Pero, podemos preguntarnos acerca de la racionalidad de cómo se fijan esos parámetros, y de la racionalidad de cómo se realizan las elecciones una vez los parámetros han sido fijados. Esto nos lleva considerar: cómo y qué tan bien el agente recaba información pertinente acerca de los resultados; cómo determina sus valoraciones de los estados y contingencias y los estimativos de sus posibilidades de ocurrencia; y cómo se conectan estos con los primeros, dada la subordinación de todo ello a la consecución de sus fines. Lo que nos conduce, por último, a conectar las motivaciones para la acción de un agente y la acción misma expresada en su comportamiento de elección.

De acuerdo con Davidson (1995), una acción se explica si las creencias, deseos y otros estados mentales ofrecen una caracterización psicológica de lo que dio lugar a la acción del agente. En la identificación de tales estados psicológicos, se supone que quien explica la acción está guiado por una hipótesis de racionalidad, esto es, los estados psicológicos a los que apela deben ser tales que la acción es racional a la luz del perfil psicológico del agente. También en la predicción de la acción de un agente, quien predice está guiado por el supuesto de lo que sería racional para ese agente hacer. Ciertamente, una acción es compatible con una infinidad de perfiles psicológicos, y cualquiera de estos puede expresarse en una infinidad de acciones. La hipótesis de racionalidad, entonces, actúa como una restricción que reduce las dimensiones de variación de la acción. La satisfacción de una condición de racionalidad es una condición necesaria, más no suficiente para la explicación y la predicción de la acción.

Así, la hipótesis de racionalidad es la única manera de cerrar la brecha entre el perfil psicológico del agente y su comportamiento. Esto es, requerimos de una noción de racionalidad para explicar y predecir el comportamiento de elección, necesaria para establecer los vínculos entre deseos, creencias y acciones, en función de los fines a lograr y los medios requeridos para conseguirlos. La TDR es una teoría formal en la que se conjugan esos elementos.

Nótese cómo el razonamiento, en distintos niveles y enfocado en distintas necesidades normativas, gravita alrededor de la noción de racionalidad instrumental y la refina. En síntesis, y a la luz de las Observaciones 1, 2 y 3, podemos establecer el estándar normativo de la TDR como sigue. Un agente es racional cuando responde a la información que tiene, con a) creencias racionales acerca de qué medios están disponibles para conseguir un fin, b) creencias racionales acerca de cuáles de esos medios son mejores y cuáles peores, y c) que las intenciones sean consistentes con tales creencias racionales. Además, que las intenciones del agente sean consistentes con sus creencias implica que él nunca debe tener: a) la intención de conseguir un fin, b) creer que en un cierto conjunto de alternativas cada una de ellas es un medio disponible y óptimo para ese fin y, a pesar de ello, c) no tener la intención de elegir entre ninguno de esos medios, por lo menos en tanto que d) él también crea que no conseguirá ese fin de manera óptima, a menos que se decida por uno de esos medios. El estándar requiere que las preferencias, determinadas a partir del comportamiento de elección de los agentes, estén en conformidad con los axiomas de la TDR, de manera que sus elecciones sean consistentes sin impedir la consecución de sus fines.

ALGUNAS IMPLICACIONES NORMATIVAS DE LA PROSPECT THEORY

Para ciertos analistas, por ejemplo S&C, la falta de congruencia con los hechos de algunas proposiciones descriptivo/explicativas de la TDR pone en entredicho su condición normativa, tal y como se formuló en la sección anterior. Esto es equivocado, veamos por qué. La condición normativa de una teoría se pone en cuestión si 1) la extensión del dominio normativo/evaluativo de la teoría es insuficiente para los propósitos de la misma, esto es, no abarca casos importantes para los que se espera una formulación normativa por parte de la teoría que ella no permite, 2) tiene implicaciones normativas indeseables, es decir, que contradicen nuestros juicios de deber mejor fundamentados y 3) se muestra que los fundamentos justificativos de la condición normativa son insostenibles. Cuestionar el estatus normativo de la TDR requiere hacer evidentes los puntos 1) a 3). La PT, en cuanto teoría de la toma de decisiones, no tiene el propósito de socavar normativamente la TDR, como lo veremos más adelante. No obstante, podemos mostrar que hay implicaciones normativas de la PT inconvenientes en términos de deber y guía de la acción. Para ello, describamos la PT primero. La descripción de la PT y las citas que siguen se basan en Kahneman & Tversky (2000) (en adelante K&T).

Una característica fundamental de la PT, a diferencia de la UE, es que los agentes perciben los resultados como pérdidas y ganancias con respecto a un punto de referencia r es decir, no evalúan estados finales sino los cambios respecto a un estado referente, generalmente un statu quo dado por la situación en la que se encuentra el agente. Una ganancia es estrictamente preferida al punto de referencia y una pérdida se prefiere menos que el punto de referencia. La desutilidad de una pérdida x es mayor que la utilidad de una ganancia x, sean unas u otras efectivas o potenciales, fenómeno que es conocido como aversión a las pérdidas. Esto implica que los agentes son aversos al riesgo en el dominio de las ganancias y propensos al riesgo en el dominio de las pérdidas. La PT asume que las contingencias se evalúan no por probabilidades sino por ponderaciones de probabilidad, modeladas por funciones w(p) no lineales, no aditivas, continuas y crecientes que asignan ponderación 0 a p = 0 y ponderación 1a p = 1; generalmente, de acuerdo con la evidencia empírica, son cóncavas para probabilidades bajas (usualmente menores a 0,2, interpretadas como sobrestimación de la contingencia de eventos poco probables) y convexas para probabilidades altas (mayores a 0,2, interpretadas como subestimación de la contingencia de eventos significativamente probables).

Estas ponderaciones de probabilidad no pueden tomarse como probabilidades ni medidas de grados de creencia, pues miden el impacto de eventos en la deseabilidad de los prospectos, además de ser evaluaciones de las posibilidades de ocurrencia de contingencias. La PT admite que las ponderaciones de probabilidad asociadas a ganancias sean diferentes a las ponderaciones asociadas a pérdidas (w–). Bajo PT los prospectos L = (A:p, B:1 – p) con resultados A o B y probabilidad p de que se obtenga A cuando involucran ganancias y pérdidas , se evalúan así:

[3]

Donde V(.) es una función de utilidad sobre prospectos correspondiente a una escala de medida ordinal; u(.) es una función de utilidad sobre resultados correspondiente a una escala de medida de intervalo y es un coeficiente que refleja la aversión a las pérdidas. Por último, K&T postulan que los agentes están a merced de distintos sesgos cognitivos y perceptuales que afectan sus decisiones. ¿Qué consecuencias normativas pueden derivarse de esta perspectiva de la decisión? Veamos dos casos ilustrativos, suficientes para mostrar los serios problemas de evaluación y de deber a que conduce la PT.

Caso 1: Framing effects

Uno de los sesgos más frecuentes en las decisiones es el framing effect, el cual expresa que las variaciones irrelevantes en la descripción de problemas de decisión, que no cambian su estructura lógica o conceptual subyacente, tienden a modificar las decisiones de los agentes -como consecuencia de las variaciones en la descripción-. En particular, puede inducirse a los individuos a ver los mismos hechos, bien como una ganancia o bien como una pérdida, variando la descripción del problema de decisión, de tal manera que se altere el punto de referencia. Así, lo que era una ganancia con respecto a la referencia inicial será una pérdida con respecto a la referencia redescrita, sin que haya cambiado la estructura del problema. Debido a la susceptibilidad de los framing effects, las personas escogerán de manera inconsistente, esto es, realizarán elecciones diferentes y opuestas en problemas de decisión esencialmente idénticos, como ocurre en el famoso caso de la enfermedad asiática (Kahneman & Tversky, 2000).

Si juicios acerca de lo correcto o incorrecto, debido o indebido, justo o injusto, permisible o impermisible, o del mayor o menor valor de una decisión dependen de la percepción de pérdidas y ganancias, y si los framing effects afectan esas percepciones, entonces esos juicios no tienen ningún significado normativo, por cuanto no hay una guía prescriptiva clara de qué hacer ni de cómo evaluar lo hecho, pues una y otra cosa son contingentes a la descripción que se haga del problema de decisión. Esto es algo que requiere de especial cuidado, por ejemplo, en el diseño, implementación y evaluación de políticas públicas, en las que con frecuencia se deben establecer pérdidas y ganancias, incluir los intereses, grupos, etc. concernidos por ellas y que, por lo mismo, requieren, en principio, partir de valoraciones normativas claras de la situación a cambiar y de la naturaleza del cambio a realizar. Estos problemas se agudizan cuando hay interacción estratégica, pues los puntos de referencia, las pérdidas y las ganancias son estratégicamente manipulables. Esto muestra, de paso, una importante debilidad teórica de la PT: la indeterminación de los puntos de referencia y, por implicación, de las pérdidas y ganancias, y de los efectos e incidencia de la aversión a la pérdida en las decisiones.

Caso 2: Pérdidas y ganancias como portadores de utilidad

Suponiendo que riqueza y bienestar estén asociados, consideremos las siguientes situaciones. Un individuo a) acaudalado ve reducida su riqueza a un nivel medio, debido a que sufre una gran pérdida, o b) se mantiene en un nivel medio de riqueza debido a que no ganó una suma que lo haría muy rico, y c) un individuo se mantiene en un nivel bajo de riqueza debido a que no ganó una suma moderada. Bajo PT nos vemos forzados a concluir que el individuo en las situaciones a) y b) está en peor condición de bienestar que el individuo en c), aun cuando en c) la persona permanece en un nivel mucho más bajo de riqueza en términos absolutos que la persona en a) o b).

Ahora consideremos dos individuos (1 y 2), uno con riqueza A y otro con riqueza B, con . Al primero se le impone un tributo sobre A, con el fin de transferirlo al segundo. Supongamos que al primer individuo la tributación le genera una pérdida de x, mientras que al segundo la transferencia le genera una ganancia de x + a, tal que la situación final es . Bajo PT, la mayor ganancia de 2 se valora menos que la menor pérdida de 1, esto es, la PT puede proscribir la tributación progresiva.

En las situaciones descritas, la razón que sustenta tales valoraciones normativas es que en la PT son los cambios en los resultados y no los resultados finales los portadores de utilidad, y que las pérdidas cuentan más que las ganancias. Más aun, las medidas que se ocupen de los individuos en peor situación son claramente no favorecidas por la PT, por cuanto no hay forma de justificar un criterio maximin a partir de ella. No obstante, debido a que las pérdidas y ganancias se ven afectadas por ponderaciones de decisión distintas, puede ser que la importancia que se le asigna a reducciones en el decrecimiento del ingreso sea mayor que la asignada a los aumentos en el crecimiento del ingreso.

Estos casos sugieren que las teorías centradas en los estados finales como portadores de utilidad, como la UE -en vez de estar centradas en cambios en los estados finales, también como portadores de la utilidad, como la PT-, son normativamente más razonables y, en ciertos casos, pueden ser descriptivamente más útiles.

CRÍTICA A SANTIAGO & CANTE

Juan Santiago y Freddy Cante publicaron en Cuadernos de Economía el artículo "Intuición, sesgos y heurísticas en la elección" (2009), en el que hacen una crítica a la TDR y al modelo de UE. La crítica se basa en la insostenibilidad de lo que llaman racionalidad perfecta (p. 2) y los supuestos que la sustentan. La racionalidad perfecta consiste en "que los individuos tienen una consistencia lógica entre medios y fines y, por tanto, suponen la posibilidad de optimizar en el momento que el agente decide, y a medida que pasa el tiempo […] sea en un contexto de certeza, en uno riesgoso o en uno incierto" (p. 5).

De acuerdo con S&C, la racionalidad perfecta se materializa en el modelo UE, y la insostenibilidad de una y otro obedece a un problema de incongruencia empírica: los postulados de la teoría acerca de las capacidades de los agentes no son consistentes con los hechos, debido a "las limitaciones cognitivas de los agentes en el proceso de elección observadas", y a que las decisiones humanas "son producto de la intuición (escogencia automática), y no de prolongados y sofisticados procesos de elección racional [y] la inconsistencia de las preferencias a lo largo del tiempo" (p. 3). En consecuencia "la racionalidad, en el sentido estrecho que la define la Teoría de la Elección Racional, no puede explicar todos los fenómenos que se le pide que explique" (p. 2), en particular el equity premium puzzle, el efecto disposición, entre otros (pp. 25-28).

Además de la crítica a la TDR, S&C hacen un contraste entre el modelo de UE con el modelo PT de K&T, en sus versiones sencilla y acumulativa. A partir del contraste entre las dos teorías, S&C invitan a pensar en el abandono del modelo UE y en la adopción del modelo PT, por cuanto este permite superar las limitaciones y fallas explicativas/predictivas de la UE, a través de la introducción de ciertas características de la psicología de la decisión, como la racionalidad limitada de los agentes, los puntos de referencia, la evaluación diferencial de pérdidas y ganancias, entre otras, que hacen a la PT descriptivamente mejor que la UE.

Sin duda la TDR y el modelo de UE son problemáticos, y una muestra de ello es la incongruencia empírica que los autores denuncian. Sin embargo, tanto la descripción como la crítica que hacen S&C de la TDR evidencian un profundo desconocimiento de la teoría, de su estructura analítica, del sentido conceptual de sus elementos componentes, de las relaciones entre los mismos y de sus implicaciones en la explicación de la elección de los agentes y, en consecuencia, del alcance y las limitaciones de la teoría, de lo que ella puede decir legítimamente. Así, confunden los dominios de la TDR como guía, marco analítico -para la evaluación normativa- y teoría -para la explicación/predicción- de la acción.

Los autores también hacen afirmaciones fuertes sin ofrecer razones y argumentos que las justifiquen, tales como "la Teoría de Prospectos enfocada en los aspectos psicológicos que afectan la elección individual, cuestionan el status normativo de la Teoría de la Elección Racional" (extraído del resumen del artículo, p. IX), sin mostrar en qué consiste tal estatus normativo y cómo es que la PT lo cuestiona. No obstante las deficiencias del artículo, su publicación constituye una oportunidad para hacer claridad en la exposición de ideas y su debate informado y racional.

De acuerdo con Anscombe (2000), podemos distinguir dos tipos de estados mentales. De un lado están las creencias o estados cognitivos, en los que la intención del agente es adaptarse al mundo tal como es; si una creencia no se ajusta al mundo, es falsa y tiene que rechazarse. De otro lado están los deseos o estados conativos, en los que la dirección de ajuste con el mundo es inversa a la de las creencias, un deseo se satisface o realiza cuando el mundo se ajusta a este. Reconocer esta distinción es entender por qué los deseos y las creencias son distintos, y que lo que motiva a actuar a las personas son sus deseos, metas y aspiraciones. En la TDR las creencias se forman sobre los medios para realizar esos deseos y cómo aquellos se conectan con sus fines. Asimismo, hay tantos fines como agentes, y aun más, un mismo agente puede tener más de un fin (p. ej., una persona puede querer ser a la vez un gran actor y un buen padre, una empresa puede querer tener la mayor cuota de mercado y proteger el ambiente, etc.). Por tanto, cuando S&C afirman que la TDR "evita considerar la diversidad de valores" (p. 6), no reconocen que las personas tienen fines diversos distintos a la maximización de la utilidad; además, no solo afirman algo contrario a lo postulado por la teoría, que reconoce la infinidad de fines y valores que los agentes puedan perseguir, también confunden deseos con creencias, cómo unos y otros se articulan en la acción de los agentes y qué juicios se forman ellos acerca de los medios para su consecución.

Igualmente, S&C se contradicen cuando acusan a la teoría de no permitir diversidad de valores, pero a su vez le reclaman que pueda servir a valores distintos como los de Hitler y Gandhi (p. 6), que son diversos, independientemente de su contenido moral. La contradicción de S&C es aun más patente cuando afirman, en acuerdo con Herbert Simon, que "por su parte H. Simon (1989, p. 22) muestra que la teoría de la utilidad esperada abarca toda la diversidad de valores humanos (razones, sentimientos, pasiones e intereses diversos) dentro de una sola función" (p. 15). ¿Si la TDR "evita considerar la diversidad de valores" como es que también "abarca toda la diversidad de valores humanos"?

Respecto a si la PT cuestiona la condición normativa de la TDR, S&C no advierten que cuestionar tal condición requiere mostrar los puntos 1) a 3) de la sección anterior, cosa que no hacen, y no se percatan de que la PT no tiene el propósito de subvertir los fundamentos normativos de la TDR, de hecho K&T tratan el modelo UE como estándar normativo, pese a que lo rechazan como modelo explicativo/predictivo de las decisiones:

These departures from expected utility theory [certainty effect, isolation effect] must lead to normatively unacceptable consequences, such as inconsistencies, intransitivities, and violations of dominance. Such anomalies of preference are normally corrected by the decision maker when he realizes that his preferences are inconsistent, intransitive, or inadmissible. (Kahneman & Tversky, 2000, p. 31, énfasis añadido)

Más aún, K&T reconocen que los dominios explicativo/predictivo y normativo/evaluativo no solo son distintos, sino irreconciliables el uno con el otro. El primero atañe a lo que es y el segundo a lo que debe ser, y lo que afecta a un dominio no tiene implicaciones sobre el otro, debido a la incomunicabilidad lógica y empírica entre ambos:

We argue that the deviations of actual behavior from the normative model are too widespread to be ignored, too systematic to be dismissed as random error, and too fundamental to be accommodated by relaxing the normative system. […] We conclude from these findings that the normative and the descriptive analyses cannot be reconciled (p. 210, énfasis añadido) […] Consequently, the dream of constructing a theory that is acceptable both descriptively and normatively appears unrealizable (p. 220).

Por tanto, contrario a lo sostenido por S&C, que la TDR presente incongruencias empíricas entre las predicciones que resultan de ella y la evidencia de su contraste efectivo no afectan el estatus normativo de la teoría, independientemente de donde venga el reclamo empírico.

Incluso S&C suelen confundir los dominios normativo/evaluativo y descriptivo/explicativo, dos ejemplos claros son: "Uno de los méritos de Kahneman & Tversky es su trabajo empírico […], lo cual rompe con la estéril metodología de la abstracción suprema (mediante la cual se supone, cual un acto de fe, que los individuos se comportan conforme a los principios prescriptivos de la teoría de la elección racional)" (p. 15, énfasis añadido); "Divergencias entre teorías positivas y normativas surgen a cada momento […] La Teoría de Prospectos contiene al menos tres elementos que pueden explicar varias predicciones contraintuitivas ofrecidas por los modelos normativos" (p. 28). Por tanto, la PT no pone, no puede poner en cuestión el estatus normativo de la TDR. Sin embargo, dadas las cualidades explicativas/predictivas de la PT, Bleichrodt, Pinto & Wakker (2001) han hecho uso de ella para mejorar la capacidad prescriptiva de la UE. Allí, dado que los distintos métodos de obtención y medición de utilidades bajo UE generan resultados significativamente distintos cuando deberían ser los mismos (no hay invarianza procedimental), es posible corregir los sesgos de obtención y medición de utilidades bajo UE, mediante cuidadosas aplicaciones de las funciones de ponderación de decisiones y coeficientes de aversión a las pérdidas. Los resultados experimentales de estos autores sugieren que esas correcciones mejoran de manera importante la capacidad prescriptiva de las aplicaciones de la UE, en especial en la toma de decisiones en salud, en el análisis costo-utilidad de tecnologías sanitarias.

De otra parte, S&C afirman que "dentro de la Teoría de la Utilidad Esperada, un problema persistente ha sido la noción de la utilidad y la posibilidad de su medición, problema soslayado asumiendo la imposibilidad de una medición 'objetiva' para un fenómeno 'subjetivo'." (p. 3, énfasis añadido). Esta afirmación solo puede obedecer al desconocimiento de los desarrollos de las teorías económica, de la decisión y la medición. De acuerdo con lo expuesto en la Observación 2, en los enfoques de la medición es irrelevante que las entidades a medir sean objetivas o subjetivas, pues de lo que se trata es de asignar números a un conjunto de entidades y de relaciones, cualquiera que sea su naturaleza. Por ejemplo, medir la carga eléctrica de una partícula atómica, la energía liberada por una reacción química, el grado de adaptación de una especie a su entorno, el nivel general de precios, la inteligencia o las actitudes de un agente, son en última instancia lo mismo: lo que cambia son los métodos de medición, los instrumentos utilizados y lo considerado como error de medición.

Por otra parte, las preocupaciones epistémicas, pragmáticas y de política económica por medir la utilidad no han sido un problema soslayado, por el contrario, ha ocupado buena parte de las reflexiones de los economistas y los teóricos de la decisión. Dos ejemplos prominentes son Edgeworth y Fisher, quienes discutieron el problema de la medición de la utilidad y la relevancia de fundamentarla en la psicología de los agentes o en su comportamiento de elección. Edgeworth fue partidario de lo primero, dado su compromiso con el utilitarismo, mientras que Fisher fue partidario de lo segundo (Colander, 2007).

Desde el paso del cardinalismo utilitarista al ordinalismo abstracto y hasta hoy los fundamentos de la teoría de la utilidad y su medición han sido parte central de la labor teórica y empírica de los economistas, naturalmente aun hay problemas por resolver (Mandler, 1999). A manera de ejemplo, tal vez el área donde más se hacen mediciones de utilidad y en la que mejor se conjugan los propósitos teóricos y aplicados, epistémicos y pragmáticos, es en la economía de la salud, en particular en la valoración de estados de salud y la evaluación de calidad de vida asociados a ellos (Brazier, Racliff, Salomon & Tsuchiya, 2007).

Por último, son importantes algunas observaciones generales respecto a la relación entre la TDR y las decisiones morales, tópico sobre el que S&C hacen declaraciones objetables, bajo la tutela de la autoridad intelectual, sin preguntarse si tales declaraciones tienen fundamento o no. La condición normativa/evaluativa de la TDR establece cómo debemos elegir racionalmente bajo condiciones de riesgo o incertidumbre. Uno de los campos de decisión racional, y el normativo por antonomasia, es el moral, y la TDR podría ser útil en la comprensión y solución de problemas de decisión en los que lo moral es crucial. No lo creen así S&C cuando afirman, apoyados en la autoridad de Herbert Simon, que:

Simon (1989) sostiene que la teoría de la elección racional es un doble fraude y un instrumento mercenario. El doble timo de la teoría se produce porque omite tratar el problema de las creencias (no reconoce que unos mismos hechos pueden ser interpretados de manera distinta por personas diferentes) y, además evita considerar la diversidad de valores (no reconoce que las personas tienen fines diversos distintos a la maximización de la utilidad). En consecuencia, tal teoría, en el mejor de los casos (es decir, que funcionara en realidad), ayudaría a responder cómo decidir y, por tanto, estaría al servicio de seres con finalidades y valores tan disímiles como Hitler y Gandhi.(Santiago & Cante, 2009, p. 6).

De nuevo, S&C -y Simon (1989)- ven las cosas desde una perspectiva incorrecta como consecuencia de una falacia que es imperativo disolver. El trabajo en la TDR se centra en proporcionar una caracterización formal de la toma de decisiones racionales, tanto en el contexto de decisiones individuales contra la naturaleza como en el contexto de interacciones con otros agentes, y no en los fundamentos de los principios morales. La teoría se elabora en términos de elección, impulsada por el deseo de parte del agente de ver realizado el resultado que más prefiere. Así, dadas las preferencias del individuo sobre varios posibles resultados, la pregunta que surge es ¿cuál es la elección que sería racional tomar? Cuando se estudia con atención ese trabajo, es evidente que el concepto de preferencias empleado es susceptible de un amplio rango de interpretaciones. Las preferencias del agente pueden ser egoístas en el sentido más estrecho o reflejar concernimiento por los demás, esto es, preocupaciones por el bienestar o los intereses de otros individuos e incluso por ideales impersonales.

Así, emerge una perspectiva de la toma de decisiones racional que es esencialmente neutral con respecto a la clase de fines o propósitos que deben tener los agentes, pues la racionalidad es, sencillamente, una cuestión de persecución consistente y efectiva de los propósitos que un individuo tiene. Desde esta perspectiva, la TDR no es más que una herramienta para la toma de decisiones, de la misma manera que la física es una herramienta para la construcción de máquinas. Ahora bien, esas herramientas pueden ser susceptibles, como cualquier otra, de uso indebido, pero eso es un problema distinto. Y aquí S&C y Simon(1989) incurren en una falacia: juzgar la virtud de algo por el uso que se haga de ello. A la TDR la califican de mercenaria, porque puede usarse para propósitos malévolos como los de Hitler. Y es cierto, de la misma manera que la física puede usarse para hacer bombas atómicas. Pero no por eso decimos, y menos aun podemos decir, que la física es un instrumento mercenario al servicio del mal. Una cosa son los instrumentos y otra el uso que se haga de estos. Son dos cuestiones distintas y nadie niega que lo uno y lo otro pueden estar relacionados, pero esa relación no es de necesidad.

No obstante, hay individuos cuyas preferencias obedecen los postulados de la TDR, que prefieren el genocidio al asesinato y el asesinato a la tortura, y persiguen de manera consistente y efectiva sus propósitos de exterminio. En tales casos, las condiciones de consistencia de la TDR son insuficientes para la toma de decisiones que involucren consideraciones morales, por lo que se hace necesario imponer alguna clase de condiciones adicionales en la estructura analítica. De la misma manera, cuando se requiera, las decisiones no solo deben lograr para el agente lo que él más prefiera, también lo que no sea moralmente impropio. Así, de una parte, es posible introducir contenidos consecuencialistas, deontológicos e incluso asociados con las virtudes en los ordenamientos de preferencias (Colyvan, Cox & Steele, 2010).

De otra parte, lo que debe y puede contribuir la TDR a la ética depende en gran medida de qué tipo de justificación moral pueda suministrar, con los medios propios de su aparataje analítico, y de qué tan válidas y razonables resulten esas justificaciones. En ese orden de ideas, la TDR proporciona justificación, de una u otra manera, a doctrinas morales como (Lumer, 2010): la ética de la cooperación (p.ej., Gauthier, 1986; Skyrms, 1996, 2004; Binmore, 1994, 1998, 2005), la ética del valor moral racional (p.ej., Rescher, 1975; Margolis, 1982; Lumer, 2000, 2011), la ética de la decisión imparcial racional (Harsanyi, 1955; Rawls 1971) y la ética del riesgo (Fritzsche, 1986; Hansson, 2003; Lewens, 2007), entre otras.

Sin embargo, todo hay que decirlo, introducir restricciones como las mencionadas, o hacer uso de uno u otro de estos tipos de modelos para abordar cuestiones morales a veces plantea más problemas que los que resuelve. Pues, de un lado se generan teorías que apoyan principios en conflicto y, de otro, los resultados suelen depender de la utilización de principios o axiomas distintos, y no hay consenso acerca de cuáles son apropiados para los problemas éticos bajo investigación (McClennen, 2010). El punto, no obstante, es que la TDR no está lejos ni es contraria a la reflexión moral como lo aseveran S&C.

CONCLUSIONES

El desarrollo de nuestra disciplina, la economía, como de cualquier otra, depende de comprender bien lo que se puede y no se puede decir con los modelos de que disponemos, de cómo estos atacan distintos problemas, de los métodos que utilizan para ello y los problemas, tanto analíticos como empíricos en esa labor. En las lagunas y en los problemas hay fuentes de avance y mejora, sin descartar, por supuesto, la completa revaluación y abandono cuando el desarrollo mismo de la disciplina así lo exige. Es incuestionable que la TDR no explica todo lo que se espera que explique. No cabe duda de que la economía requiere de modelos de decisión empíricamente más satisfactorios que el de la TDR, y que un camino prometedor es la PT. Sin embargo, hay por lo menos un dominio, el normativo/evaluativo, donde la TDR aún continúa teniendo vigencia y relevancia, y en el que los modelos rivales distan de superar y remplazar.

En este ensayo no he querido ni criticar la PT ni defender la TDR, sino dar claridad a los argumentos y hacer patente lo que está en juego teórica y normativamente en algunas teorías de la decisión, con el propósito de que el debate sea riguroso y fructífero. No solo para quienes estamos profesionalmente involucrados en el estudio de las teorías y las prácticas de decisión de agentes reales en contextos reales, sino también para quienes hacen uso de ellas y, de manera muy importante, para que los jóvenes economistas en formación tengan un panorama equilibrado de los distintos argumentos del debate y de sus implicaciones.

NOTAS AL PIE

2 Esta distinción ha sido usual en las teorías de la decisión, recientemente Bermúdez (2009) ha elaborado una propuesta interesante sobre la misma, en la cual nos basaremos en algunas partes de este trabajo.

3 Hay distintos enfoques de la TDR, varios de ellos resumidos en Weirich (2004), capítulo 1. Una buena razón para presentar la TDR en la formulación de Savage es que ella dio una estructura analítica coherente del bayesianismo.

REFERENCIAS

[1] Anand, P. (1993). Foundations of rational choice under risk. Oxford [England]: Clarendon Press.

[2] Anscombe, G. E. M. (2000). Intention. Cambridge, Mass.: Harvard University Press.

[3] Bermúdez, J. L. (2009). Decision theory and rationality. Oxford: Oxford University Press.

[4] Bleichrodt, H., Pinto, J. L., & Wakker, P. P. (2001). Making descriptive use of prospect theory to improve the prescriptive use of expected utility. Management Science, 47(11), 1498-1514.

[5] Brazier, J., Racliff, J., Salomon, J. A., & Tsuchiya, A. (2007). Measuring and valuing health benefits for economic evaluation. Oxford; Nueva York: Oxford University Press.

[6] Colyvan, M., Cox, D., & Steele, K. (2010). Modelling the moral dimension of decisions. Noûs, 44(3), 503-529.

[7] Davidson, D. (1995). Acciones, razones y causas. En Ensayos sobre acciones y sucesos. México D. F.: Instituto de Investigaciones Filosóficas, Universidad Nacional Autónoma de México; Crítica Grijalbo Mondadori.

[8] De Finetti, B. (1980). Foresight. Its logical laws, its subjective sources. En J. Kyburg & H. E. Smokler (Eds.), Studies in subjective probability. (pp. 53–121). Huntingdon, N.Y.: Robert E. Krieger Publishing Company.

[9] Fishburn, P., & Wakker, P. P. (1995).The invention of independence condition for preferences. Management Science, 41(7), 1130-1144.

[10] Hampton, J., & Healey, R. (1998). The authority of reason. Cambridge; Nueva York: Cambridge University Press.

[11] Jeffrey, R. C. (1990). The logic of decision. Chicago: University of Chicago Press.

[12] Kahneman, D., & Tversky, A. (Eds.) (2000). Choices, Values, and Frames. Nueva York; Cambridge, UK: Russell Sage Foundation; Cambridge University Press.

[13] Köbberling, V., & Wakker, P. P. (2003). Preference foundations for nonexpected utility: A generalized and simplified technique. Mathematics of Operations Research, 28(3), 395-423.

[14] Lumer, C. (2010). Introduction: The relevance of rational decision theory for ethics. Ethical Theory & Moral Practice, 13(5), 485-496.

[15] Mandler, M. (1999). Dilemmas in economic theory: Persisting foundational problems of microeconomics. Nueva York: Oxford University Press.

[16] McClennen, E. F. (2008). Rationality and dynamic choice: Foundational explorations. Cambridge: Cambridge University Press.

[17] McClennen, E. F. (2010). Rational choice and moral theory. Ethical Theory & Moral Practice, 13(5), 521-540.

[18] Mongin, P. (2000). Does optimization imply rationality? Synthese, 124(1), 73-111.

[19] Ramsey, F. P. (1990). Philosophical papers (D. H. Mellor, Ed.). Cambridge [England]: Cambridge UniversityPress.

[20] Resnik, M. D. (1998). Elecciones: una introducción a la teoría de la decisión. Barcelona: Gedisa.

[21] Roberts, F. S. (2009). Measurement theory: With applications to decision making, utility and the social sciences. Cambridge: Cambridge University Press.

[22] Santiago, J. M., & Cante, F. (2009). Intuición, sesgos y heurísticas en la elección. Cuadernos de Economía, 28(50), 1-34.

[23] Savage, C. W., & Ehrlich, P. (1992). A brief introduction to measurement theory and to the essays. En L. J. Savage & P. Ehrlich (Eds.), Philosophical and foundational issues in measurement theory. Hillsdale, N.J.: L. Erlbaum Associates.

[24] Savage, L. J. (1972). The foundations of statistics. Nueva York: Dover Publications.

[25] Simon, H. (1989). Naturaleza y límites de la razón humana. (E. Guerrero Tapia, Trans.). México DF [Mexico]: Fondo de Cultura Económica.

[26] Von Neumann, J., & Morgenstern, O. (2007). Theory of games and economic behavior. Princeton: Princeton University Press.

[27] Wakker, P. P. (2010). Prospect theory: For risk and ambiguity. Cambridge; Nueva York: Cambridge University Press.

[28] Wakker, P., & Tversky, A. (1993). An axiomatization of cumulative prospect theory. Journal of Risk and Uncertainty, 7(2), 147-175.

[29] Weirich, P. (2004). Realistic decision theory. Rules for non ideal agents in nonideal circumstances. Nueva York: Oxford University Press.