MODELO DE APOYO A LA COMERCIALIZACI ÓN DE ELECTRICIDAD USANDO LÓGICA DIFUSA Y APRENDIZAJE DE MÁQUINA
SUPPORT MODEL FOR ELECTRICITY TRADE USING FUZZY LOGIC AND MACHINE LEARNING
JULIAN MORENO
Universidad
Nacional de Colombia, Sede Medellín, Escuela de Sistemas,
jmoreno1@unalmed.edu.co
DEMETRIO OVALLE
Universidad
Nacional de Colombia, Escuela de Sistemas, Facultad de Minas, dovalle@unalmed.edu.co
Recibido para revisar Febrero 14 de 2008, aceptado Junio 23 de 2008, versión final Septiembre 10 de 2008
RESUMEN: El trabajo que se describe en este artículo explora la posibilidad de emplear un modelo basado en la lógica difusa y en el aprendizaje de máquina para que los agentes comercializadores del mercado eléctrico Colombiano, o de alguno con características similares, maximicen sus utilidades de acuerdo a su perfil de riesgo. El modelo consta de dos partes, la primera es un sistema experto difuso que les brinda a estos agentes una recomendación respecto a la estrategia comercial que deben emplear, y cuya definición depende principalmente de las condiciones del mercado. La segunda es un mecanismo de aprendizaje por refuerzo con el que los agentes aprenden a medida que perciben las consecuencias que sus acciones les acarrean, de manera que las modifican esperando obtener una recompensa no solo en el corto sino también en el largo plazo.
PALABRAS CLAVE: Mercado Eléctrico Mayorista, Lógica Difusa, Aprendizaje de Máquina.
ABSTRACT: The work presented in this paper explores the posibility of using a model based on fuzzy logic and machine learning in order to maximize the profits of Colombian energy trade agents according to their risk profile. The model has two parts, the first one is a fuzzy expert system that gives to these agents a recommendation about the trade strategy they should follow, and whose definition depends mainly on market conditions. The second one is a reinforced learning mechanism with which the agents learn when they perceive the consequences of their actions, so they modify them looking for a reward not just in short but also in long term.
KEYWORDS: Wholesale Electricity Market, Fuzzy Logic, Machine Learning.
1. INTRODUCCIÓN
El proceso de liberalización de los sectores eléctricos alrededor del mundo ha dado paso a la introducción de la competencia en varias de las actividades de la cadena de suministro. El mercado eléctrico Colombiano no es ajeno a este
panorama. En este país, a partir de la Constitución de 1991, se admitió como principio clave para el logro de la eficiencia en los servicios públicos la competencia donde fuera posible y la libre entrada a todo agente que estuviera interesado en prestarlos. El Estado pasó a cumplir el papel de ente regulador, mientras
Posteriormente se presentó una reestructuración del mercado bajo las leyes 142 y 143 de 1994 que tenían como finalidad aumentar la eficiencia del sistema y vincular capitales privados al mismo, y se produjo la instauración de la Bolsa de Energía en 1995 [1]. Dichas leyes definieron el marco regulatorio aplicable a los negocios de generación, así como la transmisión, distribución y comercialización.
Para cada una de estas actividades existen agentes encargados de llevarlas a cabo. Entre estos, la función de los comercializadores consiste en transar grandes bloques de energía bien sea para satisfacer la demanda de los usuarios finales, o para cubrir las obligaciones comerciales de los otros agentes. Para obtener la energía que requiere para estos procesos un comercializador tiene dos alternativas: realizar contratos bilaterales de largo plazo con un generador u otro comercializador, o adquirirla por medio de la bolsa de energía que es un mecanismo de balance de corto plazo. El dilema del comercializador consiste en que los precios en ambos casos pueden llegar a ser muy diferentes debido a la alta volatilidad presente, principalmente en el caso de la bolsa. Bajo esta perspectiva un agente debe decidir cuanto de su demanda debe adquirir por medio de contratos teniendo en cuenta que la cantidad que le falte para satisfacer su demanda será adquirida en bolsa, mientras que si por el contrario se contrata de más, el sobrante lo vende en bolsa. Evidentemente, el comercializador debe tomar esta decisión buscando maximizar sus ganancias pero a la vez manejando de manera adecuada el riesgo que esto implica.
El resto de este artículo está organizado de la siguiente manera: en las secciones 2 y 3 se describen brevemente los fundamentos conceptuales de los enfoques abordados en este trabajo prestándole especial atención al aprendizaje de máquina. En el caso de la lógica difusa el lector puede encontrar más bibliografía asociada con mercados eléctricos en [2-5]. En la sección 4 se presenta el modelo propuesto, describiendo las variables consideradas, junto con los modelos de inferencia y aprendizaje. En la sección 5 se presentan los resultados obtenidos por medio de la validación con datos históricos, y por último en la sección 6 se presentan las conclusiones.
2. LÓGICA DIFUSA
Los Sistemas de Inferencia Difusos - SID [6, 7] son una forma de representar conocimientos y datos inexactos en forma similar a como lo hace el pensamiento humano. Un SID define una correspondencia no lineal entre una o varias variables de entrada y una variable de salida. La aplicación de modelos basados en Lógica Difusa permite abordar la creación de sistemas soporte de decisión ya que brinda la capacidad de extraer datos de forma práctica y, a través de las capacidades analíticas de los evaluadores, descubrir relaciones significativas entre ellos. Otra característica de este tipo de modelos es que son altamente flexibles, tolerantes a imprecisiones en los datos y pueden trabajar con funciones no lineales de diversa complejidad, así mismo no están obligados por presunciones estadísticas acerca de las características de los datos y se pueden modificar fácilmente dependiendo de la solución del problema que se requiera.
3. APRENDIZAJE DE MÁQUINA
Un método de aprendizaje puede considerarse como una forma determinada de hacer que un agente que interactúa con su entorno cambie sus parámetros internos para que pueda adaptarse a nuevas situaciones y solucionar, a la larga, la tarea que le ha sido encomendada. Según la realimentación de la que dispone el agente para evaluar su desempeño, pueden clasificarse las técnicas disponibles en la Inteligencia Artificial en, al menos, cuatro grupos: aprendizaje supervisado, aprendizaje no supervisado, aprendizaje por optimización estocástica y aprendizaje por refuerzo, siendo este último el de interés para este trabajo.
En el modelo estándar de aprendizaje reforzado [8], un agente está conectado a su ambiente vía percepción y acción. En cada paso de interacción el agente recibe una entrada i acerca del estado actual s del ambiente y toma una acción a para generar una salida correspondiente. Tal acción altera
el estado del ambiente y el valor de esta transición de estado es comunicado al agente por medio de una señal de refuerzo escalar r. El comportamiento B del agente debe escoger acciones que tiendan a incrementar la suma de largo plazo de los valores de la señal de refuerzo, y para aprender a hacer esto a través del tiempo, debe seguir sistemáticamente algún método de prueba y error. Para lograr esto puede apoyarse en una amplia variedad de algoritmos diseñados para este propósito.
Formalmente, y de acuerdo con la Figura 1, un modelo de aprendizaje en general consiste de:
Figura 1. Modelo estándar de
aprendizaje reforzado
Figure 1. Reinforced learning
standard model
La Figura 1 incluye además una función de entrada I, que determina la manera en la que el agente ve el estado del ambiente, es decir, cuál es su percepción de los cambios que en éste se producen. Típicamente se asume que esta función se trata de la función identidad (esto es, que el agente percibe el estado exacto del ambiente), pero puede considerarse también funciones que permitan modelar una observación parcial o alterada. El trabajo del agente es entonces modificar su comportamiento B, mapeando estados con acciones, de manera que se maximice una medida de largo plazo del refuerzo. En general, el ambiente en el que el agente se desempeña es no determinístico, esto significa, que tomar la misma acción para el mismo estado en dos ocasiones diferentes puede resultar en estados siguientes diferentes y/o diferentes valores de la señal de refuerzo.
En este tipo de aprendizaje, es necesario que el agente recoja información a través de la experiencia acerca de los posibles estados del entorno, acciones, transiciones y recompensas que pueden guiarlo hacia la optimalidad. En otras palabras, el aprendizaje reforzado implica necesariamente una exploración del entorno.
4. MODELO PROPUESTO
Los agentes comercializadores de energía eléctrica basan sus decisiones en el análisis de información referente tanto a su estado propio como al del sector y del país. Dentro de la información que estos agentes analizan y que es exógena a ellos se encuentran aspectos que pueden medirse tanto de manera cuantitativa como cualitativa e influyen directa o indirectamente en la formación de los precios de la electricidad. En [9] se expone una explicación detallada de tales aspectos, sin embargo en el modelo propuesto en este trabajo se hace una simplificación y se considera sólo una parte.
Específicamente, los aspectos elegidos para consideración son la evolución de los precios de la electricidad y la disponibilidad hídrica del sistema. Para su elección se siguieron dos premisas. La primera es que los precios en sí son la principal señal para la toma de decisiones de los agentes comercializadores. Tal aseveración concuerda con los postulados de teorías financieras como es el análisis técnico, el cual se fundamenta en los principios de Dow Jones [10] empleados en el análisis de mercados financieros. El primero de estos principios estipula que los precios lo descuentan todo, lo que significa que todos los elementos que afectan el mercado, ya sean políticos, económicos, sociales, psicológicos o de cualquier otra índole, están de hecho reflejados en la acción del precio. La segunda premisa es que, aún cuando los precios por sí mismos generan señales para la toma de decisiones, no hay que desconocer que para el caso particular de mercados eléctricos con un porcentaje alto de participación hidráulica como es el caso Colombiano, existen variables claramente identificadas que los afectan significativamente [11], y que por tanto el modelo de inferencia debe contemplarlas, siendo la principal de estas variables la disponibilidad hídrica del sistema.
A continuación se describe con más detalle los análisis llevados a cabo sobre las dos variables consideradas.
4.1 Análisis de la evolución de precios
El objetivo de este análisis es determinar
para un periodo t determinado (considerando
una escala mensual) la relación entre los precios de bolsa y de contratos, es
decir, cual de estos precios se encuentra por encima del otro o si son similares,
y de esta manera intuir que opción de compra de energía es más atractiva. Para
llevar a cabo tal análisis es necesario conocer un histórico de los valores de
los precios de bolsa y de contratos hasta t.
Su fundamento es que a medida que el mercado Colombiano ha ido madurando, y que
aunque la volatilidad en los precios es alta (en particular para el precio de
bolsa), los cambios abruptos en la relación de precios, no en los precios en
sí, son menos frecuentes y, en los casos en los que se presentan, pueden ser
explicados en gran medida por las demás variables analizadas.
La herramienta empleada para llevar a cabo dicho análisis son los promedios móviles para ambos precios (expresados en $/kWh promedio mes). Con estos se busca estudiar sus tendencias y brindar una señal, aunque no contundente, de la relación entre ambos en el corto plazo. El tipo de promedio empleado en el modelo propuesto es un promedio ponderado simple cuya formula se presentada en (1), y en el que se promedian los precios de los últimos n periodos dándole mayor importancia a los más recientes.
(1)
El valor de n elegido es 3 meses pues corresponde a un horizonte de tiempo adecuado para las decisiones de corto plazo. La diferencia porcentual entre ambos promedios se calcula como se muestra en (2).
(2)
Donde PPPb corresponde al Promedio Ponderado de los Precios medios de bolsa y PPPc corresponde al Promedio Ponderado de los Precios medios de contratos.
Si se fuera a tomar una decisión respecto al factor de contratación basándose únicamente en este criterio, podría decirse que cuando la diferencia porcentual entre los promedios en un periodo t sea positiva se debería tomar una posición de sobrecontratación en el periodo t+1 esto pues se esperaría que si la tendencia presente continúa los precios de bolsa se encontrarán por encima de los de contratos. De manera análoga, cuando la diferencia sea negativa la decisión a tomar sería una posición de subcontratación pues se esperaría que la situación en los precios fuera contraria. En el caso de que tal diferencia sea prácticamente nula, es decir que oscile alrededor de cero, la decisión a tomar sería tomar una posición de cautela y contratar para el periodo t+1 un porcentaje cercano al 100% de su demanda, esperando que un cambio en la tendencia de los precios se evidencie en períodos posteriores.
4.2 Análisis de la disponibilidad hídrica
Los precios de la
electricidad en todos los mercados de energía están directamente relacionados
con los costos de generación y, puesto que el sistema de generación Colombiano
es en su mayoría hidráulico, la evaluación de la disponibilidad hídrica del
sistema es fundamental para las decisiones de contratación. Por tal motivo, el
objetivo de este análisis es deducir la disponibilidad hídrica esperada para el
periodo t+ 1 a partir de las condiciones hidroclimáticas en t.
Para cuantificar la capacidad de generación de las plantas hidráulicas una posibilidad es recurrir a los indicadores Aportes de los ríos y Embalse ofertable, los cuales pueden ser expresados en Gwh y dan cuenta para un periodo determinado de la cantidad de agua disponible para la generación. Mas específicamente, el embalse ofertable corresponde al nivel del embalse que se encuentra disponible para generación. Mientras que los aportes de los ríos corresponden a la sumatoria de los aportes hídricos de las cuencas que alimentan al sistema de generación.
Así, una manera de definir la disponibilidad hídrica total del sistema, entendiéndola como el potencial de generación hidráulica que hay en un determinado momento dados los recursos hídricos, es sumar ambas variables. Para obtener su valor esperado en un mes determinado es posible emplear un método como el que se presenta a continuación:
(3)
La validación de este modelo se realizó con los datos reales del periodo 1999-2005 y la raíz del error medio cuadrático obtenido fue de 960,81, que corresponde a un error promedio de 6%.
De manera análoga a como se hizo con el caso de la diferencia porcentual de precios, si se fuera a tomar una decisión respecto al factor de contratación basándose únicamente en la disponibilidad hídrica esperada, podría decirse que cuando en un periodo t ésta se encuentre por encima de su promedio histórico se debería tomar una posición de subcontratación, esto pues se esperaría que dada la cantidad excedente de agua para ese periodo, los precios de bolsa se encontrarán bajos y posiblemente los de contratos se encuentren por encima. Así mismo, cuando la disponibilidad hídrica esperada se encuentre por debajo de su promedio, la decisión a tomar sería una posición de sobrecontratación pues se esperaría que la situación en los precios fuera al revés. En el caso de que la disponibilidad hídrica esperada tenga un nivel medio
la decisión a tomar sería no considerar este criterio y contratar para el periodo t+1 un porcentaje cercano al 100% de su demanda, puesto que no sería posible hacer especulaciones.
4.3 Modelo de inferencia difuso
Una vez identificadas
las variables de entrada así como sus relaciones con la variable de decisión,
es decir, con el factor de contratación, es necesario definir un mecanismo que
las pondere de una manera similar a como lo haría un agente del mercado. Una
manera de lograrlo es por medio de un Sistema de Inferencia Difuso - SID cuyos
fundamentos han sido empleados ampliamente en diversos sistemas de apoyo a la
toma de decisión, e incluso para el caso particular de los mercados de energía
[2-5].
El primer paso para la creación del SID es la definición de los conjuntos difusos de las variables tanto de entrada como de salida. Tales conjuntos se sitúan dentro del universo del discurso de cada variable, el cual se extrae de su registro histórico, y su forma se determina a partir de una función de pertenencia.
Para el caso de las variables de entrada del modelo propuesto, es decir, la diferencia porcentual de precios y la disponibilidad hídrica, se emplearon los diagramas de frecuencia de dichas variables de manera que cada conjunto contuviera un numero similar de muestras en el período analizado y se validaron los conjuntos resultantes con conocimiento experto. Para la definición de los conjuntos difusos de la variable de salida se emplearon rangos igualmente espaciados dentro del universo del discurso, y se eligió un numero de estos lo suficientemente amplio como para cubrir el espectro de decisiones que un comercializador podría tomar.
Una vez definidos estos conjuntos, se procede a definir las reglas del sistema de inferencia. Tales reglas son del tipo SI <antecedentes> ENTONCES <consecuente>, donde los antecedentes corresponden a la agregación (conjunción o disyunción) de los valores de las variables de entrada (conjuntos difusos), mientras que el consecuente corresponde al valor resultante de la variable de salida. De esta manera, las reglas pueden representarse por medio de una matriz, donde las filas y las columnas se determinan en base a los conjuntos de las variables de entrada, mientras que su dimensión corresponde a su producto cartesiano.
Para definir tales reglas puede emplearse una metodología formal en base a valores históricos de las tuplas entradas-salida [12], o puede usarse conocimiento experto explícito, como es el caso presentado en este trabajo. La matriz de reglas del modelo propuesto se muestra en la Tabla 1.
Tabla 1. Matriz de reglas del sistema de inferencia
Table
1. Rules matrix of the
inference system
Así por ejemplo, la expresión un precio de bolsa significativamente por encima del de contratos en un mes determinado 1, sumado con una expectativa de una disponibilidad hídrica escasa para el mes siguiente 2, incita a tener un nivel de contratación elevado para el mes siguiente 3; puede modelarse como la siguiente regla difusa: si diferencia porcentual de precios1 es muy superior y disponibilidad hídrica esperada es muy baja2 entonces factor de contratación es (o debe ser) muy sobre contratado3.
La superficie difusa que corresponde al mapeo de las combinaciones de variables de entrada con la salida del sistema de inferencia se observa en la figura 2.
Figura 2. Superficie difusa
Figure 2. Fuzzy surface
4.4 Modelo de aprendizaje
El modelo de aprendizaje propuesto en este
artículo se fundamenta en varios de los principios del aprendizaje por refuerzo
anteriormente descritos, y resulta coherente con los procesos que al respecto
se dan en el mercado real. Su objetivo es permitir hallar un valor óptimo del
grado de credibilidad que un agente del mercado debe tener respecto a la inferencia realizada por un sistema experto
con el fin de obtener las mayores utilidades posibles con base en su perfil de
riesgo.
Retomando los elementos descritos en la Figura 1, se tiene para el mecanismo propuesto:
Un conjunto de estados del ambiente S: En este caso los estados corresponden a los esquemas de contratación resultantes del agente, es decir, a su distribución de compras en contratos y en bolsa en un período dado.
Un conjunto de acciones del agente A: Las acciones que el agente puede tomar en un período t se refieren a la determinación de su factor de contratación, entendiendo éste como la ponderación entre el factor por defecto que el agente tenga y el factor recomendado por el sistema de inferencia. Más formalmente se puede decir que tal factor se calcula como:
Si factor recomendado > 1 Entonces
factor = MIN(factor recomendado * λ +
factor por defecto *(1 λ), PC máximo)
De lo contrario Si factor recomendado < 1 Entonces
factor = MAX(factor recomendado * λ +
factor por defecto * (1 λ), PC mínimo)
De lo contrario Entonces
factor = λ + factor por defecto *(1 λ)
El factor por defecto se puede interpretar como la estrategia por defecto que tendría el agente si no contara con un mecanismo de aprendizaje y aplicara siempre la misma estrategia. Es decir, este factor podría ser 1 en el caso de un agente completamente adverso al riesgo que siempre contrate el 100% de su demanda; o podría ser un valor menor a 1 para meses de invierno y un valor mayor en meses de verano; o cualquier otra estrategia estática que el agente pudiera implementar.
Los valores PC máximo y PC mínimo corresponden a los porcentajes de contratación máximo y mínimo respectivamente que el agente fija de acuerdo con su perfil de riesgo. Para clarificar el significado de las anteriores variables se presenta el siguiente ejemplo: Un agente comercializador puede tener un factor por defecto que sea contratar el 90% de su demanda para meses que típicamente son de invierno, y 105% para meses de verano. Y puede tener un PC mínimo de 60% y un PC máximo de 120%, lo cual indica que en el más extremo de los casos, podría subcontratarse en un 40% (dejar este porcentaje para comprarlo en bolsa), o sobrecontratarse en un 20% (dejar este porcentaje para venderlo en bolsa).
Por su parte λ se interpreta como el factor de credibilidad que tiene el agente en el sistema de inferencia, y en el mercado en sí. En este sentido el aprendizaje, tal como se expone más adelante, consiste en encontrar el valor óptimo de ese grado de credibilidad, que le asegura al agente obtener las mayores utilidades posibles en el largo plazo dado su perfil de riesgo. De esta manera, retomando el ejemplo del párrafo anterior, podría tenerse que para un período determinado correspondiente a un mes de invierno, el factor recomendado sea 0.7 y el valor de λ sea 0.8, por lo que el factor resultante sería:
Factor = MAX(factor recomendado * λ + factor por defecto * (1 λ), PC mínimo)
= MAX(0.7 * 0.8 + 0.9 * (1 0.8), 0.6)
= MAX(0.7 * 0.8 + 0.9 * (1 0.8), 0.6)
= MAX(0.74, 0.6)
= 0.74
Es decir, que la decisión para ese período sería contratar el 74% de su demanda.
Un conjunto de señales escalares de refuerzo R: En este caso la señal de refuerzo corresponde a la diferencia entre la ganancia
obtenida por el agente al haber tomado la acción a y la ganancia que hubiera obtenido si tuviera la posibilidad de escoger la mejor acción, es decir, si tuviera la información a priori de los precios de bolsa y de contratos, y hubiera actuado consecuentemente con dicha información.
Para calcular estas ganancias se calcula la diferencia entre la utilidad obtenida con un esquema de contratación al 100% y la obtenida con el esquema de contratación correspondiente. Formalmente, puede decirse que la utilidad obtenida con la estrategia óptima en un periodo t (UEO t) es:
UEO t
= Capital empleado estrategia 100% -Capital empleado estrategia óptima
= Compras en contratos (estrategia 100%) [compras contratos + compras bolsa ventas bolsa] (estrategia óptima)
Para calcular las compras en contratos de la estrategia 100% basta con multiplicar la demanda por el precio de contratos. En cambio, para calcular las compras en contratos, las compras en bolsa y las ventas en bolsa de la estrategia óptima, es necesario partir del supuesto que se conocen los precios de contratos y de bolsa del período correspondiente, y por tanto se definen con base en la diferencia real entre tales precios de la siguiente manera:
Si Diferencia real de precios ≥ 0
(si el precio de bolsa es mayor que el de contratos) Entonces
Compras contratos = Precio contratos * Máximo PC * Demanda
Compras bolsa = 0
Ventas bolsa = Precio bolsa * (Máximo PC 1) * Demanda
De lo contrario
(si el precio de contratos es mayor que el de bolsa) Entonces
Compras contratos = Precio contratos * Mínimo PC * Demanda
Compras bolsa = Precio bolsa * (1 - Mínimo PC) * Demanda
Ventas bolsa = 0
De la misma manera, para calcular la utilidad obtenida con la estrategia empleada en un período t (UEE t) es:
UEE t
= Capital empleado estrategia 100% -Capital empleado estrategia empleada
= Compras en contratos (estrategia 100%) [compras contratos + compras bolsa ventas bolsa] (estrategia empleada)
De esta forma, la señal de refuerzo puede definirse como:
UEO t / UEE t
En este caso, las compras en contratos, las compras en bolsa y las ventas en bolsa de la estrategia empleada, se calculan con base en el factor de contratación elegido de la siguiente manera:
Compras contratos = Precio contratos * Factor elegido;
Si Factor elegido < 1 (contratación por debajo del 100%) Entonces
Compras bolsa = Precio bolsa * (1 factor elegido) * Demanda
Ventas bolsa = 0
De lo contrario (contratación por encima del 100%) Entonces
Compras bolsa = 0
Ventas bolsa = Precio bolsa * (factor elegido 1) * Demanda
Función de entrada I: Para este modelo se asume que no hay distorsión entre la respuesta del entorno y la percepción que de ésta tiene el agente, y por lo tanto I corresponde a la función identidad, es decir, F(x)=x.
Modificación del comportamiento B: Para el mecanismo propuesto, la modificación del comportamiento se refiere a la actualización de λ a partir de la señal de refuerzo obtenida. En este caso dicha modificación se modela como el valor en que se aumenta o disminuye λ, calculado por medio de una función que es inversamente proporcional a la señal de refuerzo. Es decir, si la diferencia entre la ganancia obtenida en el tiempo t respecto a la máxima ganancia que se hubiera tenido dado el perfil de riesgo es cercana a cero, esto significa que la estrategia elegida es buena, y por tanto el valor de λ no debería alterarse. Por el contrario, si esa diferencia es amplia, λ debería alterarse considerablemente. En este sentido, la variable δ que se interpreta como el tamaño de paso del algoritmo, actúa como un delta de la ganancia a obtener.
Más formalmente, tal modificación en un período t se realiza de la siguiente manera:
Si ganancia obtenida > 0 Entonces
δ = (1 ganancia obtenida / ganancia máxima) * θ
Si factor > 1 Entonces
Si Diferencia real de precios ≥ 0 Entonces
λ t+1 = λ t + δ
De lo contrario Entonces
λ t+1 = λ t δ
De lo contrario Si factor < 1 Entonces
Si Diferencia real de precios ≤ 0 Entonces
λ t+1 = λ t + δ
De lo contrario Entonces
λ t+1 = λ t δ
Donde θ representa el factor de proporcionalidad.
Algoritmo de aprendizaje: Teniendo en cuenta estos elementos, el algoritmo completo de aprendizaje propuesto puede describirse de la siguiente manera:
Para t desde 1 hasta p (numero de periodos)
Si t > 1 Entonces
Calcular factor elegido
De lo contrario Entonces
factor elegido = factor por defecto
Calcular utilidad óptima y utilidad obtenida
Calcular δ
Determinar valor de λ
Calcular factor recomendado por el sistema de inferencia para el siguiente periodo
En este apartado cabe anotar que el parámetro λ para t=1 es igual a cero, lo cual significa que al inicio de la simulación la credibilidad del agente respecto del sistema de recomendación es nula y esto lo hace inclinarse por elegir su factor de contratación pordefecto. Sin embargo, a medida que avanzan las iteraciones, tal parámetro se altera dependiendo de las señales de refuerzo que le entregue el entorno, en este caso el mercado.
5. RESULTADOS OBTENIDOS
El desempeño del modelo presentado en este artículo se evaluó empleando los datos reales correspondientes al período 1999-2005. En la Figura 3 se muestra la evolución de la ganancia obtenida (empleando la misma definición de ganancia que en el numeral anterior) respecto a la máxima ganancia que podría obtenerse dada la propensión al riesgo del agente, es decir, los porcentajes mínimo y máximo de contratación correspondientes (en este caso de 0 y 200). También se muestra en la figura la evolución del factor λ.
Figura 3. Ganancias obtenidas
vs. lambda
Figure 3. Obtained profits
vs. lambda
En la figura anterior puede apreciarse claramente que el comportamiento del aprendizaje es asintótico y que la velocidad de convergencia está determinada por el tamaño de paso del algoritmo, el cual está ligado al delta de la ganancia. En esta figura puede observarse que la franja de las ganancias no es estable, si no que presenta picos en escenarios extremos del mercado, y tiene valores positivos pero cercanos a cero cuando los panoramas no son tan claros. Otros aspectos de interés es que la utilidad promedio obtenida fue de 1.61 $/kWh, la pérdida promedio fue de 0.06 $/kWh y la ganancia promedio fue de 1.66 $/kWh.
Como era de esperarse, dado que el mecanismo de razonamiento brindó buenos resultados, el algoritmo de aprendizaje propuesto converge a su utilización en un alto grado, es decir con un λ resultante cercano a 1.
6. CONCLUSIONES
El modelo presentado en este artículo es una propuesta fundamentada en la lógica difusa y el aprendizaje de máquina para la definición del factor de contratación de los agentes comercializadores de energía a partir del análisis de algunas de las variables mas importantes del sector. A pesar que la lógica difusa en particular ha sido empleada con éxito en otros trabajos citados en la bibliografía, el modelo presentado en este capítulo presenta principalmente dos ventajas frente a estos. La primera es que posee una formulación muy simple según la cual se consideran únicamente dos de las variables más relevantes desde el punto de vista del comercializador. Si bien el considerar otras variables puede hacer que el modelo sea más robusto, también puede introducirle a éste más ruido. La segunda es que en este trabajo no sólo se presenta la formulación del modelo de inferencia, si no que también se determina su rendimiento (independiente de otras decisiones que pueda tomar un agente) de manera numérica por medio de su evaluación frente a una estrategia de contratación del 100% que correspondería a un perfil de comercializador pasivo. Tal análisis demostró de manera explícita que el modelo permite obtener ganancias promedio significativamente por encima de una estrategia pasiva.
En cuanto al mecanismo de aprendizaje puede agregarse que es un aporte que se hace desde la inteligencia artificial para el modelado del proceso de aprendizaje que puede ser llevado a cabo por agentes de software a partir de las decisiones que toman y de las implicaciones económicas que éstas les acarrean. Cabe señalar que en este artículo, dicho mecanismo se empleó en el mercado de energía eléctrica Colombiano, aunque puede ser extensible a otros mercados eléctricos, e incluso a otros contextos.
REFERENCIAS
[1] ISA. Análisis del Mercado Mayorista de la Electricidad en Colombia 1998 1999. Gerencia de Servicios de Información. 1999.
[2] MEDINA, S. & MORENO, J. Risk evaluation in Colombian electricity market using fuzzy logic. Energy Economics. Volume 29, Issue 5, September 2007, Pages 999-1009.
[3] MONTOYA, R. Herramienta para el apoyo de toma de decisiones de empresas comercializadoras / distribuidoras de energía. Tesis de Maestría Aprovechamiento de Recursos Hidráulicos, Universidad Nacional de Colombia. 2003
[4] MORENO, J. Modelo de simulación basado en agentes de software inteligentes para el aprendizaje de estrategias de comercialización de energía eléctrica en Colombia. Tesis de Maestría. Universidad Nacional de Colombia. 2006.
[5] MORENO, J. & OVALLE, D. Computational Hybrid System based on Neural-Fuzzy Techniques & Intelligent Software Agents to Assist Colombian Electricity Free Market. International Journal of Computational Intelligence Research, vol 3, #2. 2007.
[6] BOJADZIEV, G. & BOJADZIEV, M. Fuzzy logic for business, finance, and management. World Scientific Publishing Co. 1997.
[7] KOSKO, B. Pensamiento Borroso, la cueva ciencia de la lógica borrosa. Crítica. Barcelona. 1995.
[8] SUTTON, R. & BARTO, A. Reinforcement Learning: An Introduction. Cambridge, Massachusetts- USA. Bradford Book, MIT Press. 1998.
[9] MEDINA, S. Diseño de un sistema de soporte para la negociación de contratos de energía eléctrica. Tesis doctoral. Universidad Complutense de Madrid. 2006.
[10] SANCHEZ, L. Invierta con Éxito en la Bolsa de Valores. Ed. Prentice Hall. México. 2000.
[11] UPME: Unidad de Planeación Minero Energética. Una visión del mercado eléctrico colombiano. Bogotá. 2004.
[12] SUDKAMP, T. & HAMMELL, R. Interpolation, Completion and Learning Fuzzy Rules. IEEE transactions on systems, man and cybernetics, Vol 24, No 2, February. 1994.