Discriminación de fuentes de control temporal en programas de reforzamiento de intervalo

Discrimination of behavioral control sources in interval schedules of reinforcement

Óscar García-Leal*
Luis Alfaro-Hernández, Carlos A. Díaz-Lemus
Centro de Estudios e Investigaciones en Comportamiento
Universidad de Guadalajara. Guadalajara, México
* Correspondencia Óscar García Leal: Centro de Estudios e Investigaciones en Comportamiento
Universidad de Guadalajara, C/ Francisco de Quevedo #180 Col. Arcos Vallarta 44130,
Guadalajara Jalisco, México Teléfono: 52-33-38 18 07 36 Fax: 52-33-38 18 07 36
E-mail: oscargl@cencar.udg.mx

Recibido: 3 de noviembre del 2009 -Aceptado: 23 de noviembre del 2009


Resumen

Whitaker, lowe y Wearden reportaron un patrón diferencial de distribución de respuestas en un programa mixto de intervalo fijo de dos componentes, en función de la razón existente entre las duraciones de ambos intervalos. Estos resultados se explicaron aludiendo a la existencia de fuentes diferenciadas de control conductual para ambos componentes. En el presente estudio se pretendía contrastar esta hipótesis incluyendo una señal contextual que señalaba el programa de intervalo activo. Se utilizaron ocho ratas distribuidas en dos grupos con diferente razón y se compararon dos fases, una con discriminativo y otra sin este. Se encontró que la inclusión de la señal alteró la tasa de respuestas en los componentes de menor duración.

Palabras clave: control temporal, programa mixto de reforzamiento, clave contextual.


Abstract

Whitaker, lowe and Wearden reported a differential response pattern using a mixed two-component fixed-interval schedule of reinforcement, considering the ratio between the duration of both intervals. These results were explained in regards to the differential behavioral control sources for each component. This study was intended to contrast that hypothesis by including a contextual cue to mark the beginning of each active interval schedule. Eight rats were assigned to two groups with different ratio. In each ratio two conditions were in effect: one with a cue and the other without it. The results showed that the inclusion of the cue changed the response rate in the components with less duration.

Keywords: temporal control, mixed reinforcement schedule, contextual cue.


LOS PROGRAMAS de intervalo fijo han sido frecuentemente utilizados para el estudio del control temporal en animales (Ferster & Skinner, 1957; Skinner, 1938) de diferentes especies, como ratas, pichones, abejas o gatos (Grossman, 1973; lejeune & Jasselette, 1985; lejeune & richelle, 1982). En un programa de intervalo fijo, únicamente es reforzada la primera respuesta emitida tras haber transcurrido un periodo de tiempo especificado y constante a lo largo de la sesión experimental. A un nuevo periodo temporal sin reforzamiento se da inicio desde esa respuesta reforzada. Transcurrido ese periodo de tiempo, de nuevo la primera respuesta es reforzada de tal manera que el momento de reforzamiento marca el momento temporal de inicio de un nuevo periodo.

Durante los momentos iniciales del intervalo temporal se observa ausencia de respuestas o una tasa muy baja de emisión (lowe, Harzem & Spencer, 1979; lowe & Wearden, 1981). La tasa de respuesta se incrementa de manera progresiva a medida que se aproxima la finalización del intervalo temporal. La mayor tasa de respuesta se observa en los segundos inmediatamente anteriores a la oportunidad de obtener el reforzador (Dews, 1978; Schneider, 1969) y coincide con el valor de duración del intervalo. Lejeune y Wearden (1991) propusieron que el patrón de respuestas que resulta del entrenamiento prolongado en un programa de intervalo fijo toma la forma de la mitad izquierda de una curva gaussiana, con el pico más alto de la distribución de respuestas localizado en el valor del componente. Cuando esto ocurre, se dice que el animal exhibe control temporal de la conducta, en cuanto ajusta su ejecución al criterio temporal que delimita la posibilidad de obtención del reforzador.

Este patrón de ejecución observado varía cuando se presentan dos valores posibles de intervalo, de manera alternada o aleatoria, en función de la diferencia existente entre estos valores (leak & Gibbon, 1995; Machado, 1997). Este procedimiento experimental se conoce bajo el título de programa mixto de reforzamiento de dos componentes de intervalo fijo (Skinner, 1957). En este tipo de programas, la duración de cada uno de los componentes es necesariamente diferente. Sin embargo, no existe ninguna clave ambiental que identifique el componente activo del programa y, por tanto, que permita diferenciar en cuál de dos momentos temporales distintos estará disponible el reforzador.

Catania y reynolds (1968) y leak y Gibbon (1995) reportaron que la variación de la tasa de respuesta en el componente de mayor duración era función de la razón existente entre los valores de los componentes del programa.

En un trabajo reciente Whitaker, lowe y Wearden (2003) reportaron una serie de estudios realizados con ratas, en los que, utilizando un programa mixto de reforzamiento de dos componentes de intervalo fijo, equiprobables y presentados de manera aleatoria, analizaron el efecto de la razón existente entre ambos componentes sobre la tasa de respuesta observada en el componente de mayor duración.

Los estudios realizados mostraron que cuando la razón utilizada era superior a 4 (i. e., mix IF 30 s IF 240 s) las ratas exhibieron un incremento de la tasa de respuesta en los momentos inmediatamente anteriores a la disponibilidad del reforzador para cada uno de los componentes del programa.

De la distribución de la tasa de respuesta a lo largo del componente se puede dar razón considerando la suma de la distribución de la tasa de respuesta que se observaría en caso de considerarse la ejecución en cada uno de los componentes de manera independiente.

Sin embargo, cuando la razón entre ambos componentes era inferior a 4 (i. e., mix 80 s 120 s), este patrón no se observaba y se encontraba un único pico de respuesta o incremento en la tasa de respuesta, coincidente con el valor del componente de más larga duración.

Estos resultados fueron explicados bajo el supuesto de que ambos periodos temporales considerados en el programa eran estimados por los sujetos de manera independiente (leak & Gibbon, 1995). Los autores apelaron de este modo a fuentes de control conductual independientes y específicas de cada uno de los componentes presentados. Cuando la razón entre ambos componentes es larga (superior a 4:1), la diferencia entre los valores utilizados permite la discriminación clara del componente del programa activo, de tal manera que se observa un doble pico en la distribución de respuestas que refleja la estimación independiente de ambos intervalos. Sin embargo, cuando la razón es pequeña (los autores estimaron una razón inferior a 4:1), el componente activo no es discriminable y, en consecuencia, se observa un incremento progresivo en la distribución de respuestas conforme se aproxima el valor del componente de mayor duración.

En el estudio que se describe en este documento, siguiendo los trabajos realizados por otros autores (Catania & reynolds, 1968; Meck & Church, 1983) y con el objetivo de contrastar la operación de fuentes de control conductual diferenciadas para cada uno de los componentes, se diseñó una preparación en la que, utilizando ratas como sujetos experimentales, se asoció a cada uno de los dos componentes de un programa mixto de intervalo fijo un evento señalizador diferenciado o prime durante los primeros tres segundos, así mismo, se manipuló la razón entre los componentes del programa.

Se analizó la ejecución de dos grupos de ratas en dos programas mixtos de reforzamiento de dos componentes de intervalo fijo de corta (C) y larga (L) duración. Un grupo fue expuesto a una razón L:C pequeña entre sus componentes, con un valor igual a 3 y se utilizaron valores de intervalo de 90 s y 30 s respectivamente, en tanto el otro grupo fue expuesto a una razón L:C igual a 6, con valores de intervalo de 180 s y 30 s respectivamente.

De este modo, el componente de menor duración del programa será identificado como de corta duración y el de mayor duración como de duración larga, al margen de las duraciones reales de cada uno de ellos.

Durante los primeros tres segundos de cada uno de los componentes, se presentó un prime o clave contextual que identificaba el componente del programa activo, con el objetivo de analizar si la inclusión de claves contextuales de duración breve alteraba el control temporal de la conducta en ausencia de señales. Si esta inclusión es efectiva y, por tanto, la señal introducida permite seleccionar la fuente de control conductual correspondiente al componente presentado, debería observarse una alteración significativa en la distribución de la tasa de respuesta de los animales pertenecientes al grupo con razón L:C superior a 4, en relación con lo descrito en otros estudios, en el sentido de eliminarse o suavizarse el incremento de la tasa de respuesta coincidente con la duración del intervalo de corta duración. Este mismo resultado se observaría para el grupo con una razón L:C inferior a 4.

Método

Sujetos

ocho ratas macho de la cepa Wistar (Rattus norvegicus), experimentalmente ingenuas, de 5 meses de edad en el momento de iniciarse el experimento, sometidas a un régimen de privación de agua con 30 minutos de acceso diarios y acceso libre a comida durante el experimento.

Materiales

Se utilizaron cuatro cajas operantes de experimentación marca MED, modelo ENV-007, con un área de trabajo de 30 cm de largo x 25 cm de ancho x 21 cm de alto. En la pared frontal de la caja se localizaba una puerta de acceso de poliuretano transparente. La pared distal estaba compuesta del mismo material. El lateral derecho de la caja estaba conformado por tres vías de acero inoxidable en las que se insertaron los componentes utilizados en el estudio. En la vía central se insertó un dispensador de agua de tipo brazo modelo ENV-202M, a 2.5 cm del suelo, con capacidad para dispensar 0.04 cc de agua en cada administración. En ese mismo lateral, en la vía localizada junto a la pared frontal (izquierda del dispensador de agua) se insertó una palanca retráctil, modelo ENV-112CM, a 7 cm del piso (rejilla). La presión que era necesario ejercer sobre la palanca para que se registrara una respuesta era de 0.2 newtons. Sobre la palanca, a 12 cm del piso, se instaló un foco luminoso, modelo ENV-221M. Un foco semejante se instaló a 12 cm del piso en la vía lateral localizada a la derecha del dispensador de agua. En la pared opuesta (lateral izquierdo de la caja), se instaló un generador de tonos, modelo ENV-223AM, así como la luz general de la caja experimental, modelo ENV-215M. Las cajas experimentales se instalaron en el interior de cajas de aislamiento acústico, modelo ENV-022M, con el objetivo de aislar al animal durante la sesión de ruidos ajenos a la propia situación experimental.

Procedimiento

Las ratas fueron moldeadas a emitir una respuesta de palanqueo sobre la palanca localizada a la izquierda del dispensador de agua (junto a la puerta de acceso a la caja experimental), utilizando un programa de reforzamiento continuo, sin señal contingente a la obtención del reforzador. Finalizado el entrenamiento, las ratas se distribuyeron en dos grupos, integrado cada uno de ellos por 4 ratas.

El Grupo 1 fue expuesto a programas de reforzamiento de intervalo fijo de 30 s y 90 s de duración, de acuerdo al procedimiento que se describirá a continuación. El Grupo 2 fue expuesto a programas de reforzamiento de intervalo fijo de 30 s y 180 s.

Cada uno de los intervalos entrenados fue señalado por un estímulo de tres segundos de duración al inicio. Estos tres segundos se insertaban dentro del intervalo de tiempo entrenado (i. e., cuando se entrenaba un valor de intervalo de 30 segundos, los tres primeros segundos estuvieron señalizados, en tanto que en los 27 segundos restantes no hubo ninguna señal presente).

Para ambos grupos, durante los tres primeros segundos del componente corto —C— se emitió un tono, en tanto que una señal luminosa (se encendían durante tres segundos los focos localizados a ambos lados del dispensador de agua) se presentó cuando el componente activo era de larga duración —L— (tabla 1).

 

Grupo if corto (s) if largo (s) Razón (l:c)

Transcurrido el intervalo de tiempo correspondiente al componente activo, la primera respuesta era reforzada entregándose 0.04 cc de agua. El agua estaba disponible durante cinco segundos. Transcurrido este tiempo, el dispensador de agua se retraía. Durante los cinco segundos siguientes se apagaba la luz general de la caja y se retraía la palanca. A continuación, se encendía la luz general de la caja experimental y se presentaba un nuevo componente del programa.

Los grupos fueron expuestos a tres fases experimentales. A continuación se describe cada una de estas.

Durante la Fase 1, las ratas fueron entrenadas en cada uno de los componentes del programa de manera independiente. Se contrabalanceó, en cada uno de los grupos, el orden en que se presentaron los valores de intervalo utilizados en las fases siguientes. De este modo, en cada uno de los grupos la mitad de las ratas fueron entrenadas inicialmente en el componente C y posteriormente en el L, en tanto que la otra mitad fue expuesta en primer lugar al componente L y posteriormente al C.

En las sesiones 1 a 36 se expuso a los animales al primero de los componentes; durante las siguientes 10 sesiones (sesiones 37 a 46) fueron expuestos al segundo de ellos. Cada sesión de entrenamiento estuvo integrada por 40 presentaciones del componente activo.

La Fase 2 estuvo conformada por un total de 31 sesiones (sesiones 47 a 77) de entrenamiento bajo un programa de reforzamiento, al que se denominó “mixto con señal breve”, integrado por los dos componentes de intervalo fijo entrenados previamente. El orden de presentación de los componentes del programa fue aleatorio. Cada componente fue presentado en 20 ocasiones en cada sesión.

Durante las siguientes dos sesiones (sesiones 78 y 79), que constituyeron la Fase 3, se eliminó la señal que identificaba el componente activo del programa, de este modo ambos grupos fueron expuestos a un programa mixto de reforzamiento de dos componentes de intervalo fijo (mix IF IF). El resto de los elementos se mantuvieron como en la Fase 2.

Resultados

La tasa de respuesta correspondiente a la ejecución promedio de los animales asignados a cada uno de los grupos fue normalizada con el objetivo de facilitar la comparación entre ellos.

Durante la Fase 1 se entrenó a cada grupo en cada uno de los componentes de manera independiente. Como se puede observar en la Figura 1, el orden de entrenamiento no tuvo efecto sobre la distribución relativa de respuestas a lo largo del componente para ninguno de los grupos. Las funciones promedio correspondientes a las ratas entrenadas en cada uno de los componentes se solapan independientemente del orden de entrenamiento y del número de sesiones de entrenamiento en cada uno de los componentes. Estos resultados se observan para ambos grupos.

El patrón de distribución de respuestas no fue sensible al número de sesiones de entrenamiento. El orden de entrenamiento de cada uno de los componentes utilizados en cada grupo fue balanceado; sin embargo, se utilizaron 36 sesiones de entrenamiento para el primero de los componentes presentados y únicamente 10 sesiones para el segundo de los componentes. No se observaron diferencias en la distribución de respuestas relativas, ni en relación con el orden de entrenamiento, ni en relación con el número de sesiones.

En ambos grupos se observó un patrón de ejecución característico de los programas de intervalo fijo, con tasas de respuesta muy bajas durante los primeros segmentos del intervalo y un incremento progresivo conforme se acercaba el final y, por tanto, la disponibilidad del reforzador.

Con el objetivo de contrastar que la distribución de respuestas en relación con el momento de reforzamiento es proporcional a la duración del intervalo entrenado, en la Figura 2, se grafica la tasa de respuesta normalizada correspondiente a ambos grupos en cada uno de los componentes entrenados, considerándose diez segmentos temporales en cada intervalo, de tal suerte que la duración de cada segmento temporal corresponde a 3 s, en el caso del componente C (de 30 s de duración) y 9 s y 18 s, en los casos de los componentes L de 90 s y 180 s utilizados en los grupos 1 y 2, respectivamente.

En la Figura 3 se presentan las tasas de respuesta durante el componente L de los grupos 1 y 2 en las dos fases siguientes. Asimismo, en el apéndice A se presentan los datos individuales correspondientes a cada una de las ratas de ambos grupos. Los datos promediados reflejan adecuadamente las ejecuciones individuales de cada uno de los grupos, por lo que los datos serán discutidos en estos términos.

El incremento de la tasa de respuesta para cada uno de los componentes entrenados a lo largo del tiempo fue proporcional a la duración del componente (Gibbon, 1977) e independiente del orden de entrenamiento. Durante la Fase 2, en cada sesión, se presentaron, en 40 ocasiones y de manera aleatoria, ambos componentes entrenados previamente al introducirse la señal que identificaba el componente activo. En 20 ocasiones se presentó el componente C y en las 20 restantes el componente L. Si se consideran próximo al momento de disponibilidad del re-de manera conjunta los 20 ensayos de entrena-forzador del componente C es menor que la obmiento en el componente L (90 s para el Grupo 1 servada en el intervalo temporal cercano al valor y 180 s para el Grupo 2), se observa para ambos del componente L. Este resultado, de manera grupos un incremento en la frecuencia de res-coherente con lo reportado en la literatura, se puesta en el segmento del intervalo correspon-invierte para el Grupo 2, expuesto a una razón diente al momento en el que estaría disponible L:C superior a 4. El reforzador en el componente C del programa Se observa, igualmente, que para ambos (véanse paneles a y b de la Figura 3). Grupos la densidad de respuesta en el segmento

Asimismo, se observa que para el Grupo temporal correspondiente al componente C es 1 la tasa de respuesta en el intervalo temporal próximo al momento de disponibilidad del reforzador del componente C es menor que la observada en el intervalo temporal cercano al valor del componente L. Este resultado, de manera coherente con lo reportado en la literatura, se invierte para el Grupo 2, expuesto a una razón L:C superior a 4.

Se observa, igualmente, que para ambos grupos la densidad de respuesta en el segmento temporal correspondiente al componente C es significativamente menor que la observada en el componente L.

En ambos casos las distribuciones obtenidas pueden replicarse satisfactoriamente mediante la suma de dos funciones gaussianas, tal tal como leak y Gibbon (1995) sugirieron, con lo que se obtendrá un coeficiente de determinación de 0.92 para el Grupo 1 y de 0.71 para el Grupo 2.

En el Grupo 1, el valor promedio de la función gaussiana estimada correspondiente al componente C del programa es ligeramente superior que el valor del componente entrenado (36 s). El mismo resultado se observa en el caso del componente L, para el que se estima un valor ligeramente superior al valor del componente entrenado (115 s).

La función estimada para dar razón de la distribución promedio de la tasa de respuesta correspondiente al Grupo 2 permite observar, de manera semejante a lo observado en el Grupo 1, un pico en un valor temporal ligeramente superior al entrenado con el componente C (36 s). El valor correspondiente al componente L resulta de difícil interpretación, al estimarse un valor significativamente superior al valor del componente entrenado (531 s).

Whitaker, lowe y Wearden (2003) fijaron uno de los dos valores promedio, correspondientes a las dos funciones gaussianas empleadas para dar razón de la distribución de respuesta en sus estudios, al valor del componente de mayor longitud. De ese modo dieron solución matemática al problema teórico que implica que del procedimiento de estimación se infiera un valor de intervalo al que los participantes nunca fueron expuestos.

Durante la Fase 3 del estudio se retiraron las señales breves introducidas al inicio de cada uno de los componentes y se presentó un programa mixto de reforzamiento de dos componentes. La distribución de la tasa de respuesta promedio de ambos grupos no se vio alterada significativamente en relación con la Fase 2 del estudio (vénase paneles c y d de la Figura 3).

De nuevo, los resultados de ambos grupos pueden describirse satisfactoriamente como la suma de dos funciones gaussianas, cada una de las cuales da razón de fuentes de control diferenciadas para cada uno de los valores de intervalo utilizados en el estudio. Los coeficientes de determinación estimados para los grupos 1 y 2 fueron de 0.94 y 0.81, respectivamente.

En el Grupo 1, se observa que el valor promedio de la función gaussiana que da razón de la distribución de respuestas en el intervalo temporal correspondiente al componente C es ligeramente superior al valor del componente entrenado (37 s). En oposición a lo observado en la Fase 2, el valor estimado correspondiente al componente L es inferior al valor real del componente (86 s). En general, se observa el mismo patrón de variación de la tasa de respuesta que en la Fase 1, si bien la tasa de respuesta promedio es ligeramente superior a la observada durante esta fase.

El mismo resultado es observado en el caso del Grupo 2. Los valores promedio de las funciones gaussianas estimadas son ligeramente inferiores y notablemente superiores a los valores de los componentes C y L, respectivamente, pues se obtienen valores estimados de 29 y 675 segundos. Asimismo, se observa una tasa de respuesta general a lo largo del componente ligeramente superior a la observada en la Fase 2.

En la Figura 4 se grafica el efecto que tuvo la eliminación de la señal sobre la tasa de respuesta estimada a partir de las funciones gaussianas calculadas correspondientes al componente C. Para ambos grupos se observó un incremento de la tasa de respuesta estimada. El paralelismo entre las curvas correspondientes a cada uno de los grupos pone de manifiesto que el incremento de la tasa de respuesta fue independiente de la duración del componente L del programa.

Discusión

El trabajo realizado amplía los estudios de Whitaker, lowe y Wearden (2003), con el objetivo de contrastar si una señal breve, introducida al inicio de cada uno de los componentes que conformaban los programas mixtos de reforzamiento utilizados, ejercía control sobre la distribución de respuestas de los organismos en el componente de larga duración de un programa mixto de reforzamiento de dos componentes. Y, en caso de que así fuera, establecer si la razón existente entre las duraciones de los componentes utilizados determinaba la magnitud del efecto.

Los resultados obtenidos durante la Fase 1 del experimento indican que las ratas ajustan su conducta de manera muy rápida a las restricciones temporales especificadas en un programa temporal de reforzamiento, al menos en aquellos casos en los que se utiliza un programa de intervalo fijo.

Este resultado es semejante al encontrado con pichones y aparece frecuentemente reportado en la literatura (Ferster & Skinner, 1957).

Los resultados obtenidos ponen de manifiesto, del mismo modo que se ha encontrado en repetidos estudios, que la distribución de la tasa de respuesta durante un programa de intervalo está directamente relacionada con la longitud del intervalo, de tal manera que las respuestas se distribuyen en relación con el momento de disponibilidad del reforzador de manera proporcional a la duración del intervalo a estimar. Esto se observa claramente en la Figura 2, en la que aparece la distribución de respuestas relativa considerando 10 segmentos temporales a lo largo de cada uno de los componentes que se tuvieron en cuenta en el estudio para ambos grupos (cada segmento recoge la tasa de respuesta normalizada correspondiente a 3 s —IF 30 s—, 9 s —IF 90 s— y 18 s —IF 180 s—).

Los programas mixtos de reforzamiento de al menos dos componentes de intervalo fijo han sido utilizados tradicionalmente para el estudio del control temporal de la conducta. Cuando un grupo de ratas es expuesto a este tipo de programas compuestos y se analiza la variación de la tasa de respuesta durante el componente de mayor duración, típicamente se observa una distribución de respuestas dependiente de la razón entre las duraciones de los componentes utilizados.

En diversos estudios (Catania & reynolds, 1968; leak & Gibbon, 1995 y Whitaker, lowe & Wearden, 2003) se han reportado dos picos en la distribución de respuestas coincidentes con los valores de cada uno de los componentes. Este resultado se ha reportado de manera consistente cuando la razón entre las duraciones de ambos componentes es mayor que 4, esto es, cuando la duración del componente de mayor duración es por lo menos cuatro veces superior a la del componente de duración más breve.

Sin embargo, Whitaker, lowe y Wearden (2003) reportaron, que cuando la razón es inferior a este valor, habitualmente no se observa este patrón de variación de la tasa de respuesta, y únicamente se observa un incremento de la tasa de respuesta conforme se aproxima el momento de disponibilidad del reforzador, de tal manera que la mayor tasa de respuesta coincide con el valor del componente de larga duración. Este patrón de distribución es más notorio a medida que la razón disminuye.

Cuando, finalmente, el valor de la razón es cercano a 4, se observa, aún en los resultados reportados por Whitaker, lowe y Wearden (2003), un incremento creciente de la tasa de respuesta coincidente con el valor del componente corto del programa.

Con razones cercanas a 4 la tasa de respuesta coincidente con el valor temporal del momento de disponibilidad del reforzador para el componente C es menor a la tasa correspondiente al componente de larga duración (véanse paneles a y C de la Figura 3). A medida que la razón se incrementa, como puede observarse en los resultados obtenidos en el estudio realizado (véanse paneles B y D de la Figura 3), la tasa de respuesta correspondiente al momento de disponibilidad del reforzador del componente C se incrementa aún más y llega a ser superior a la tasa de respuesta que se observa en los momentos cercanos a la disponibilidad de reforzador para el componente L.

A partir de los resultados obtenidos, así como los reportados por Whitaker, lowe y Wearden (2003), se puede inferir un proceso de transición en la distribución de la tasa de respuesta a lo largo del componente L dependiente de la razón existente entre los dos componentes utilizados en un programa mixto de reforzamiento. A medida que se incrementa la razón entre los valores temporales de ambos componentes, se incrementa la tasa de respuesta coincidente con el valor temporal de disponibilidad del reforzador para el componente C, aun cuando el reforzamiento no está disponible, por cuanto el componente activo es el L.

Estos resultados se han explicado a partir de la consideración de fuentes de control conductual diferenciadas para cada uno de los intervalos a estimar.

Considerando los resultados obtenidos en el estudio, cuando la diferencia entre las duraciones de cada uno de los componentes es corta, la discriminabilidad de la fuente de control conductual es menor y como resultado se observa: (a) una mayor tasa de respuesta general a lo largo del componente de larga duración y (b) una menor diferencia en el pico de la tasa de respuesta para cada uno de los componentes utilizados.

Cuando, por el contrario, la diferencia se incrementa, es más discriminable la fuente de control conductual. Por tanto, la tasa de respuesta correspondiente al momento de disponibilidad de reforzador de cada uno de los componentes es más claramente diferenciada en la sesión.

Esta propuesta puede dar razón de los resultados observados en aquellos casos en los que no existe ninguna señal que discrimine el componente del programa activo.

La inclusión de una señal breve al inicio de cada uno de los componentes debería facilitar la discriminación de la fuente de control conductual. Por tanto, se esperaría una disminución significativa de la tasa de respuesta correspondiente al momento de disponibilidad del reforzador en el componente de corta duración, cuando se analiza la distribución de respuestas correspondiente al componente de mayor duración. Se esperaría observar, especialmente con razones pequeñas (inferiores a 4), una mayor diferencia en los picos de la tasa de respuesta correspondientes al momento de disponibilidad del reforzador para cada uno de los componentes que la observada cuando la señal no es introducida.

Los resultados obtenidos señalan efectos empíricamente significativos en la dirección señalada. Considerando las funciones gaussianas estimadas correspondientes a la distribución de respuestas cercanas al momento de disponibilidad del reforzador del componente C, se observa que el valor más elevado estimado es menor durante la Fase 2 que durante la Fase 3, en la que no se presentaba la señal relacionada con el componente activo (ver Figura 4). Por tanto, la inclusión de una señal breve al inicio del intervalo, si bien no alteró significativamente el patrón general de respuesta observado durante el componente L, sí disminuyó la tasa de respuesta correspondiente al momento de disponibilidad del reforzador para el componente C; de esta manera se observa un aplanamiento de la función de distribución de respuestas en la Fase 2 (tanto con razones inferiores a 4 como superiores) en relación con la observada en la Fase 3. Esto ocurrió para ambos grupos en la misma magnitud, de tal manera que ni la longitud del componente ni la razón L:C modificó la magnitud del efecto de la inclusión de una señal breve.

Estos resultados apoyan la hipótesis de que el grado de solapamiento entre fuentes de control diferenciadas puede dar razón de la distribución de respuesta observada durante la sesión. La inclusión de una señal breve, si bien no arroja patrones diferenciales de respuesta correspondientes a cada uno de los componentes del programa (lo que implicaría fuentes de control claramente diferenciadas para cada uno de ellos), sí reduce de manera empíricamente significativa la tasa de respuesta correspondiente al momento de reforzamiento del componente C y, en este sentido, facilita la discriminabilidad de la fuente de control conductual correspondiente al componente activo.


Referencias

Catania, a. C. & reynolds, G. S. (1968). A quantitative Analysis of responding maintained by interval schedules of reinforcement. Journal of the Experimental Analysis of Behavior, 11, 327-338.

Dews, P. B. (1978). Studies on responding under fixed interval schedules of reinforcement: II. The scalloped pattern on the cumulative record. Journal of the Experimental Analysis of Behavior, 29, 67-75.

Ferster, C. B. & Skinner, B. F. (1957). Schedules of reinforcement. New York: appleton-Century-Crofts, inc.

Gibbon, J. (1977). Scalar expectancy theory and Weber’s law in animal timing. Psychological Review, 84, 278-325.

Grossman, K. E. (1973). Continuous, fixed-ratio and fixed-interval reinforcement in honey bees. Journal of the Experimental Analysis of Behavior, 20, 105-109.

Leak, T. & Gibbon, J. (1995). Simultaneous timing of multiple intervals: implications of the scalar property. Journal of Experimental Psychology: Animal behavior processes, 21, 3-19.

Lejeune, H. & Jasselette, P. (1985). Fixed-interval and fixed-time treadle pressing in the pigeon: a comparision with FI and FT keypecking. Behavioural Processes, 11, 131-152.

Lejeune, H. & richelle, M. (1982). Fixed-interval performance in turtle doves: a comparison with pigeons and rats. Behaviour Analysis Letters, 2, 87-95.

Lejeune, H. & Wearden, J. H. (1991). The comparative psychology of fixed-interval responding: Some quantitative analysis. Learning and Motivation, 22, 84-111.

Lowe, C. F., Harzem, P. & Spencer, P. T. (1979). Temporal control of behavior and the power law. Journal of the Experimental Analysis of Behavior, 31, 333-343.

Lowe, C. F. & Wearden, J. H. (1981). Weber’s law and the fixed-interval post-reinforcement pause. Behaviour Analysis Letters, 1, 27-32.

Machado, a. (1997). Learning the temporal dynamics of behavior. Psychological Review, 104, 241-265.

Meck, W. H. & Church, R. M. (1983). A mode control model of counting and timing processes. Journal of Experimental Psychology: Animal Behavior Processes, 9, 320-334.

Schneider, B. A. (1969). A two-state analysis of fixedinterval responding in the pigeon. Journal of the Experimental Analysis of Behavior, 12, 667-687.

Skinner, B. F. (1938). The behavior of organism. New York: appleton-Century.

Whitaker, S., lowe, C. F. & Wearden, J. H. (2003). Multiple-interval timing in rats: Performance on two-valued mixed fixed-interval schedules. Journal of Experimental Psychology: Animal Behavior Processes, 29, 277-291.