UNIVERSIDAD NACIONAL AUTÓNOMA DE MÉXICO FACULTAD DE ESTUDIOS SUPERIORES ZARAGOZA CARRERA DE PSICOLOGÍA LA METÁFORA Y UN MODELO TEÓRICO DE LA PSICOLOGÍA CLÍNICA: MODELO DE TERAPIA BREVE DEL MRI T E S I S QUE PARA OBTENER EL TÍTULO DE: LICENCIADO EN PSICOLOGÍA P R E S E N T A : JOSÉ ARIEL MENDOZA ROMERO JURADO DE EXAMEN DIRECTOR: MTRO. PEDRO VARGAS AVALOS COMITÉ: DR. RODOLFO HIPÓLITO CORONA MIRANDA LIC. PATRICIA BAÑUELOS LAGUNES MTRO. VICENTE CRUZ SILVA LIC. JOSÉ JUAN BAUTISTA BUTRÓN CIUDAD DE MÉXICO AGOSTO 2017 UNAM – Dirección General de Bibliotecas Tesis Digitales Restricciones de uso DERECHOS RESERVADOS © PROHIBIDA SU REPRODUCCIÓN TOTAL O PARCIAL Todo el material contenido en esta tesis esta protegido por la Ley Federal del Derecho de Autor (LFDA) de los Estados Unidos Mexicanos (México). El uso de imágenes, fragmentos de videos, y demás material que sea objeto de protección de los derechos de autor, será exclusivamente para fines educativos e informativos y deberá citar la fuente donde la obtuvo mencionando el autor o autores. Cualquier uso distinto como el lucro, reproducción, edición o modificación, será perseguido y sancionado por el respectivo titular de los Derechos de Autor. A mis padres: Ariel Mendoza Flores y Liliana Verónica Romero Chávez Gracias por todo. Agradecimientos Las palabras de agradecimiento siempre son algo malagradecidas ya que no permiten capturar con justicia la enorme gratitud sentida por el apoyo que se recibe. Y más aún cuando la empresa ha sido de largo aliento. Sin embargo, ni el temblor del lenguaje ni las exigencias propias de una realidad inapresable son excusa para dejar de intentar reconocer las dudas adquiridas por la generosidad de la vida. Y si se trata de deudas la primera es con mis padres: Ariel Mendoza y Verónica Romero. Gracias padres por su apoyo incondicional no sólo en relación a este proyecto, sino con mi vida. Les agradezco infinitamente todos tus esfuerzos y sacrificios que han realizado por el bienestar de la familia, ya que me han permitido tener la oportunidad de contar con las garantías necesarias para que me desarrollara. Su compromiso constante con mi formación y su confianza en mi capacidad me facultaron para poder tomar riesgos como este. Madre, eres una mujer admirable por tú honestidad, buen juicio y generosidad. Te agradezco el aliento en estos meses para concluir mi trabajo. Padre, tú espíritu crítico fue esencial para mi educación: gracias a ti evite la ceguera del dogmatismo y la pobreza espiritual que deviene de la conformidad. Di ti aprendí a indignarme ante la injusticia y a trabajar pensando en el bienestar común. Estoy en deuda permanente conustedes por la confianza depositada en mí y por el tiempo que me han permitido estudiar. Pocas hazañas son tan grandes en esta época marcada por la barbarie como facultar el proceso creativo de alguien, ustedes lo hecho, por lo cual les agradezco infinitamente su apoyo. Les dedico a ustedes este trabajo y los que sigan. Les agradezco mis hermanos Mauricio y Jonás Mendoza Romero por su apoyo, sin el cual hubiera sido irrealizable este trabajo. Los quiero. Y a Ozzy también, ya que llegó para enseñarnos a ser más pacientes. Familia este no es mi logró sino es nuestro. Gracias por su amor. Hago expresa mi gratitud al Maestro Pedro Vargas por acompañarme desde el inicio de esta Odisea; sus aclaraciones, sugerencias y correcciones fueron esenciales para llevar esta empresa a buen término. Ha sido muy satisfactorio trabajar con usted. También le agradezco al Dr. Rodolfo Corona por orientarme con su trabajo doctoral. A la maestra Patricia Bañuelos por su contribución a mi formación y por su constante guía personal y profesional durante la carrera. Y al maestro José Juan Bautista por comprender el escenario en el que me encontraba. La lista de maestros quedaría incompleta sin nombrar a aquellos que con su compromiso, ciencia y experiencia enriquecieron de manera notable mi formación: Lidia Beltrán, Sergio Mandujano, Vicente Cruz y Juan Carlos del Razo. Mención especial merece el maestro Alberto Patiño: seguramente mi humanidad estaría empobrecida sin sus palabras. También le agradezco a la Dra. Ana Rosa Pérez Ransanz del Instituto de Investigaciones Filosóficas- UNAM por su, aliento y confianza para que continuara mis estudios en filosofía de la ciencia. “La metáfora es una forma de conocimiento”: le escuche decir a la Dra. Mariana Bernárdez en una de sus hermosas clases de los jueves en la Casa del Lago; fue gracias a ese nudo –y a otros- que se gestó esta investigación, y que me parece no ha de terminar. Por lo cual le agradezco a Mariana por haberme mostrado diferentes horizontes de comprensión; por enseñarme la importancia de reconocer y apreciar otras formas de conocimiento; y por ayudarme a comprender que la epistemología no está divorciada de la estética, ni que el pensamiento esta escindido de la vida. Gracias por ayudarme a pensar desde la pluralidad. Quisiera agradecer su constante apoyo y atenciones a mis amigas Idalia Ramírez y Saraí Quintana, creo que de no haber sido por su amabilidad y paciencia hubiera comprometido de más mi estancia en la facultad. Agradezco ampliamente a mis queridos amigos Iván Bermúdez, Giovanni Ramos, Jessica León, Angélica Navarro, Michelle Fuentes, Ilse Lizbeth Ávila y Mario Acevedo. También a mis amigos de la Casa del Lago: Alejandra, Mario, Susana y Hugo Y de manera especial a los camaradas Alejandro Paredes, Roberto Rivera y Alejandro Zamudio. Gracias a todos ellos ya que en diferentes etapas de este proyecto, y de mi vida, me han ofrecido su apoyo, cariño y confianza. Su amistad ha sido para mí asidero y aliciente. Quiero dar las gracias al espacio donde principalmente realice el presente ejercicio: la Biblioteca de México; especialmente a la Lic. Roció Guerrero, Subdirectora de Bibliotecas Estatales y Municipales y Coordinadora de las Bibliotecas Personales de Alí Chumacero y Jaime García Terrés, y junto con ella a los bibliotecarios de estas salas por la hospitalidad, confianza y facilidades con que me permitieron trabajar en sus bellas instalaciones. Sospecho que mi trabajo lleva impronta de la biblioteca de Don Jaime, pues me aproveche de manera inmoral de su colección, así que de cierta manera también le agradezco a él por su buen gusto y generosidad. Por último quiero manifestar mi gratitud con la UNAM y con la FES-Z por darme la posibilidad de formarme personal y profesionalmente, y por contribuir a construir el principio de esperanza por medio del trabajo de toda la comunidad universitaria. Índice de contenido RESUMEN ......................................................................................................................... 1 INTRODUCCIÓN ............................................................................................................ 2 CAPÍTULO 1. LA METÁFORA EN LA CIENCIA ..................................................... 7 1.1 TEORÍAS CLÁSICAS SOBRE LA METÁFORA ................................................................. 9 1.1.1 Aristóteles y la Tradición Retórica .................................................................... 9 1.1.2 Nietzsche: La Genealogía del Concepto ......................................................... 14 1.1.3 El Giro Cognitivo ............................................................................................. 16 1.2 METÁFORA Y LENGUAJE .......................................................................................... 20 1.2.1 Lenguaje y Conocimiento ................................................................................ 20 1.2.2 Metáfora Viva y Metáfora Muerta ................................................................... 27 1.3 LA METÁFORA DESDE LA FILOSOFÍA DE LA CIENCIA ................................................ 31 1.3.1 Metáfora y Heurística ....................................................................................... 32 1.3.2 Teorías Semántico e Interaccionistas ............................................................... 36 1.3.3 Teorías Pragmáticas ......................................................................................... 51 1.3.4 Metáfora y Modelo ........................................................................................... 57 CAPÍTULO 2. DESARROLLO HISTÓRICO-CONCEPTUAL DE LA CIBERNÉTICA .......................................................................................................................... 65 2.1 ANTECEDENTES: SEGUNDA GUERRA MUNDIAL ....................................................... 66 2.1.1 Proyecto de Artillería Antiaérea: 1941-1943 ................................................... 66 2.1.2 Teoría de la Información .................................................................................. 71 2.2 CONFERENCIAS MACY ............................................................................................. 79 2.2.1 Teleological Society ......................................................................................... 79 2.2.2 The Cybernetics Group: 1946-1953 ................................................................. 81 2.2.3 Metáfora y Modelo en las Conferencias Macy ................................................ 88 CAPÍTULO 3. GREGORY BATESON: HISTORIA DE UNA AVENTURA INTELECTUAL ......................................................................................................................... 93 3.1 BIÓLOGO Y ANTROPÓLOGO ...................................................................................... 95 3.2 PARTICIPACIÓN EN LAS CONFERENCIAS MACY ...................................................... 101 3.3 TEÓRICO DE LA COMUNICACIÓN ............................................................................ 110 3.4 PROYECTO BATESON: 1952-1962 ........................................................................... 118 3.5 ETÓLOGO ............................................................................................................... 150 3.6 PASOS HACIA UNA EPISTEMOLOGÍA CIBERNÉTICA ................................................. 153 CAPÍTULO 4. MODELO TEÓRICO DEL BTC: DE LA METÁFORA DE LA ENERGÍA A LA METÁFORA DE LA INFORMACIÓN ................................................... 171 4.1 ORÍGENES DEL MRI Y DEL BTC ............................................................................. 172 4.2 LA HERENCIA DE MILTON H. ERICKSON ................................................................ 176 4.3 MODELO DE TERAPIA BREVE DEL BTC DEL MRI .................................................. 178 4.3.1 Modelos Teóricos que Configuran al BTC .................................................... 179 4.3.2 Modelo Comunicacional del MRI .................................................................. 185 4.3.3 Modelo de Terapia Breve del BTC ................................................................ 193 CONCLUSIONES ......................................................................................................... 212 REFERENCIAS BIBLIOGRÁFICAS ........................................................................ 218 NOTAS ........................................................................................................................... 228 Índice de figuras Figura 1. Teoría interaccionista de la metáfora Black (1954). ......................................... 41 Figura 2. Teoría interaccionista de la metáfora Black (1977) ........................................... 44 Figura 3. Funcionamiento del modelo teórico Hesse (1966). ........................................... 62 Figura 4. Modelo de la conducta basado en la metáfora de la información y en la Teoría de la Información ........................................................................................................................ 180 Figura 5. Modelo de las relaciones humanas que tiene como dominio secundario a la cibernética ................................................................................................................................... 181 Figura 6. Modelo de la conducta que usa como dominio secundario la teoría de los tipos lógicos ......................................................................................................................................... 182 Figura 7. Modelos y analogías que componen al sistema conceptual del BTC .............. 184 1 Resumen Esta investigación metacientífica desde la filosofía de la ciencia historicista buscó estudiar filosóficamente a la metáfora para reivindicar sus funciones dentro de la investigación científica; con el objetivo de usarla como herramienta conceptual para justificar el uso de los conceptos de la cibernética, la teoría de la información y la teoría de los tipos lógicos en el modelo clínico del BTC del MRI. Para ello en el primer capítulo se revisaron las principales teorías sobre la metáfora desde Aristóteles hasta las propuestas de algunos filósofos de la ciencia analíticos. Principalmente se discutió la teoría semántico-interaccionista de Max Black y Mary Hesse para explicar el funcionamiento de la metáfora, y así justificar la autonomía del significado metafórico del significado literal, y reconocer su valor cognitivo, inquisitivo y creativo; además se explicita su relación con los modelos teóricos, por medio de los cuales se realiza la postulación de entidades explicativas plausibles. En el segundo capítulo se describió el origen de los conceptos de la cibernética y su discusión en las Conferencias Macy. En el tercer capítulo se examinó el traslado y caracterización de dichos conceptos por Gregory Bateson y su equipo a las ciencias de la conducta, para investigar la comunicación y la etiología de la esquizofrenia; y además proponer la epistemología cibernética. En el último capítulo se usó como marco de referencia el metamodelo construido sobre la metáfora para reconstruir conceptualmente los modelos que componen al sistema categórico del modelo terapéutico del BTC y así justificar teóricamente su marco explicativo. Palabras clave: Metáfora, Modelo, Filosofía de la Ciencia, Max Black, Mary Hesse, cibernética, Conferencias Macy, Gregory Bateson, doble vinculo, Epistemología Cibernética, Terapia Breve, Terapia Familiar, Mental Research Institute, Brief Therapy Center, Palo Alto. 2 Introducción La principal pregunta que despliega esta investigación metateórica es: ¿De qué forma la metáfora participa en el proceso de construcción del conocimiento científico? De manera particular se busca responder: ¿Cuál es la naturaleza de la intervención de la metáfora en la formación de los modelos científicos? Un segundo objetivo es justificar teóricamente el sistema conceptual del modelo de terapia breve del Brief Therapy Center (BTC), proyecto parte del Mental Research Institute (MRI). Para ello se describe históricamente el origen de las categorías que éste utiliza, las cuales provienen de la cibernética, la teoría de la información y la teoría de los tipos lógicos; y que fueron primero utilizadas como metáforas por Gregory Bateson y su equipo para el estudio de la comunicación. Y después fueron sistematizadas por los miembros del BTC para explicar y justificar su modelo clínico, caracterizado por ser interaccional, comunicacional y pragmático. En este trabajo teórico se reúne el interés por la filosofía de la ciencia, la historia de la ciencia, la historia de la psicología, la metáfora, la cibernética, el pensamiento de Bateson, y la terapia sistémica, con el fin de proponer una explicación sobre el rol de la metáfora en la formación del sistema conceptual del modelo del BTC. Por lo cual es importante desde ahora señalar que esta investigación por sus objetivos y métodos es de naturaleza metacientífica. Entendiendo que la teorización que se realiza sobre un objeto genera un saber de primer orden, y que la teorización que estudia el saber del primer orden genera un saber de segundo orden; los estudios metacientificos, al tener como foco de análisis el saber-objeto de la ciencia, producen un saber de segundo orden o metateórico. Por tanto la investigación metacientífica tiene el objetivo de estudiar los conceptos y las practicas convencionales de la ciencia para obtener una comprensión profunda de su actividad y resultados. Siendo cuatro los principales estudios sobre la ciencia: el psicológico, el sociológico, el histórico y el filosófico (Diez y Moulines, 1997). En el presente estudio se desea justificar desde la filosofía de la ciencia, encargada del análisis filosófico-conceptual de las teorías y modelos científicos, el origen y formación del sistema teórico del modelo del MRI. Dentro de esta área de la filosofía se sigue la tradición historicista iniciada por Thomas S. Kuhn en los años sesenta, la cual, al proponer modelos del desarrollo del conocimiento por medio del examen histórico de la actividad científica, busca estudiar los procesos de cambio del conocimiento científico. La corriente historicista, a 3 diferencia de la Concepción Heredada (received view), indaga cómo es que la actividad científica se da de hecho, priorizando la reconstrucción histórica a la reconstrucción lógica de las teorías. Bajo la idea de que la historia de la ciencia no es la mera colección de hechos y su presentación a manera de crónica, sino que, al pretender explicitar la relación entre los hechos de manera plausible y verosímil, y el desarrollo del conocimiento adquiere un carácter explicativo, ofreciendo entonces la posibilidad de reconocer la estructura total de una propuesta teórica y de facultar la comprensión histórica y filosófica de las teorías y modelos científicos. Dentro del enfoque historicista, y como resultado de su trato e intercambio de ideas con Carl Hempel, Kuhn, “concibió su trabajo como un intento de extraer las ventajas que ofrece el instrumental analítico en el contexto de una filosofía de la ciencia históricamente orientada.” (Pérez-Ransanz, 1999, p. 177). Es en este sentido que se desea usar la metáfora en el presente estudio, con los fines de a) utilizarla como herramienta conceptual, examinada desde la filosofía analítica, para proponer un modelo explicativo de cambio científico que permita realizar la reconstrucción histórica y conceptual del modelo del MRI; y b) justificar teóricamente el traslado de los conceptos de la cibernética en el sistema conceptual de dicho modelo. De este modo se buscan resaltar las discontinuidades teóricas que éste modelo clínico presenta en relación a los modelos tradicionales; observar el proceso del cambio conceptual de un marco teórico a otro por medio del paso de la metáfora de la energía a la metáfora de la información en la psicología clínica; y entender la evolución conceptual del lenguaje científico en una disciplina científica. Esta investigación es también historicista al reivindicar el examen e importancia del contexto de descubrimiento de la ciencia, desestimado en la agenda de la primera etapa de la filosofía de la ciencia, para la explicación de la creación del conocimiento, al señalar las funciones heurísticas de la metáfora (Echeverría, 1995; Pérez-Ransanz, 1999). La organización del trabajo es cuatripartita y dado que la investigación tiene un enfoque historicista cada capítulo es diacrónico, por lo que cada uno muestra el desarrollo histórico de una matriz de ideas. En el primer capítulo se hace una defensa ab initio de la metáfora con el fin de verla más allá de su función estética y mostrar su relevancia filosófica. Para ello el capítulo se despliega en tres secciones. En la primera parte se discuten las diferentes formas en que la metáfora ha sido clásicamente explicada, pero debido a que tiene una larga tradición de definiciones que abarca toda la reflexión filosófica sobre el lenguaje, esto es, desde hace casi 2500 años en Occidente, carece de homogeneidad conceptual y tampoco existe acuerdo sobre las 4 cualidades que tiene, por lo que resulta preciso estudiarla históricamente y exponer las maneras en que ha sido caracterizada por los principales estudiosos sobre el tema, iniciando con la teoría de Aristóteles, y la lectura austera y empobrecedora que realiza la tradición retórica del trabajo del Estagirita. Enseguida se expone la explicación radical que hace Nietzsche sobre la metáfora; para después mostrar la innovación teórica que supuso el giro cognitivista de la metáfora propuesto por Lakoff y Johnson. Este procedimiento no pretende ser conclusivo ni exhaustivo, en primer lugar debido a la inabarcable bibliografía sobre el tema y las diversas tradiciones desde las cuales se estudia, y en segundo lugar porque lo que aquí interesa es llegar a elucidar los compromisos y funciones que cumple la metáfora en el desarrollo de la ciencia. En la segunda sección del primer capítulo, con el fin de hacer plausible el examen filosófico de la metáfora, se desarrolla una discusión de carácter teórico-argumentativo sobre la relación que tiene ésta con la tesis referencialista del lenguaje y realista de la filosofía de la ciencia, ambas herederas del empirismo lógico y del criterio empirista de significado, y con ello advertir que consecuencias supondría la introducción de la metáfora como concepto filosófico en las teorías tradicionales de la verdad y del significado. Además se pone en duda la tajante división entre el lenguaje literal y el metafórico al reconocer que es el continuo tránsito de metáforas vivas a metáforas muertas lo que constituye al lenguaje literal, y al mismo tiempo lo que permite inaugurar nuevos significados en las palabras, con lo cual se mantiene vivo al léxico, En la tercera parte se busca elucidar el funcionamiento y significado de la frase metafórica; y así precisar las funciones de la metáfora en la ciencia y su relación con los modelos teóricos a partir de las teorías que se han elaborado desde la filosofía de la ciencia a partir de la segunda mitad del siglo XX. Las teorías analíticas de la metáfora que se discuten son las de Max Black, Mary Hesse, John Searle y Donald Davidson. Aunque hay que reconocer desde ahora que no las únicas, pues otros filósofos analíticos anglosajones como Monroe Beardsley, W. O. Quine, Thomas S. Kuhn, Richard Boyd, Richard Rorty, Nelson Goodman y Susan Haack; y de la filosofía continental como Hans-Georg Gadamer, Paul Ricoeur y Jacques Derrida han realizado sus propias teorías sobre la metáfora al criticar las tesis de Aristóteles y Black. El principal criterio para examinar la obra de unos filósofos en lugar de otros fue retomar a aquellos que inauguraron el debate sobre la legitimidad de la pertinencia de la metáfora en la ciencia y que la llevaron a la agenda de la filosofía de la ciencia en el siglo XX. En este sentido, el mérito de Max Black es indiscutible: él fue el primero en investigar las funciones de la 5 metáfora en la ciencia, y en postular la teoría semántica e interaccionista de la metáfora. En polémica con la posición de Black, John Searle y Donald Davidson, desde una postura pragmática, cuestionan las cualidades semánticas atribuidas a la metáfora desde Aristóteles. Por otro lado, aunque todos los que analizan la metáfora son herederos de las reflexiones de Black, entre sus más notables lectores está Mary Hesse, quien enriqueció la propuesta de Black sobre la intervención de la metáfora en la conformación de modelos teoréticos en la ciencia. A partir del análisis sistemático de las diferentes lecturas sobre la metáfora se busca reivindicar su participación en la investigación científica al reconocer sus cualidades heurísticas, cognoscitivas, inquisitivas, y explicativas; y explicitar su implicación en la formación de modelos teóricos. Para después utilizarla como herramienta conceptual para realizar la reconstrucción histórica y conceptual del modelo clínico del Brief Therapy Center. Por ello en el segundo y el tercer capítulo se realiza la historia de las ideas científicas constituyentes del modelo del BTC. En el segundo se detalla el origen de la cibernética, la teoría de la información, y la teoría de los tipos lógicos, y el de sus conceptos constituyentes: información, mensaje, comando y reporte, codificación analógica y digital, redundancia, feedback, causalidad circular, homeostasis, calibración, y paradoja. Además se expone la discusión de estas categorías en las conferencias Macy. Mientras en el tercer capítulo se examina la vida intelectual de Gregory Bateson, quien, junto con su equipo, traslado y caracterizo dichos conceptos para el estudio de la comunicación, el aprendizaje, la etiología de la esquizofrenia, y propuso la epistemología cibernética. Estos capítulos pretenden mostrar la influencia de Bateson, cuyo trabajo sirvió como puente entre los términos de la cibernética y la terapia familiar. En ambos capítulos se desea mostrar una unidad de sentido que explicite la relación entre los hechos relevantes y los distintos documentos, tanto científicos (artículos, ponencias y libros), como personales (comunicación epistolar entre los investigadores), con el fin de enmarcar las ideas formales dentro de su contexto histórico, y al mismo tiempo hacer notar como las ideas tienen influencia en el desarrollo de los acontecimientos que constituyen la práctica científica. Lo cual proporciona, a nuestro juicio, la clave de lectura del modelo terapéutico contextualizado por la trama histórica e intelectual de su desarrollo. Esta aproximación ofrece además la ventaja de entender al pensamiento científico como producto de una actividad creativa (Koyré, 1984). Para al final, en el cuarto capítulo, estar en condiciones sintetizar todo el análisis anterior y cartografiar el modelo clínico del BTC sobre el metamodelo filosófico basado en la metáfora. 6 Por lo cual se reconstruye el modelo del BTC entendiéndolo como un desplazamiento de la metáfora de la energía a la metáfora de la información; para ello se presenta el modelo de la familia como un sistema cibernético, y el modelo de la comunicación organizado en tipos lógicos. Lo cual justifica teóricamente los principios y técnicas terapéuticas del modelo del BTC. Se puede decir, utilizando la tipificación de Reichenbach, que los capítulos 2 y 3 se ocupan del contexto de descubrimiento, mientras que el 1 y 4 del contexto de justificación. En suma se pretende justificar teóricamente el modelo clínico de terapia breve del BTC desde una aproximación filosófica, por medio de una metodología historicista para realizar un análisis conceptual detallado. Al abrir el modelo del BTC y examinarlo desde un enfoque histórico y filosófico se propone crear nuevo referente teórico que, al desplegar una unidad de sentido, permita ensayar una nueva lectura y facultar posibilidades inéditas de comprensión. Dicho lo anterior, es preferible que aquel interesado en el desarrollo histórico de la terapia sistémica ponga de fondo a manera de la Gestalt la discusión sobre la metáfora. Mientras que quien investigue las funciones de la metáfora en la ciencia utilice como fondo, y a manera de historia ejemplar, el traslado de las ideas de la cibernética a la terapia familiar. De esa manera ambas lecturas se verán enriquecidas. Como siempre, el conjunto muestra más propiedades que la suma de sus partes. Cabe advertir desde el inicio que esta empresa no busca abandonar el campo de la psicología, sino más bien abonar elementos que permitan repensarla a partir de las herramientas conceptuales que ofrece la filosofía de la ciencia. Al poner a dialogar estas dos áreas del conocimiento por medio de la metáfora se busca enriquecer a ambas disciplinas. La psicología se beneficia al describir el origen de los conceptos con que trabaja el terapeuta sistémico, lo cual, creemos, lo pone en la posición de asumir la tradición intelectual que sustenta su trabajo y de reconocer los compromisos epistémicos que acepta al practicar la terapia sistémica. Mientras que a los menos familiarizados con la terapia del BTC les da a conocer la genealogía de los conceptos que conforman del modelo y les plantea la posibilidad de considerar las discontinuidades teóricas que tiene esté con los modelos de la psicología clínica tradicional. Por todo lo anterior no hay razones para sospechar sobre esta indagación la dimisión de la investigación teórica en la psicología, pues aunque su tarea es principalmente histórica y filosófica, al final el análisis metateórico recae en la descripción y compresión profunda de un modelo clínico herético, original y eficaz. 7 Capítulo 1. La Metáfora en la Ciencia Quizá la historia universal es la historia de unas cuantas metáforas. Bosquejar un capítulo de esa historia es el fin de esta nota. Jorge Luis Borges La metáfora ha sido estudiada ampliamente por varias tradiciones en filosofía, y por distintas disciplinas como la retórica, la lingüística, la psicología, la antropología, la filosofía de la ciencia, y más recientemente por las ciencias cognitivas y la inteligencia artificial. Por lo que su elucidación exige una aproximación flexible, histórica y plural que permita reconocer las principales formas en que se ha definido y las cualidades que se le han atribuido (Bustos, 2000). La heterogeneidad de aproximaciones teóricas ha dado lugar a una cantidad inmanejable de bibliografía y a la falta de acuerdo sobre su naturaleza, lo que ha llevado a la revitalización de la discusión sobre el tema, y generado una serie de polémicas dentro de la filosofía de la ciencia a partir del siglo XX en torno a su funcionamiento, la naturaleza de su referencia y a su valor en el discurso científico. Lo cual hizo que la metáfora pasara del escenario de investigación estética a su examen epistemológico (Sampieri, 2014). Este primer capítulo es teórico-conceptual, en él se busca explicitar el papel de la metáfora en el contexto de descubrimiento y en el contexto de justificación de la investigación científica. Sin embargo la metáfora al tener larga historia de análisis exige dar cuenta de las primeras teorías explicativas sobre ella y seguir la influencia de estas propuestas en las aproximaciones contemporáneas en la filosofía de la ciencia, con el fin de distinguir cuales han sido los aportes de cada teórico. Por lo que primero se desarrollan las principales tesis sobre la metáfora iniciando desde el trabajo inaugural de Aristóteles y su influencia en la tradición retórica. Después se revisan las radicales ideas de Nietzsche sobre el origen y naturaleza metafórica del lenguaje. Para enseguida estudiar la propuesta desde la lingüística cognitiva iniciada por George Lakoff y Mark Johnson sobre la metáfora. En el segundo apartado se busca introducir la discusión filosófica de la metáfora por lo que se reflexiona sobre las consecuencias que tiene ésta en la forma de entender conceptos tales como literalidad y referencia en la ciencia; en la primera parte se describen las dos actitudes que ha tomado la ciencia para con la metáfora: por un lado la antimetafórica heredera de la filosofía empirista, el positivismo lógico y la filosofía del lenguaje analítica; y por otro lado la romántica 8 que exalta el uso de la metáfora como medio privilegiado para expresar la subjetividad y para obtener conocimiento trascendental. Se discuten las ventajas y desventajas que presentan ambas posiciones recordando que ha sido la tradición antimetafórica la que más se ha aceptado en Occidente, asumiendo con ello una versión referencialista del lenguaje y correspondentista de la verdad, y en consecuencia una noción de verdad única y excluyente. En la segunda parte de esta sección se discute el paso de la metáfora viva a la metáfora muerta, y como este proceso dinamiza al lenguaje para que se actualice el léxico al aumentar la polisemia de las palabras. Revisadas estas primeras aproximaciones y debates en torno a la metáfora en general, y de haber hecho plausible su estudio más allá de su función estilística, se pasa a examinar su legitimidad y valor en la producción de conocimiento científico. Para ello se utiliza la distinción de Hans Reichenbach entre contexto de descubrimiento y contexto de justificación de la investigación científica para reconocer la participación de la metáfora en ambos contextos, y aunque generalmente se le reconoce que tiene funciones heurísticas al facultar la creación nuevas hipótesis, proponer formas novedosas de abordar un problema y de organizar los datos experimentales y, además, de permitir plantear nuevas problemáticas y descubrimientos; también cumple funciones en el contexto de justificación. Por lo que se pasa a discutir el funcionamiento de la metáfora en la ciencia, siguiendo las teorías de varios filósofos de la ciencia que se ocuparon del tema desde un enfoque analítico, ellos son Max Black, Mary Hesse, John Searle y Donald Davidson. Se examina con detalle la teoría semántica e interaccionista de Black, y su crítica y fortalecimiento por Hesse, la cual sostiene la autonomía del significado de la frase metafórica, y junto con ello su valor cognitivo e inquisitivo; enseguida se examina el intento de refutación de esta propuesta desde la teoría pragmática de Searle y Davidson. Al final del capítulo se explicita la relación entre la metáfora y los modelos en la ciencia a partir de las tesis defendidas Black y Hesse, las cuales definen a los modelos teoréticos como metáforas “extendidas” o “sostenidas”, y defienden el valor cognitivo de los modelos y su capacidad para postular entidades explicativas plausibles. Con esto se busca llegar a sostener que la metáfora participa también en el contexto de justificación del conocimiento y reconocer que no es sólo un recurso literario ornamental, sino que cumple varias funciones significativas en la ciencia sirviendo cognoscitiva y epistémicamente para el desarrollo del conocimiento. Además, a partir de la teoría de Black y Hesse se justificará el traslado de los conceptos de la cibernética y de la teoría de la información en el último capítulo. 9 1.1 Teorías Clásicas sobre la Metáfora Para elucidar la noción de metáfora resulta necesario proceder históricamente y formular un criterio de demarcación que nos permita definirla sin que se desborde conceptualmente y se vuelva ininteligible. Este criterio es la función o funciones que le atribuye cada estudioso en el contexto del discursivo específico en que es utilizada. De este modo se aprecian históricamente las diferentes cualidades que le han atribuido a la metáfora y la pertinencia legítima que esa función cumple en un discurso especifico. Además este criterio será útil para cuando se precisen su utilidad en el contexto de la actividad científica y así advertir los compromisos que asume la metáfora en la ciencia. Proceder históricamente permite observar como el examen filosófico de la metáfora, lejos de ser lineal y progresivo, más bien se mueve de entre tomar rasgos ya anunciados desde Aristóteles –aunque a veces desestimados-, o de actualizar el tema con nuevas herramientas conceptuales de disciplinas más recientes. 1.1.1 Aristóteles y la Tradición Retórica La definición inaugural y germinal en el estudio de la metáfora fue hecha por Aristóteles en su Poética, compuesta aproximadamente en el año 334 A.C1, en este libro describe a la metáfora como un recurso emotivo para la composición de la tragedia, sobre todo en la estructuración de versos yámbicos. La interpretación sobre los escritos de Aristóteles fue relativamente homogénea en la retórica clásica, pero recientemente ha sido cuestionada por los filósofos contemporáneos desde el siglo XX, quienes sostienen que la concepción aristotélica de la metáfora es más amplia que lo que pensaba la retórica. Por lo que la postura que tuvo Aristóteles no es clara ni libre de polémica. Hay al menos dos lecturas al respecto. La primera llamada sustitutiva, representada por los retóricos clásicos, sostiene que la metáfora es un tropo de dicción que sustituye palabras semánticamente equivalentes y que por lo tanto carece de valor cognoscitivo. Una variación de esta postura es el enfoque comparativo de la metáfora que afirma que esta es convertible y reductible al símil, y por lo tanto se puede hacer una paráfrasis literal de ella. La segunda interpretación, y que es la que aquí privilegiamos, sostiene que para Aristóteles la metáfora tiene valor cognoscitivo por haberla asociado con el aprendizaje. Se presentan ambas 10 exegesis siguiendo los textos de Aristóteles, pues ambas, aunque han tenido variaciones, siguen siendo tesis sujetas a discusión actualmente. “Metáfora es la traslación de un nombre ajeno, o desde el género a la especie, o desde la especie al género, o desde una especie a otra especie, o según la analogía.2” (Poética, 1457b): con esa definición se inicia la discusión sobre la metáfora en la filosofía. Para Aristóteles es una operación que se da en el lenguaje y a nivel de la palabra, en la que se realiza un traslado de términos entre el género y la especie al sustituir una palabra por otra en tres de los casos que presenta, a saber: el traslado del género a la especie, el de la especie al género y entre especies. Esto llevo a sostener a la retórica que la sustitución de una palabra por otra representaba una desviación referencial del sentido original (epiphora) y que al decir exactamente lo mismo su utilización era sólo una técnica de embellecimiento del discurso poético. Esta lectura se afianzo al ver que Aristóteles sostenía que el intercambio en el discurso poético se encargaba de elevar al lenguaje común y con ello conmover a los asistentes de la tragedia para que se liberasen de las pasiones (pathos) hasta llegar a la purificación espiritual (katharsis) (Di Stefano, 2006). Pero debe considerarse que para Aristóteles la desviación en la metáfora era en relación a la convención lingüística de la comunidad, es decir, la metáfora era desviada porque era infrecuente o inusual, desafiando así el uso normativo del léxico, y es justo por esa cualidad que Aristóteles la valoraba en la poesía. La función de la metáfora en la Poética es pues conmovedora, y por tanto esta debía dirigirse a la parte patética del auditorio. Permitía además dar nombre a aquello que no tiene nombre aún, con esto la metáfora vendría a llenar un vacío conceptual del léxico, a esta función más tarde se le conocería como catacresis. El último caso que señala el Aristóteles, y que ha sido el más estudiado y elogiado por él mismo, es el de la metáfora creada por medio de una analogía, al respecto dice: Entiendo por analogía el hecho de que el segundo término sea al primero como el cuarto al tercero; entonces podrá usarse el cuarto en vez del segundo o el segundo en vez del cuarto; y a veces se añade aquello a lo que se refiere el termino sustituido (Poética, 1457b). En este pasaje el Estagirita establece que es por la comparación entre términos que se puede llevar a cabo la traslación conceptual. A diferencia de los tres primeros casos descritos por él en los que se realizan sustituciones de un término por otro, que producen un cambio estilístico 11 al realizar una variación léxica pero sin efectos semánticos, es decir, una sustitución con ganancia en el estilo pero sin pérdida del contenido semántico en el discurso; en la metáfora por analogía si se afecta al nivel del significado por que la semejanza parcial entre los términos utilizados invita al que escucha a establecer dicha comparación. No se sustituyen términos; se construyen semejanzas entre ellos por medio de su similitud. La metáfora por analogía inhabilita sostener que para Aristóteles todas las metáforas fueran sólo sustituciones, pues la exige otro tipo de tratamiento al que se le conoce cómo enfoque comparativo de la metáfora, el cual, por cierto, no está libre de dificultades, derivadas de la siguiente afirmación de Aristóteles: Se les puede llamar lo mismo imágenes que metáforas, de modo que todos aquéllos que son celebrados cuando se los dice como metáforas, es evidente que lo serán también como imágenes; y lo mismo las imágenes, como metáforas con falta de una palabra (Retórica, 1407a) Este fragmento ha generado mucha polémica históricamente pues al establecer la aparente igualdad semántica entre la metáfora y el símil o imagen (eikón), y ponerlas en una relación transitiva, ambas serían lo mismo al realizar una comparación por analogía, con la diferencia mínima de que al símil se le agrega la proposición comparativa “como” que hace evidente el tipo de comparación que se está llevando a cabo; mientras que la metáfora no lleva esta palabra y sería así un símil abreviado o elíptico. Eso significo para los retóricos clásicos que la metáfora podía ser convertida a un símil al establecer la comparación explicita, y por lo tanto ser parafraseada literalmente, y en consecuencia carecer de contenido cognoscitivo propio. Di Stefano (2006) al respecto señala: “La comparación (o imagen) es para Aristóteles una metáfora en la que se explicita la relación entre dos términos a partir del nexo ‘como’, (…) la comparación (símil) es una metáfora desarrollada” (p 25). Es decir que la metáfora es la que antecedente al símil, y es el símil el que viene de la metáfora, por lo que no es la metáfora la que queda reducida al símil; ya que a pesar de su proximidad conceptual, la metáfora tiene la propiedad - que no tiene el símil- de facultar comparaciones sorprendentes y novedosas. De ahí que Aristóteles piense que el oyente de la metáfora se tenga que esforzar para entender de qué clase de comparación se trata; mientras que al agregar la palabra “como” el que recibe el símil permanece pasivo pues la comparación le ha sido dada de inmediato. Con esto la metáfora exige la participación del otro para descubrir su significado y por ello Aristóteles establece el vínculo 12 entre el placer de descubrir dicha comparación no explicita e insospechada y el aprendizaje (máthesis) activo y personal, que permitiría decir que la metáfora tiene contenido cognitivo. Ya que la metáfora al proporcionar claridad, placer y gusto por el aprendizaje, cumple con una función cognoscitiva, aunque esta fue desconocida por mucho tiempo por los intérpretes de la teoría aristotélica de la metáfora. En su Retórica Aristóteles amplía las reflexiones sobre la metáfora, manteniendo la definición dictada en la Poética, pero afirmando que al pertenecer a otro tipo de discurso sus funciones cambian. En el libro III donde estudia la elocución para elaborar los discursos jurídicos y políticos, afirma que la principal función de la metáfora es la persuasión en una asamblea o en un tribunal. La persuasión retórica aumenta por la extrañeza que genera la metáfora, este recurso, aunque procedente de la poesía, lo considera legítimo para usarse en los discursos políticos3. Es necesario notar desde ahora que el filósofo otorga funciones a la metáfora dependiendo del tipo de discurso, y no al revés, como lo entendió la tradición retórica, limitando una función (estética) del enunciado metafórico a cualquier tipo de discurso. Aristóteles agrega que para construir las metáforas hay que buscar la elegancia, entendida como la combinación entre el buen gusto del productor de metáforas y su ingenio para establecer semejanzas entre los términos; a las metáforas, nos dice, “hay que obtenerlas de cosas apropiadas, pero no evidentes, igual que la filosofía es propio del sagaz establecer la semejanza (de dos cosas) aunque sean muchas sus diferencias” (Retórica, 1412 a). Es importante notar que para el filósofo griego es cuestión de talento el hacer metáforas, por ello advierte que este arte no puede ser enseñado y que es propio de ciertas personas de genio a los que les corresponde establecer las semejanzas entre las palabras. Cuando habla de las cosas apropiadas se refiere a construir las metáforas a partir de términos pertenecientes a la misma especie o género, evitando hacer comparaciones muy lejanas porque se vuelven oscuras e ininteligibles, como también pasa cuando se alejan demasiado del lenguaje común del público, generando desconfianza entre los oyentes. Además sugiere evitar hacerlas de comparaciones muy evidentes que no generan asombro y en consecuencia se vuelvan estériles para la persuasión. La extrañeza de la metáfora tiene que estar basada en la capacidad de ver las solidaridades misteriosas entre las cosas generalmente no percibidas. Por ello confirma que de los cuatro tipos de metáforas propuestas, las construidas por analogía son las más elegantes al percibir lo semejante entre lo desemejante y así hacer “saltar a la vista” o “poner ante los ojos” las cosas. Lo cual significa que hacen 13 sensibles y evidentes las relaciones que la metáfora por analogía expresa, es por ello que él elogia aquellas metáforas que se basan en el movimiento, al animar lo inanimado. A este último tipo de metáforas se les identifica ahora como personificación. Por otra parte la belleza es una condición importante para la construcción de metáforas. La belleza no está entonces separada de la persuasión, sino más bien facilita el aprendizaje: estética y conocimiento están filosóficamente involucrados desde el inicio, no de manera excluyente, sino más bien como funciones complementarias y cooperativas para sus fines. Dado lo anterior se puede decir que Aristóteles celebra el uso de palabras extrañas como la metáfora para promover claridad y aprendizaje en los discursos con fines precisos: para con- mover en la Poética; para convencer en la Retórica. El extrañamiento que genera en el público, proporciona sorpresa y claridad en quien la escucha, y también produce asombro al lograr vincular lo desvinculado, y dado que el asombro es para el filósofo la primera forma del conocimiento y el principal motivador para iniciar una reflexión filosófica, no se puede dudar de la asociación entre la metáfora y el conocimiento en Aristóteles. La definición de la metáfora después de Aristóteles pasó a ser objeto de trabajo de la retórica clásica que realizo una lectura empobrecedora de teoría aristotélica y que fue poco cuestionada en los retóricos por mucho tiempo. En conjunto la consideraban como un tropo de dicción, basada en la sustitución de palabras que solamente ornamentaba el discurso. También es frecuente en esta tradición considerar que es una de las palabras la que se emplea en sentido literal y otra en sentido metafórico, ubicando a la función metafórica en una palabra de la frase. Por ejemplo Quintiliano, retorico latino, señala que a la metáfora es un tropo que afecta el significado de los términos cuyo uso sólo es válido en dos casos: para trasladar un significado a otro donde no existe (catacresis); o para darle más fuerza persuasiva a una expresión. Quintiliano (1999) realizo la subversión de la propuesta aristotélica de ver en la comparación la forma extendida de la metáfora; el retorico por el contrario sostiene que la metáfora es una forma abreviada de la comparación, dice: “La metáfora es en un todo más breve que la semejanza, y se diferencia de ella en que aquélla se compara a la cosa que queremos expresar, ésta se dice por la misma cosa” (p. 178) Lo anterior provoco una serie de equívocos que devinieron en ver en la metáfora un tropo que podía ser traducido literalmente a través de la paráfrasis, pues si sólo se trataba de una comparación esta se podía eliminar al hacer de manera explícita al enumerar las cualidades comparadas entre los términos implicados. Al igualar la 14 extensión referencial de la metáfora con el símil se podía sustituir la primera por el segundo sin perder contenido cognitivo. Su uso entonces sólo se acreditaba para embellecer un discurso. Pero en su opinión el abuso en su uso produce oscuridad y enigmas en lugar y claridad, por lo cual Quintiliano sugiere ser moderado en su aplicación. Ejemplo de la herencia de retórica en las definiciones actuales de la metáfora es la definición que ofrece la retórica Helena Beristáin, quien sostiene que la metáfora, “afecta al nivel léxico/semántico de la lengua, y que tradicionalmente solía ser descrita como tropo de dicción o de palabra (a pesar de que siempre involucra a más de una de ellas) que se presenta como una comparación abreviada” (2010, p 310). Se advierte que la autora reconoce que la metáfora afecta a más de una palabra y que actúa al nivel semántico, pero mantiene la distinción hecha por Quintiliano en ver a la metáfora como una comparación elíptica, limitando a la metáfora en no ser más que una comparación entre los términos. Piensa además que esta produce un extrañamiento al lector que al no estar acostumbrado, al ver una nueva semejanza se ve obligado a detenerse, pensar y proceder como si tuviera que resolver un acertijo. En resumen, para la tradición retorica la metáfora es un símil elíptico, y que no tiene valor cognoscitivo. La postura de Quintiliano y de otros retóricos como Cicerón es característica del enfoque sustitutivo de la metáfora. Su interpretación fincada en una lectura fiel y limitada del corpus aristotelicum llevo a la desvalorización de la metáfora y a su desprecio por muchos siglos. Ahora se estudiara a uno de los primeros filósofos que reivindico a la metáfora y sus funciones en el lenguaje: Nietzsche. 1.1.2 Nietzsche: La Genealogía del Concepto El estudio de la metáfora desde la filosofía después de haber sido principal y austeramente hecho por los retóricos, fue retomado y revitalizado por Friedrich Nietzsche. Aunque es necesario reconocer, como lo hace Bustos (2000), a otros filósofos que reflexionaron sobre este tema como Pascal, Vico en “La nueva ciencia” y Herder, precursor del romanticismo alemán, en su “Ensayo sobre el origen del lenguaje”, quienes hicieron de la metáfora un problema filosófico vivo y un elemento fundamental en el lenguaje. Mientras Vico pensaba que la metáfora es la esencia del lenguaje; Herder sostenía que la metáfora es el origen del lenguaje y que se es recogido en el mito. 15 El interés por Nietzsche en este trabajo está justificado por ser él quien recibe y sintetiza la ideas de la tradición alemana, tanto ilustrada como romántica (Schenk, 1983), y, al mismo tiempo, quien ofrece nuevos referentes para pensar la metáfora en la agenda de la filosofía y que tuvieron influencia en los posteriores estudiosos del tema. Nietzsche seguirá estas intuiciones y hará de la metáfora el génesis de los conceptos, dándole primacía sobre el lenguaje literal, lo que le permite problematizar la fiabilidad del conocimiento en general. Nietzsche (2007) como filólogo realizo varios estudios sobre los griegos y la retórica antigua. En 1873 el joven filósofo escribió Sobre verdad y mentira en sentido extramoral, donde presenta la tesis de que la verdad son aquellas metáforas desgastadas y compartidas por una comunidad, y que mediante el olvido de su origen metafórico, los hombres adquieren el sentimiento de la verdad; de este modo el hombre, “olvida que las metáforas intuitivas originales no son más que metáforas y las toma por las cosas mismas” (p 29). Para Nietzsche las metáforas provienen de las intuiciones primarias del hombre en su relación con el mundo, es pues pre-conceptual y creada por el hombre en situaciones vivenciales únicas. Estas son el producto del hombre que como creador, a través del intelecto -“ese maestro del fingir” (p 35)- , utiliza el lenguaje para elaborar imágenes de sus intuiciones primarias. El concepto es resultado de la metáfora que se ha desgastado por su uso continuo, y que al eliminar las diferencias que tienen los casos aislados de cada metáfora única permite hablar sobre generalidades basadas en regularidades que –aparentemente- describe el hombre. Para Nietzsche la noción de verdad tiene un carácter institucional y por tanto normativo en la vida de los hombres, al olvidar –y con ello aceptar- ciertas metáforas como verdades la vida en comunidad de organiza en torno a estas, él advierte: “del mismo modo que un sueño eternamente repetido sería percibido y juzgado como algo absolutamente real. Pero el endurecimiento y la petrificación de una metáfora no garantizan para nada en absoluto la necesidad y la legitimización de esta metáfora” (p 30) La repetición, el olvido, y la sobre- exposición a ciertas metáforas las terminaría por conducir a su lexicalización en el lenguaje. El léxico así entendido no sería más que el conjunto de metáforas muertas. Con ello su legitimidad y vigencia regulatoria no tiene que ver con que sean verdades eternas sino solo verdades repetidas hasta ser creídas. Necesarias si para la organización social, pero no por ello inmutables. Por lo que pone en duda la división entre lenguaje literal y metafórico y la naturaleza esencialista 16 del lenguaje. En función de lo anterior para Nietzsche todo el conocimiento –incluso el científico- tiene una base conceptual metafórica. Esta propuesta es interesante porque al poner en duda la posibilidad de conocer la verdad por el lenguaje, cuyo origen es metafórico, Nietzsche llega a una clase de escepticismo por la imposibilidad de conocer la cosa-en-sí, ya que todo conocimiento sería una convención lingüística construida en base a metáforas fosilizadas. De ahí el epíteto que le da al intelecto pues este mantiene la ilusión de que existe una realidad conocible por el hombre y que puede ser descrita. Sin embargo también reconoce la capacidad del hombre de crear, lo que lo lleva a un escepticismo creativo que animaría al hombre a seguir produciendo metáforas novedosas, pues tanto las metáforas como los conceptos son mentiras necesarias para el conocimiento del hombre, aunque advierte – tal vez por primera vez- que no hay que tomar estas ilusiones necesarias por la verdad. Por lo que su escepticismo es más una provocación intelectual que una resignación nihilista en relación al conocimiento. Hasta este momento se han revisado las concepciones de Aristóteles, los retóricos y Nietzsche sobre la metáfora, Díaz citado en Di Stefano acertadamente señala: “Mientras para Aristóteles el lenguaje es lo dado, lo ‘normal’, y la metáfora la excepción, para Nietzsche la metáfora es lo original, lo vivo y el lenguaje es lo congelado” (2006, p 61), esta diferencia es porque para Aristóteles, aunque reconoce la cotidianidad de la metáfora en el lenguaje de su comunidad, la describe como un recurso persuasivo extraordinario e inusual en el lenguaje convencional, mientras que en Nietzsche el lenguaje es un cementerio de metáforas asimiladas culturalmente. De este modo Nietzsche describe el proceso de conformación del lenguaje al establecer la genealogía del concepto en base a las metáforas, por lo que todo el léxico tiene un fondo metafórico. Por ello la verdad literal no es más que una metáfora generalizada, que pierde su valor creativo en favor de un acuerdo semántico. Ambos filósofos son antecedentes de la corriente lingüística cognitiva que se verá enseguida. 1.1.3 El Giro Cognitivo George Lakoff y Mark Johnson introducen una nueva forma de abordar el problema de la metáfora en 1980: la cognitiva, en su ya clásico libro Metaphors We Live By (2009). El primero lingüista y el segundo filósofo sostienen que más allá de una mera función ornamental, las metáforas permiten tener un conocimiento sobre el mundo al organizar estructuralmente los 17 conceptos. Reconocen que el alcance de la presencia de la metáfora en el lenguaje es muy amplio, al grado en que todo el lenguaje está lleno de metáforas, incluyendo al científico; lo cual es natural considerando que los recursos cognitivos disponibles del hombre operan en sus diferentes actividades intelectuales. Es por ello que no se limitan a estudiar las metáforas creativas como todos los antiguos estudiosos del tema, sino a la metáfora inscrita en el discurso cotidiano, la metáfora convencional o fosilizada que configura el pensamiento, el lenguaje y la acción de una comunidad lingüística. Partiendo del supuesto de que el lenguaje metafórico es igual de valido que el literal para categorizar y expresar el conocimiento. A su propuesta se le conoce como teoría experiencial de la metáfora ya que creen que toda metáfora se crea por la relación y actividad corporal del hombre en el mundo. Por lo que no asumen una postura pasiva del proceso de conocer, sino que es por medio de la experiencia del hombre que este configura sus mapas conceptuales. El objetivo de su teoría es describir los mecanismos cognitivos por los que los sistemas conceptuales nacen y se enriquecen, siendo la metáfora uno de los principales medios por los cuales se constituyen los conceptos abstractos. Lo más importante de su propuesta es que dejan de considerar a la metáfora a nivel lingüístico y más bien defienden que es un fenómeno mental por el cual se categoriza el mundo y se organiza el conocimiento. Metodológicamente realizan su análisis a nivel lingüístico, examinando las expresiones metafóricas de una comunidad y tomándolas como evidencia de la existencia de una metáfora raíz que las estructura. Su concepto de metáfora es muy amplio pues consideran que es toda operación cognitiva que permite comprender y experimentar un tipo de cosas por medio de otras. O dicho en términos de la paradigmática formula de la metáfora: A es B, donde B es aquello que se desea comprender (domino diana) por medio de una proyección (mapping) parcial de la estructura de A (dominio fuente), el cual es generalmente más concreto; permitiendo de este modo poder realizar inferencias y proveer de estructura al dominio diana. Por ejemplo, la metáfora conceptual la argumentación es una guerra da lugar a expresiones metafóricas como “debilitar la posición del adversario” y “atacar con argumentos fuertes”. Por lo anterior establecen una distinción entre la operación metafórica y la expresión metafórica. La primera se refiere la operación cognitiva de conocer un dominio por medio de otro, mientras que la expresión metafórica es sólo la articulación comunicativa de la operación metafórica; verbigracia, la metáfora conceptual de conocer es ver se expresa en las oraciones de 18 “mi punto de vista es diferente” y “ya lo puedo ver”, etc. La metáfora conceptual agrupa distintas expresiones metafóricas y da coherencia, sistematicidad y organización a varias expresiones de la misma idea, por ejemplo el tiempo es dinero, agrupa expresiones como perder, gastar, invertir y calcular el tiempo. Ellos advierten que la metáfora conceptual no es siempre expuesta en forma de una expresión metafórica como tal, de hecho rara vez es expresada, de ahí que no se le considere metáfora sino una clase de verdad literal, y por lo tanto pase desapercibida como metáfora. Lakoff y Johnson clasifican en tres formas a la metáfora: estructurales; orientacionales y ontológicas. Las metáforas estructurales son aquellos conceptos que se estructuran metafóricamente en términos de otro. Las metáforas orientacionales se basan en la experiencia corporal y su participación del hombre en el medio ambiente, por ejemplo la posición corporal de arriba se asocia a la felicidad, la salud y el estatus, mientras lo contrario, la tristeza, la enfermedad y la pobreza con la posición de abajo. Por último las metáforas ontológicas permiten entender experiencias como sustancias, por ejemplo “la mente es un recipiente”. Ante esta variedad no excluyente de tipos de metáforas hacen una lista de características comunes en todas ellas. En primer lugar las metáforas resaltan algún aspecto mientras ocultan otro, por eso siempre la proyección entre dominios no es total sino parcial. Por otro lado aunque tengan base corporal eso no significa que dejen de ser primariamente culturales, la trama cultural otorga coherencia a las diferentes expresiones metafóricas y además organiza la base conceptual de la comunidad. Por lo que consideran que la interpretación de una metáfora no debe acusar dificultad por parte de los hablantes de un grupo lingüístico que la comparte. Una característica importante es la que se refiere a la semejanza que establece la metáfora, el debate se ha desarrollado entre quienes afirman que las semejanzas son objetivas, es decir, que la semejanza se establece entre propiedades reales entre las cosas y los que sostienen lo contrario, que esta es dada por la metáfora. A este último grupo pertenece la perspectiva cognitiva, para quienes la metáfora proporciona la semejanza, es decir, la semejanza no es anterior a la metáfora y quien usa una metáfora no describe una semejanza objetiva; más bien es la metáfora la que establece o sugiere una semejanza entre un par de dominios. La metáfora crea la semejanza. Es importante recalcar que para esta escuela la metáfora viva no es la innovadora sino la que es vivida por la comunidad, su atención a esta clase de metáforas les llevo a sostener, al contrario de Nietzsche, que estas no pierden su condición metafórica por su repetición y olvido, 19 sino que siguen siendo metáforas que estructuran continua y sistemáticamente el sistema conceptual, el pensamiento, las creencias y las acciones de las personas; o para decirlo con ellos: “El concepto se estructura metafóricamente, la actividad se estructura metafóricamente, y, en consecuencia, el lenguaje se estructura metafóricamente ” (Lakoff y Johnson, 2009, pp. 41-42). Resulta así significativo el acercamiento entre sintaxis, semántica y pragmática desde esta perspectiva, ya que el conocimiento dado por la ampliación conceptual y teórica que faculta la metáfora en el discurso configura la acción. De este modo el pensamiento, lenguaje y acción tienen una estructura metafórica que los vincula, y organiza la realidad personal y social. Permitiendo religar en último término valor y hecho, creencia y acto. Para entender lo anterior hay que mencionar que su noción de verdad establece como criterio de suficiencia la comprensión, de ahí se sigue que si se articulan varios conceptos en función de una metáfora o más, estas proporcionan cierta compresión sobre el mundo, y que llevan a construir creencias acerca de la realidad y sobre el modo de actuar en esta. Así entendidas, las metáforas están basadas en la forma en como el hombre actúa en el mundo y al mismo tiempo orientan al hombre al actuar. En resumen la metáfora desde la lingüística cognitiva es más que una cuestión de tropos y estilo; es más profundamente una forma de conocer, como señala de manera clara Bustos (2000): “es un fenómeno mental, un instrumento de asimilación y categorización de la experiencia en la constitución de los conceptos abstractos (p. 9). De este modo la metáfora adquiere de nuevo legitimidad como parte importante para el conocimiento del mundo por su innegable función cognitiva. Si bien está expresada en el lenguaje, es más profundamente una actividad del pensamiento. Resulta indispensable para la creación de los conceptos, la sistematicidad entre ellos y la manera de acceder al conocimiento. Las metáforas permiten ampliar el sistema conceptual, lo organizan y lo reordenan continuamente como parte del repertorio de habilidades cognitivas del hombre. Aunque este enfoque corre el riego de extender la presencia de las expresiones metafóricas hasta que todo el lenguaje sea metafórico, lo cual resultaría poco útil por la imposibilidad de demarcar a la metáfora y su funcionamiento en la ciencia (Garza, 1998). Su mérito reside en pasar su tratamiento cognitivo del tema, confirmando lo que tan bien afirmaba Susang Sontang: No se puede pensar sin metáforas. 20 1.2 Metáfora y Lenguaje The arts and sciences are no more mirrors held up to nature than nature is a mirror held up to the to the arts and sciences. And the reflections are many and diverse. Nelson Goodman Revisadas algunas de las más representativas teorías sobre la metáfora, vamos a problematizar la relación que está tiene con el lenguaje. Para ello primero se va a exponer la relación entre las tareas de la filosofía del lenguaje y la filosofía de la ciencia, para después señalar las concepciones del lenguaje más difundas en general y como a partir de estas se entiende el papel de la metáfora en el lenguaje y en la teoría del conocimiento: ya sea o bien como un fenómeno secundario y parasitario del lenguaje literal o bien como una forma privilegiada de conocimiento. Enseguida se examina la naturaleza del problema de la referencia de la oración metafórica, y como esta discusión cuestiona las ideas tradicionales de significado y la relación entre el lenguaje y la realidad. En segundo lugar se utiliza la distinción entre metáforas vivas y metáforas muertas para describir el proceso por el cual se posibilita ampliar el lenguaje por medio de nuevas metáforas al movilizar semánticamente el significado de las palabras, y de esta manera actualizar el léxico. 1.2.1 Lenguaje y Conocimiento Urban (1952) señala que la tarea de la filosofía del lenguaje es buscar el criterio metalógico para establecer la relación entre el lenguaje y la realidad empírica, esto es entre la palabra y la cosa. Esto es importante ya que al querer establecer una teoría del significado y las condiciones en que una oración tiene significado, al mismo tiempo establece criterios de veracidad de la frase, por lo que significado y verdad están indisolublemente vinculados. De modo que la relación entre la teoría del conocimiento y la filosofía del lenguaje es porque toda teoría del conocimiento debe de estar basada en una semántica que establezca cuales son los criterios del significado de una oración y así poder valorar la veracidad de la misma. Las posturas para responder a este criterio han oscilado entre quienes afirman que hay igualdad entre palabra y cosa, y quienes sostienen que no es así. Ambas respuestas proveen un marco diferente para las teorías del conocimiento y una actitud filosófica contraria. Sostener que 21 la referencia es la misma entre el lenguaje y la cosa es afirmar que a cada cosa le corresponde un nombre único y por tanto hay una realidad última y verdadera que puede llegar a ser descrita literalmente. La descripción a través del lenguaje literal sería una copia de la realidad. A esta postura le llama realista y considera que el lenguaje es la representación de la realidad. A la postura que no se comprometerse con la referencialidad univoca y que acepta que las palabras son convenciones del lenguaje, pero que no reflejan exactamente la realidad se le conoce como nominalismo lingüístico. Por su parte Lakoff y Johnson (2009) desde su enfoque experiencialista del conocimiento llaman mitos a las formas que han orientado la forma de entender el conocimiento en la tradición filosófica, así distinguen entre el mito del objetivismo y el mito del subjetivismo. El mito del objetivismo afirma en principio que no es un mito, al mismo tiempo niega que los mitos tengan valor para hablar sobre el conocimiento de la verdad; principalmente sostiene que su discurso es exclusivamente el verdadero. Mantiene que el mundo está hecho de objetos independientes del hombre y que estos tienen propiedades inherentes que son experimentadas empíricamente por lo hombres, de modo que es posible asignarles un nombre a las propiedades por medio de categorías (evitando de este modo los juicios subjetivos) que fije su referencia. La objetividad se logra al ajustar la descripción de las propiedades de las cosas a la descripción de las mismas por medio del lenguaje. Usar un adjetivo sería nombrar una cualidad de las cosas inherente a ellas. Bajo este supuesto se posibilita hablar en forma literal, pues describir sería sólo nombrar las cualidades de las cosas independientemente de quien lo haga. Para el objetivista la verdad o falsedad de un enunciado está en relación a la concordancia entre las palabras y el referente material del que hablen: si el enunciado concuerda con la materia a la que se refiere entonces es verdadero, de otro modo, la desviación entre las palabras y el referente implicaría la falsedad del enunciado. Como principales defensores de ver al lenguaje como representacional está el empirismo filosófico iniciado y desarrollado en los siglos XVII y XVIII principalmente por Hobbes y Locke, quienes condenan el uso del lenguaje figurado por considerarlo engañoso (Sampieri, 2014). La tesis empirista fue asumida después por los positivistas lógicos, e incluso Popper4. El proyecto del positivismo lógico del Círculo de Viena iniciado en el siglo XX se caracterizó por querer demostrar que la metafísica no tiene sentido, pues sus enunciados no denotan nada y por lo tanto carecen de valor cognitivo y epistémico. Su teoría semántica es una teoría 22 correspondentista de la realidad con el significado, basada en el criterio empirista de significado, Blasco (1998) define este criterio así: …el carácter significativo, y por ende cognitivo, de estos enunciados depende de que se disponga de procedimientos para decidir acerca de su verdad o falsedad. En principio, se parte de la teoría clásica de la verdad (teoría de la correspondencia), que sostiene que la verdad o falsedad de un enunciado depende de su correspondencia o no con el hecho que dicho enunciado afirme (p. 296-297) Para el proyecto positivista las unidades mínimas de significación epistémicamente validas son aquellas que provienen de los enunciados construidos de acuerdo con las reglas sintácticas de la lógica formal, y las proposiciones atómicas que denotan hechos empíricos conocidas como oraciones protocolares; por lo que también se le conoce como empirismo lógico a esta propuesta filosófica De este modo todo enunciado que sea cognitivo, que tenga valor de verdad y que tenga pretensión extensiva tiene que poder ser verificado por correspondencia con la realidad empírica o tiene que tener validez lógica. Así se garantizaba la mínima interpretación en los enunciados de la ciencia y la mayor objetividad posible. Los límites de la semántica de este programa vendrían a ser los límites del discurso empírico y lógicamente bien construido, y en consecuencia la reducción de la referencia valida a las oraciones que cumplieran dichos criterios y la limitación de lo que se considera verdad al sentido de dicha referencia (Sampieri, 2014). Bajo estas premisas todo aquel enunciado que no cumpliera los criterios expuestos carecen de sentido y, al mismo tiempo, todo el conocimiento legítimo se reduce a cumplir con el criterio empirista de significado. De este modo la metafísica no tenía la posibilidad de ser considerada verdadera o falsa, debido a que no tiene sentido para los positivistas lógicos estudiar una oración que no puede ser verificada empíricamente al no existir el referente de la proposición, así que era innecesario valorar su veracidad. Todo aquello que superara la experiencia empírica era calificado como enunciado metafísico, religioso o estético. La filosofía analítica del lenguaje del siglo XX, heredera del positivismo lógico, en general sostiene normativamente que el lenguaje debe buscar la universalidad al ser estable, literal y univoco. Cualquier proposición que satisficiera el criterio empirista de significado y la 23 validez lógica, tendría referencia, contenido cognitivo y valor de verdad (Hesse, 1988; Sampieri, 2014). Ejemplos de las teorías que ven en el lenguaje un reflejo de la realidad y suponen el isomorfismo estructural entre el lenguaje y mundo son el atomismo lógico de Russell; y las tesis del Wittgenstein en su Tractatus logico-philosophicus. Para las cuales a cada categoría es una unidad lógica a la que le corresponde un referente, la composición sintáctica de la frase significativa debe reflejar la estructura lógica de la realidad (Conesa & Nubiola, 1999). Como consecuencia de la impronta empirista en estos proyectos se pensó que la ciencia debía de establecer condiciones necesarias y suficientes que aseguraran la aplicación de un concepto para un conjunto claro de objetos y de ese modo garantizaran el uso de los enunciados literales, manteniendo así la premisa realista de que existe la realidad única y que esta se puede conocer, de modo que para cada cosa debería existir una palabra y para cada proceso una ley expresable de tal modo en que sean enunciados universales e incondicionales, preferentemente en el lenguaje lógico-matemático. El trabajo del científico así entendido consiste en darle a cada cosa su nombre apropiado fijando la referencia de las palabras que subsumiera un conjunto de objetos bien definidos del mundo. Para esta forma de entender el lenguaje filosóficamente, una expresión sólo puede tener un sentido verdadero y todos los demás son necesariamente falsos, engañosos o irrelevantes epistémicamente, apuntando con ello al monismo semántico, es decir la universalidad de este lenguaje ideal se basa en la univocidad de las palabras. Para cumplir con estas condiciones la estructura de la realidad tendría que ser lógica, inmutable y empíricamente estable. A la par del desarrollo del proyecto empirista, la tradición romántica5 afirmaba por el contrario que la intuición, la sensibilidad y la imaginación proporcionan conocimientos de mayor valor que trascienden a la racionalidad y a la objetividad, los cuales son más importantes para vivir. “La tradición romántica -dicen Lakoff y Johnson- al abrazar el subjetivismo reforzó la dicotomía entre verdad y razón por una parte, y arte e imaginación por la otra” (2009, p. 235). Los románticos exaltaban el ánimo y las pasiones de una subjetividad desenfrenada, en contra de la racionalidad calculadora, siendo su medio de expresión el arte y considerando como vía de acceso epistémico predilecto la imaginación. Por lo que el lenguaje para ellos lejos de representar la realidad, la creaba. 24 Siguiendo estas dos grandes tradiciones sobre el lenguaje y el conocimiento se pueden distinguir dos formas de pensar la metáfora en el lenguaje y la teoría del conocimiento: la racionalista antimetafórica y la romántica. La primera le niega el estatuto de conocimiento a la metáfora, mientras que la segunda tiende a afirmar que son las metáforas la base del conocimiento o, por lo menos, la forma más valiosa para conocer. Ya que a través de la metáfora se pueden expresar saberes privilegiados y significativos de la experiencia humana Como ejemplos paradigmáticos del romanticismo están los escritores Wordsworth y Coleridge, para quienes, “la metáfora encarna la capacidad sintética de la imaginación (frente a la analítica razón), su poder para dar forma a la realidad” (Bustos, 2000, p. 15). Mientras la razón analítica separa y disgrega; la metáfora integra y vincula dos reinos de la realidad en apariencia distintos. Además para la filosofía romántica, “la metáfora no es un fenómeno marginal, secundario y dependiente del lenguaje literal, sino que constituye la esencia misma del lenguaje, la forma en que éste nos permite acceder al mundo” (Bustos, 2000, p. 55). De modo que los románticos y los que siguieron sus postulados crearon en general teorías de la primacía de la metáfora sobre el lenguaje literal, sosteniendo que las metáforas son la base de todo el sistema conceptual establecido. Como consecuencia de que los románticos consideraran a la metáfora como la mejor forma de expresar sentimientos e intuiciones que escapaban a la razón, los racionalistas la vieron con desconfianza por estar relacionada con lo irracional, considerándola como una cuestión estética del lenguaje más no de significado ni, por tanto, de conocimiento. De este modo se polarizo la forma de acercase al conocimiento, ambos mitos, aunque complementarios, se declaraban como contrarios y excluyentes el uno del otro. Es importante notar como las ideas que se tienen sobre el lenguaje son la base para lo que se considera verdadero en el discurso científico, ya que una teoría de la verdad está basada en una teoría del significado. En la tradición empirista al asociar la idea de verdad a una forma específica de lenguaje significativo, dio por hecho implícitamente que la verdad sólo es explicable de una forma, y que se puede acceder a ella objetivamente, además comprometiéndose a aceptar que quien describe no interpreta, basado en la confianza de que la descripción literal mantiene una relación univoca entre palabra, el referente y el sentido. 25 La postulación de estas posibilidades explicativas para considerar el lenguaje da como resultado valoraciones distintas sobre el lugar de la metáfora en el lenguaje y sobre sus funciones. Sin embargo desde la distinción de Frege entre sentido y referencia, y el establecimiento de referencia como principio para asignarle condiciones de verdad a una oración, la frase metafórica al no tener un referente claro, y por lo tanto no tener condiciones de verdad, no ha sido considerada como portadora de contenido cognitivo propio legítimo. Por ello como señala Bustos (2000) el problema de la referencia es, “el problema más general, y seguramente más profundamente filosófico que plantea la relación entre metáfora y referencia atañe a la relación de nuestro lenguaje natural con la realidad” (p. 103). La metáfora como concepto filosófico cuestiona la tesis referencialista del lenguaje por la dificultad de señalar la naturaleza de su referencia extra lingüística, de este modo pone en duda la amable relación entre la palabra literal y la cosa que denota, haciendo ver que el lenguaje no refleja el mundo, y que las teorías referencialistas del significado y realistas del conocimiento deben ser revisadas. Aclarar la relación de la metáfora con el lenguaje permite cuestionar seriamente la noción de verdad del realismo filosófico, y exige proponer una teoría semántica más amplia que incluya al significado metafórico, como lo dice de nuevo Bustos: Así pues, una posición no reduccionista acerca de la metáfora conlleva generalmente una doble ampliación o extensión: a) en el campo de la epistemología, en la medida en que extiende el ámbito del conocimiento más allá del terreno de lo literal, y b) en el campo de la teoría del lenguaje, en la medida en que incrementa la teoría de la verdad. (2000, p. 118) Es aquí en donde más notorio se vuelve estudiar filosóficamente la metáfora al poner en cuestión la relación del lenguaje con el mundo y los límites de la teoría del conocimiento realista. Si se sostiene una posición realista del lenguaje que supone que se puede conocer objetivamente la realidad por medio del lenguaje literal, el cual describe al mundo unívocamente por tener una referencia identificable y fija; entonces se compromete con un monismo semántico y alético donde los valores de verdad sólo puedan predicarse a enunciados literales. Con ello se reduce a la metáfora como un fenómeno secundario y parasitario del lenguaje literal, considerándola como un desvío del lenguaje y dependiente de los valores de verdad de los enunciados literales. 26 Es evidente que toda lectura reduccionista de la metáfora lingüísticamente, será también reductiva epistémicamente. Lo pernicioso de la postura objetivista es que hace pensar que fuera de la objetividad se encuentra el engaño retórico de la metáfora. Sobre todo la ingenua pretensión de que existe una única manera de conocer el mundo que es verdadera, ya que al igualar la objetividad con un discurso de la verdad universal, y con ello censurando otros discursos por ser “irracionales” se impone una forma de experimentar el mundo. Como lo afirma Greta Rivara (2006): “el racionalismo a ultranza y el modelo impuesto por el cientificismo a la mayoría de los saberes ha empobrecido la proliferación, vivificación y creación de metáforas” (p. 113); los filósofos racionalistas y empiristas al rechazar el enfoque romántico y hacer de la metáfora algo ajeno a la razón le dieron un lugar extra-epistémico. El mito del objetivismo, al censurar las metáforas, ha hecho que no se produzcan nuevas que permitan comprender el mundo coherentemente de otra manera. El empobrecimiento de la valoración de la metáfora ha provocado la desestimación por algunos filósofos y científicos en su inclusión en ambos discursos, haciendo que no se generen nuevas formas de repensar la realidad. Por lo que estimular la creación de metáforas fecundas y estimulantes permitiría aprender y categorizar al mundo de otra manera. Es por estos motivos que los defensores de la metáfora pueden apostar por un pluralismo semántico que permita justificar la autonomía de la referencia de la oración metafórica, para poder atribuirle valor cognitivo y en consecuencia relevancia epistémica; o también pueden optar por buscar una teoría general de la referencia que enmarque las oraciones literales y metafóricas (Sampieri, 2014). Detenernos en mostrar las diferentes teorías que han intentado explicar la naturaleza de la referencia metafórica excede el espacio de este trabajo, por ahora basta con exponer sucintamente los problemas filosóficos que plantea la metáfora a las teorías tradicionales sobre el conocimiento y el lenguaje. En suma hay dos concepciones sobre el lenguaje. La primera considera que el lenguaje es una copia de la realidad, que supone el isomorfismo entre la palabra y cosa nombrada, por lo que busca la univocidad semántica de una categoría y la copia de la realidad. La otra considera que el lenguaje es una convención lingüística que asume una comunidad, y por tanto él no es una copia de la realidad, sino más bien una aproximación y considera que las palabras tienen polisemia, y que el lenguaje está vivo y crece. Es desde esta última postura donde resulta significativo preguntar sobre las funciones de la metáfora en el lenguaje y en la ciencia. 27 1.2.2 Metáfora Viva y Metáfora Muerta Ahora se examinara la división entre el lenguaje literal y lenguaje metafórico ya que esta distinción, bien analizada, no es clara ni evidente. La discusión sobre la aparente radical diferencia entre lo metafórico y lo literal tiene por fin polemizar sobre su legitimidad a nivel lingüístico y epistémico, y advertir que si esta diferencia se mantiene es por el continuo comercio entre ambas regiones del lenguaje. El que se busque mostrar la primacía de la metáfora en el lenguaje no equivale a sostener que la metáfora sea su único componente, pues esto la haría perder su especificidad y funcionalidad, sino más bien se desea reivindicar su función revitalizadora del lenguaje al aumentar la polisemia de las palabras. Para iniciar hay que notar con Bustos (2000) que lo literal se tiende a definir en contraposición con lo metafórico, y viceversa, lo metafórico en relación a su distanciamiento con lo literal. Por lo que al considerar que las oraciones literales son las exclusivas portadoras de verdad, se iguala el significado literal con el significado verdadero. Y por consiguiente se desprecia a la metáfora por su incapacidad de decir algo verdadero sobre el mundo. Pero el que un enunciado sea literal no lo hace necesariamente verdadero, la veracidad y la literalidad son dos aspectos diferentes: “la cuestión del significado literal es pues independiente de la cuestión de la posesión o no de valores veritativos; son dicotomías que no se corresponden” (p. 71). De modo que el que algo sea literal no garantiza su veracidad, pero en principio si permite evaluar su valor de verdad. Para atender este tema es necesario reconocer el paso y la diferencia entre metáfora la viva y la muerta sostenida por varios autores que comparten la tesis de que no es la metáfora una forma derivada o desviada del lenguaje literal, sino que es el lenguaje literal el que se origina en el lenguaje metafórico. En este sentido la metáfora viva es aquella que es novedosa, dinámica y creativa, mientras que la metáfora muerta es aquella cuya referencia se ha fijado por su asimilación al léxico del lenguaje, es decir, se ha vuelto literal. Como se recordara la tradición romántica consideraba que el lenguaje tenía un origen metafórico, esta tesis fue enriquecida por Nietzsche (2007), quien de manera intempestiva escribía que las, “verdades son ilusiones de las que se han olvidado que lo son; metáforas que se han vuelto gastadas y sin fuerza sensible, monedas que han perdido su troquelado y no son ahora ya consideradas como monedas, sino como metal.” (p. 25). Con esto se entiende que el 28 filósofo considera que las verdades literales tienen su origen en las metáforas, que al ser usadas constantemente se terminan por afianzar en conceptos. De este modo a toda la realidad definida por categorías le antecede una noción metafórica que, olvidada, pierde su carácter inventivo y experiencial. El giro con Nietzsche es considerar que las palabras literales son verdades culturales de naturaleza metafórica. Para explicar el paso de la metáfora viva a la muerta C. M. Turbayne (1970), desde la filosofía de la ciencia habla de un proceso de tres etapas de la vida de una metáfora: en un primer momento una metáfora es considerada por una comunidad como el uso inadecuado, desviado e incorrecto de una palabra. Después un momento de inversión semántica donde lo que era el significado literal es considerado la metáfora y lo que antes era metáfora pasa a ser considerado el significado literal. Y, por último, el triunfo de la metáfora consiste en ser aceptada como lugar común al ser lexicalizada en el lenguaje. Esta inversión se da por el uso constante del significado metafórico, olvidando que lo es. Turbayne al describir este proceso busca llamar la atención en aquellas metáforas ocultas que están presentes en la ciencia al ser tomadas por costumbre como explicaciones verdaderas y literales de los fenómenos. Su trabajo busca hacer visibles las metáforas que guiaron la actividad científica, poniendo como ejemplos las metáforas en Descartes y Newton. Al hablar sobre el uso de las metáforas advierte que no se ha de confundir “la máscara con el rostro”, es decir la explicación metafórica con la realidad. Por ello sugiere ser precavidos al usar la metáfora para no terminar siendo usados por ella, dice: “El que cae víctima de la metáfora acaba por clasificar, agrupar o colocar los hechos como la única forma que existe para clasificarlos” -y agrega- “la víctima no sólo tiene un enfoque particular del mundo, sino que, además, considera que la suya es la única perspectiva posible, o más bien, confundiendo una especial perspectiva del mundo con el mundo mismo.” (p. 42) Cabe notar dos cosas en esta cita: primero que la categoría que utiliza Turbayne para describir como alguien toma una metáfora por verdad es una metáfora: victima. Esto no niega la validez de su afirmación pero si hace evidente que Turbayne no estaba en contra del uso de metáforas para dar cuenta de algo, él no censura a la metáfora. Por otro lado, y es lo más importante, el que haga víctima a alguien no es ciertamente por usar metáforas, sino por usarlas de modo que sea la única forma de organizar el conocimiento para quien la usa. Ser víctima es usar una metáfora sin la conciencia de que es una tomándola por la verdad literal y organizando en consecuencia la experiencia en torno a esa única forma, imponiéndole al mundo 29 esa forma. Su exhortación va en el sentido de que es lícito usar metáforas teniendo presente que lo son, permitiendo reconocer la parcialidad de cualquier conocimiento. Su postura es entonces nominalista y anti esencialista pues cada metáfora vendría a describir una parte de la realidad sin abarcarla completamente, o sin ser ontológicamente explicativa. De ahí su crítica a Descartes por confundir su metáfora de la estructura mecánica del reloj como la del propio mundo6. Descartes por ejemplo escribe: “Hasta ahora sólo he descrito esta Tierra, y en general todo el mundo visible tal y como si solamente fuese una máquina” (2014, p. XXIII)7. El aviso de Turbayne va en el sentido de no dejarse confundir por estos “cruzadores de especies” -como llama a los creadores de metáforas- y de creer que sus trabajos reflejan la estructura fiel del mundo. Aunque a pesar de sus evidentes reservas nunca niega que las metáforas son formas necesarias y útiles para la aprensión de la realidad. Leary (1990) sostiene de manera ingeniosa que el que se fije una referencia en la metáfora muerta no significa que se termine ahí la evolución semántica de una palabra, ya que en el lenguaje hay una dinámica constante entre el lenguaje literal y el metafórico: “there is continual commerce between these two poles, as metaphorical concepts become more common (i.e. literal) through use and as literal concepts are used in unexpected (i.e. metaphorical) ways” (p. 6) es decir, el lenguaje evoluciona por la dialéctica entre la metáfora viva y la muerta; si bien la metáfora viva se lexicaliza gradualmente por su constante uso hasta que se convierte en común, después el significado literal de la metáfora muerta tiene la posibilidad de resignificarse en una nueva metáfora, agregándole sentidos a una palabra y, de nuevo, este significado metafórico se convierte en literal con el tiempo al institucionalizarse. A esto se debe que algunos consideren que el lenguaje natural es el cementerio de lo que fueron alguna vez metáforas novedosas. Este proceso cíclico y continuo permite por un lado tener un léxico suficientemente estable para que sean comunicables las experiencias de una comunidad lingüística, y por otro hacer evolucionar el lenguaje haciendo que las palabras se vuelvan polisémicas y así permitir nombrar nuevas parcelas del mundo. La metáfora así entendida sería una condición previa al concepto y posterior a él, y que trasforma lo extraño en familiar. Pero mientras que la metáfora exige interpretación; el concepto fidelidad. Bajo esta lectura el funcionamiento de la metáfora garantiza otorgar nuevos sentidos a las palabras sin perder los anteriores e inaugurar novedosas referencias en el lenguaje, lo que 30 permite aumentar la polisemia de las palabras y garantiza la expansión continua del lenguaje. Corona describe así este proceso: Las palabras evolucionan, cambian, se transforman y la metáfora es un motor que promueve dichos cambios, contribuyendo a dar nombres a realidades a las que la lengua no suministra un término adecuado, nutriendo con ello el lenguaje literario, filosófico y científico (2008, p. 2) La metáfora lleva a pensar que el lenguaje no está terminado y que en lugar de provocar confusión semántica, habilita a las palabras para que encuentren nuevos significados, permite observar nuevas dimensiones de la realidad y asociaciones novedosas entre las cosas; también sirven, como lo demostraron Lakoff y Johnson (2009), de base para organizar la estructura de los conceptos, y como fenómeno principalmente mental va sistemáticamente ampliando el horizonte de acción y de comprensión del hombre, aumentando así la legibilidad que tenemos del mundo, ofreciendo inéditas posibilidades de describirlo o explicarlo en todos los campos de conocimiento. Por ahora conviene notar que al revisitar la relación entre la metáfora y el lenguaje nos llevó a plantear de otro modo el vínculo entre la metáfora y el conocimiento. La dificultad para sostener la versión correspondentista del significado y de la verdad, y representacional del lenguaje por los problemas filosóficos que supone la metáfora en el lenguaje nos obliga a dejar posiciones de realismo ingenuo, cuya pretensión de adjudicarse la verdad de manera objetiva como copia de la realidad es insostenible. Ya que si el sistema conceptual está estructurado por metáforas muertas–incluyendo al científico-, el conocimiento está basado necesariamente en redescripciones metafóricas como tendremos oportunidad de ver con Mary Hesse más adelante. Hasta ahora se ha argumentado para hacer plausible la idea de que la metáfora tiene más importancia filosófica que lo que de costumbre se acepta. Cabe advertir que por el uso de metáforas en el desarrollo del conocimiento científico este carezca entonces de validez, sea literario o puramente narrativo. Sostener eso es un error porque eso supondría entender a la metáfora exclusivamente de manera estética; pero al reconocer la función cognitiva y participativa para la innovación conceptual y su participación en la elaboración de modelos teóricos permite entender el modo en cómo se construye un sistema teórico (Palma, 2005). Son dichas funciones las que explicaremos en el siguiente apartado. 31 1.3 La Metáfora desde la Filosofía de la Ciencia La relación entre la filosofía y la metáfora es difícil y contradictoria. En momentos es celebrado su uso en el discurso filosófico con metáforas fecundas y, en otros, las más de las veces, es expulsada de la filosofía por parecer ambigua. Cuando se trata de la metáfora en la teoría del conocimiento es definitivamente negada como forma de aprehender el mundo, sobre todo desde que del positivismo lógico exigió como condición para predicar la veracidad de una oración hacerlo en forma literal y lógicamente estructurada. Con esto el estatuto de la metáfora no pasó de ser más que ornamental, cuando mucho, heurístico y didáctico. Metáforas como que el átomo es un pequeño sistema solar, el sonido es ondas en movimiento, la mente es una computadora, etc., dan cuenta de su presencia en la ciencia y señalan la importancia de dar cuenta de cuál es el papel que juegan dentro de ella. Por ello en esta parte se va a exponer como ha sido conceptualizada la metáfora en relación al discurso filosófico y científico y como han tratado estas teorías de responder al problema del significado de la frase metafórica. La respuesta al significado de la metáfora depende de la teoría del significado que la busque responder por lo cual se van a estudiar los acercamientos de algunos filósofos de la ciencia que se han ocupado del tema desde dos grandes enfoques: el semántico y el pragmático. Mientras las teorías semánticas se ocupan de explicar el significado lingüístico determinado por las reglas de la gramática y la semántica. Las teorías pragmáticas intentan dar cuenta del significado comunicativo o significado del hablante, el cual es el significado que se da en el contexto de uso de una expresión lingüística en un escenario comunicativo particular, y que es independiente del significado semántico convencional de esa expresión. El significado pragmático es entonces aquel que explica la función del contexto en la emisión y comprensión de un significado (Bustos, 2000). La postura semántica e interaccionista es iniciada por I. A. Richards, formalizada por Max Black, y después fortalecida por Mary Hesse. Mientras la postura pragmática está bien representada por John Searle y Donald Davidson, quienes polemizan sobre la identidad semántica atribuida a la metáfora. Para al final confrontar conceptualmente las tesis de ambas posturas y así reconocer sus ventajas y desaciertos. 32 1.3.1 Metáfora y Heurística What is now proved was once only imagined William Blake. En este apartado se van a precisar las funciones heurísticas de la metáfora en la lógica del descubrimiento científico. Para ello se describirá brevemente la distinción entre el “contexto de descubrimiento” y el “contexto de justificación”, para después poder introducir la categoría de heurística, la cual se encarga de investigar los procesos creativos del proceso de investigación científica, y enseguida argumentar de qué manera la metáfora puede servir para explicar la parte heurística de la ciencia al facultar la creación de nuevas hipótesis científicas. La filosofía de la ciencia se comienza a profesionalizar a inicios del siglo XX, esta primera etapa se caracteriza por buscar establecer las reglas metodológicas para la validación racional de los resultados y la correcta práctica científica. En ese sentido en 1938 Hans Reichenbach, empirista lógico, propuso la distinción entre “contexto de descubrimiento” y “contexto de justificación”. El contexto de descubrimiento se ocupa de, “los procesos por los cuales los individuos llegan a concebir o a descubrir hipótesis” (Pérez-Ransanz, 1999, p.17), mientras el contexto de justificación se encarga de, “los procesos por los cuales dichas hipótesis se evalúan y se justifican ante la comunidad de especialistas” (p 17); el contexto de descubrimiento intenta dar cuenta de cómo se generan nuevas ideas para abordar un problema, es pues la parte inventiva del proceso de investigación científica y por lo tanto está más relacionado con cuestiones psicológicas o sociales, que con las propiamente vinculadas con el conocimiento verdadero; mientras el contexto de justificación busca reconstruir de manera lógica el conocimiento y se encarga de establecer los criterios de validación de una hipótesis cómo científica, o no. De acuerdo con Reichenbach sólo el contexto de justificación es el que resulta de interés para los filósofos de la ciencia pues identificaba la filosofía de la ciencia con la epistemología, para él: “la epistemología sólo se ocupa de construir el contexto de justificación” (Reichenbach citado en Echeverría, 1995, p. 5). La epistemología al reconstruir lógicamente el lenguaje científico garantizaba la racionalidad científica. Con esta distinción se iguala, o mejor dicho, se reduce la investigación epistemológica a la reconstrucción lógica de los productos de la ciencia realizado en el contexto de justificación. 33 Consecuencia de ello fue que la exclusiva atención de los filósofos de la ciencia de la concepción heredada en investigar filosóficamente al contexto de justificación. Las dos posturas más discutidas de esa etapa fueron representadas por Rudolf Carnap y Karl Popper, el primero empirista lógico y el segundo racionalista crítico, a pesar de sus aparentes diferencias irreconciliables, ambos consideraban que los problemas epistemológicamente relevantes eran establecer los criterios normativos de la investigación para obtener resultados científicos que proporcionaran certeza y predicción, basados en análisis lógicos universales que permitieran reproducir los resultados por cualquier científico con los mismos datos empíricos. Mientras que para Carnap la validación de una hipótesis tendría que pasar por una lógica inductiva que indicara el grado de confiabilidad en una hipótesis; para Popper era inaceptable la validación inductiva y proponía una lógica deductiva en la que una hipótesis es puesta a prueba tratando de refutar sus consecuencias hasta que es descartada o corroborada. Sin embargo ninguno de ambos análisis se interesa por explicar los procesos creativos de la lógica del descubrimiento científico. La lógica deductiva ni la inductiva pueden dar cuenta de cómo se crean nuevas hipótesis e ideas científicas. El contexto de descubrimiento en esta primera etapa de la filosofía de la ciencia fue así desterrado del análisis epistemológico por juzgarlo poco riguroso, o abiertamente irracional, como lo llego a afirmar Popper, y por lo tanto no sería filosóficamente relevante porque no permitía su reconstrucción racional. De lo anterior se dedujo, como señala Velasco (2000), que hay una oposición entre objetividad y creatividad en la ciencia por la división de Reichenbach, ya que el contexto de descubrimiento sería irracional por carecer de rigor lógico. Este vacío explicativo sería investigado después en la historia de la filosofía buscando procedimientos heurísticos que permitieran explicar los aspectos creativos de la actividad científica. La heurística se encarga de la, “formulación de nuevas hipótesis y teorías para resolver anomalías de algunos principios teóricos fundamentales y también para plantear nuevos problemas y descubrir nuevos hechos y acontecimientos” (Velasco, 2000, p. 228), así entendida la heurística se ocupa de explicar la generación de nuevas hipótesis, proceso que resulta indispensable para la posterior refutación empírica de éstas. También permitiría formular nuevos problemas que orienten el desarrollo de la empresa científica y el descubrimiento de nuevos objetivos científicos. Por lo que no cabe seguir negando su participación metodológica e importancia epistémica en la investigación, pues resulta indispensable para el desarrollo del conocimiento científico. La heurística entonces está más 34 relacionada con la generación de ideas (ars inveniendi) que con la demostración y evaluación de estas (ars probandi), lo cual no quiere decir que ambos procesos estén separados, ni mucho menos que uno sea más importante que otro. La distinción entre contextos de Reichenbach no está libre de problemas por su arbitrariedad y rigidez8, pero nos sirve para introducir algunas funciones que tiene la metáfora y que podrían explicar la parte heurística del descubrimiento científico. La metáfora, al proporcionar formas novedosas de plantear o resolver un problema, generar nuevos conceptos e incluso servir de base para la construcción de modelos teoréticos participaría en el desarrollo de una tradición de conocimiento. En general es aceptado que la metáfora sirve como elemento especulativo para la postulación de hipótesis en el inicio de una investigación empírica. Draaisma (2000) por ejemplo señala las funciones heurísticas de la metáfora en la historia de la ciencia, afirma que se produce cuando un campo semántico accesible es usado para descubrir o precisar las relaciones de otro campo de interés. Propone dos tipos de heurística: la teorética y la empírica. La función heurística teorética de la metáfora es aquella que introduce nuevas concepciones para tratar un problema polémico en la ciencia y ayuda a resolver contradicciones aparentes en los resultados experimentales; la heurística empírica es aquella que produce nuevos temas para la investigación a través de un concepto metafórico. Sin embargo el reconocimiento de las funciones heurísticas de la metáfora la ubica desde la filosofía de la ciencia sintáctica en los estudios del contexto de descubrimiento y por tanto sin plena legitimidad en el contexto de justificación. Lo que a veces se descuida es que al proponer estas hipótesis como “persuasiones probables” por medio de una metáfora, se adquieren compromisos cognoscitivos que dirigen toda la investigación y presuponen supuestos en la planeación de los diseños experimentales, por lo que la metáfora no sería sólo funcional en el inicio de la construcción de una teoría, sino que al utilizarla orientan el desarrollo del conocimiento de un campo especifico. Cabe anotar que a través del reconocimiento del proceso heurístico en la ciencia se posibilita restablecer su relación con las artes por ser ambas empresas creativas como bien lo hizo ver Black: 35 All intellectual pursuits, however different their aims and methods rely firmly upon such exercises of the imagination as I have been recalling. (…) When the understanding of scientific models and archetypes comes to be regarded as a reputable part of scientific culture, the gap between the sciences and the humanities will have been partly filled. For exercise of the imagination, with all its promise and its dangers, provides a common ground. If I have so much emphasized the importance of scientific models and archetypes, it is because of a conviction that the imaginative aspects of scientific thought have in the past been too much neglected. For science, like the humanities, like literature, is an affair of the imagination (1962, p. 242-243). Esta cita resulta oportuna en primer lugar porque da cuenta de que la ciencia hace uso de la imaginación para su desarrollo, Black reconoce esto y no lo niega como ocurre con gran parte de la tradición de filósofos de la ciencia que ven a los actos creativos con desconfianza por no seguir un razonamiento algorítmico preciso. También el filósofo advierte que es este el vínculo el que permite restablecer el dialogo entre la ciencia y otras disciplinas, olvidando la división arbitraria y jerárquica entre ellas; como también lo señala Ambrosio (2000), reconociendo la ciencia y las artes son proveedores de conocimiento que, aunque diferentes en sus objetivos y procedimientos, están familiarizados por servir al fin de organizar y comprender al mundo por medio de la imaginación. El hecho de que tanto ciencia como arte sean resultado de la imaginación no significa que la ciencia sea imaginaria en un sentido degenerado de la palabra como sinónimo de fantasía, sino más bien la confirmación que es por esta actividad integrativa y asociativa de elementos dispares que se permite crear nuevas formas de entender la realidad, tal como hace la metáfora. Además Black es explícito al afirmar que es el estudio de los modelos tienen importancia en la investigación científica. Ese es el tema que trataremos al final de este capítulo para reconocer las funciones que tiene la metáfora en el contexto de justificación. 36 1.3.2 Teorías Semántico e Interaccionistas En este apartado se examina filosóficamente la metáfora y su participación en la construcción del conocimiento científico, para ello se presentan históricamente y discuten las tesis de las teorías semánticas e interaccionistas de la metáfora con el fin de responder a las siguientes preguntas: ¿Cómo funciona una metáfora?, ¿En qué se diferencia la metáfora del símil?, ¿A qué se refiere el significado metafórico?, ¿Es posible traducir una metáfora a enunciados literales?, ¿Qué funciones cumple la metáfora en la ciencia?, ¿Cuál es la relación entre la metáfora y la explicación científica?. En primer lugar se presenta la teoría de la metáfora de I. A. Richards, quien inicio la lectura interaccionista de la metáfora; sus ideas fueron recuperadas por Max Black, quien propuso la primera teoría semántico e interaccionista de la metáfora, y que después fue criticada y precisada por Mary Hesse, para definir las funciones de la metáfora en el escenario científico. Todas estas teorías comparten la creencia de considerar que el significado de la frase metafórica es resultado de un mecanismo semántico que faculta interacción entre los elementos de la frase, y que así permite crear una nueva referencia semántica. La lectura empobrecida de la metáfora por parte de la tradición retórica y la interpretación radical de la misma por el romanticismo y Nietzsche perduro hasta principios del siglo XX. En ese contexto, el crítico literario y retórico inglés Ivor Amstrong Richards reexamino el tema en su The Philosophy of Rhetoric, escrito en 1936, para superar la manera reduccionista de pensar la metáfora por la retórica, limitada a estudiar problemas superficiales y que la entendía trivialmente como desvió sustitutivo del lenguaje. Se revisan sus tesis sobre la metáfora para reconocer que su aportación teórica es el antecedente de la teoría semántico e interaccionista de la filosofía de la ciencia. Richards (1965) ve a la metáfora como una habilidad y sostiene, siguiendo a Shelley: “The metaphor is the omnipresent principle of language” (p. 92), por lo que decide repensar la teoría de la metáfora y se anima a proponer otra más satisfactoria que dé cuenta de cómo funciona. Para tal tarea se apoya en las intuiciones del poeta y crítico literario del romanticismo inglés S. T. Coleridge sobre la naturaleza del lenguaje. La tesis de Richards es la siguiente: “when we use a metaphor we have two thoughts of different things active together and supported by a single word, or phrase, whose meaning is a 37 resultant of their interaction” (p. 93). La novedad de su explicación es que Richards deja de ver a la metáfora como la sustitución de una palabra por otra con la misma extensión referencial, para explicar que el significado metafórico se da por su funcionamiento al nivel de la frase, en la cual se ponen interacción semántica dos ideas diferentes y que de su co-operación resulta un nuevo significado distinto del significado literal de las palabras que componen la frase metafórica. Dado que la relación entre los pensamientos es de simultaneidad lingüística y cognitiva, Richards agrega: Made metaphors seem to be a verbal matter, a shifting and displacement of words, whereas fundamentally it is a borrowing between and intercourse of thoughts, a transaction between contexts. Thought is metaphoric, and proceeds by comparison, and the language derives there from (p. 94). Para Richards la presencia de la metáfora en todo el lenguaje muestra que más que ser un mero recurso lingüístico, es una habilidad propia del pensamiento, es decir, cognitiva, como también lo advirtieron Lakoff y Johnson, y que funciona por la co-operación entre dos partes de la frase a las que Richards llama tenor y vehículo, las cuales hacen funcionar a la metáfora como una unidad de la siguiente manera: The co-presence of the vehicle and tenor results in a meaning (…). That the vehicle is not normally a mere embellishment of a tenor which is otherwise unchanged by it but that vehicle and tenor in co-operation give a meaning of more varied powers tan can ascribed to either (p. 100). De este modo supera la visión tradicional de la metáfora como sustitución o comparación, y propone que al poner en interacción al tenor y al vehículo da por resultado un nuevo significado, esta co-operación se basa en la tensión entre los parecidos (resemblaces) de ambas partes y también entre las disparidades (disparities), de tal modo en que la metáfora no se diluya en la mera comparación por la identificación radical de sus términos. Richards amplia de este modo el concepto de metáfora al sostener que la base de esta operación está en las características comunes entre el tenor y el vehículo. Pero no basta con poner dos palabras lejanas para que se logre una metáfora, sino que además precisa que el lector las conecte y las ponga en interacción semántica, no habiendo en principio límites restringidos para sus relaciones potenciales. 38 El estudio de la metáfora como concepto límite lleva a Richards a examinar el lenguaje, para él el lenguaje no es una copia de la realidad, sino es un recurso para ordenar al mundo. Hay, además, una parte de su estudio que no ha sido suficientemente comentada y que es importante para comprender su teoría de la metáfora. Piensa, junto con Coleridge, que la palabra es una planta, es decir, que la relación entre una planta en la naturaleza es la misma que la palabra en la frase: una relación de apertura y crecimiento imaginativo, de comunión abierta (open communion) de la palabra con la totalidad de la frase, por eso al final de su ensayo pregunta: “are not the words parts and germinations of the plant” (p. 112). Esto anticipa el carácter abierto de la metáfora que otros teóricos como Black, Hesse e incluso Searle reconocerán después. La omnipresencia de la metáfora en el lenguaje de la que habla Richards exige definirla específicamente en el ámbito de la ciencia, los brillantes aportes del crítico literario sobre el funcionamiento y cualidades de la metáfora son ampliados por Max Black, filósofo de formación analítica que trabajo en temas de la filosofía del lenguaje, la filosofía de las matemáticas y la filosofía de la ciencia. Él reconoce su deuda intelectual con Richards y fue el primero en retomar el estudio de la funciones de la metáfora desde el análisis filosófico, con su germinal ensayo Metaphor, escrito en 1954, la metáfora se vuelve parte de la agenda de la filosofía de la ciencia en la segunda mitad del siglo XX y se formaliza el enfoque semántico e interaccionista de la metáfora. Black (1954) inicia su ensayo con una cita que recuerda que las metáforas no son argumentos. Tal vez esa es la razón por la que la filosofía prescindiera de su estudio y objetara su uso; afortunadamente su interés estaba en explicar el misterio de la metáfora atendiendo a como se forma su significado, por lo cual decide abordar su estudio desde la semántica, sin por eso negar el factor pragmático. Al igual que Richards identifica dos partes en la frase metafórica: el foco y el marco. El foco se refiere a la palabra o expresión que es usada en sentido metafórico, mientras el marco es el resto de la oración entendida literalmente. A partir del marco se le da contexto al foco para otorgarle el sentido metafórico; si el marco cambia, aun teniendo el mismo foco, puede que deje de ser metáfora o que el sentido de la misma cambie. Por ello considera que el funcionamiento de la metáfora está más relacionado con la semántica que con la pragmática, es decir, es una cuestión del significado en la frase más que del uso que se le dé a la misma. Black hace una división de enfoques para explicar la metáfora: el sustitutivo, el comparativo y el interactivo. Desde el enfoque sustitutivo (substitution view of metaphor) el 39 significado de la expresión metafórica M es el mismo de la expresión compuesta por palabras literales L, es decir, los significados de las expresiones M y L son equivalentes. La metáfora consiste en sustituir a L por M; el foco de la frase metafórica es usado de manera desviada para comunicar un significado que podría haber sido expresado de manera literal. El lector debe entonces invertir la sustitución y descifrar el significado de L por medio de la expresión M. Esta lectura de la metáfora es la que ha permanecido en los diccionarios. Black piensa que bajo este enfoque una metáfora es usada cuando no se tiene en el léxico la palabra para nombrar lo que se desea decir, es decir, no existe la expresión L en lenguaje, la metáfora entonces vendría a llenar un vacío en el lenguaje. A esta operación se le conoce como catacresis, en la que se le asigna un significado nuevo a una palabra antigua para rellenar una brecha en el léxico y nombrar algo que carece de nombre aún. Sin embargo, cuando la metáfora es usada así su significado pasa a ser literal, y en consecuencia se pierde para siempre la metáfora. Cuando la metáfora es usada de esta manera, y existe la expresión L, su uso sólo se justifica como decoración, causar sorpresa, placer o divertir al lector. Entender a la metáfora como sólo un sustituto tuvo la consecuencia de que se le otorgara una función estilística, pues dice exactamente lo mismo que la frase literal sin aportar algo más, y que fuera considerada como un desvío del sentido literal. Para este enfoque una variación en la sintaxis no cambia el significado. Es claro que este enfoque representa los traslados entre género y especie de la teoría aristotélica de la metáfora, y que como señalamos, no era aplicable para las metáforas por analogía. Estas últimas se pueden explicar por medio del enfoque comparativo (comparison view of metaphor), el cual es un caso del sustitutivo. El enfoque comparativo sostiene que la metáfora se funda en una analogía pero subyacente, el significado de M es similar o análogo al significado de L, por lo cual se usa la expresión metafórica M para reemplazar a L, y el lector debe entonces usar M para llegar a descubrir L. De ese modo la metáfora es vista como un símil elíptico, cuya fórmula característica es: X es como Y. Pero aquí la proposición comparativa como supone una semejanza que, aunque no es siempre expuesta, mantiene la idea de que es una forma de expresar un mensaje literal y por lo tanto la metáfora bien podría traducirse a una expresión literal. A este par de enfoques Black los descalifica para ser objeto de interés filosófico porque para él las metáforas no son sustitutos ni comparaciones, ni sólo sirven para divertir al lector para que descifre su significado. Por eso pasa a proponer el enfoque interactivo con el que busca superar ambos enfoques: el interaccionista. 40 Desde el enfoque interaccionista (Interaction view of metaphor), el significado de la metáfora funciona por medio de la interacción entre los dos pensamientos que componen la frase metafórica en actividad simultánea en una única palabra o frase. Así, en una expresión se mantienen en interacción dos ideas asociadas a la misma palabra, las cuales cooperan para producir un significado nuevo. El funcionamiento de la frase metafórica es explicado de la siguiente manera: I think this must mean that in the given context the focal word (…) obtains a new meaning, which is not quite its meaning in literal uses, nor quite the meaning which any literal substitute would have. The new context (the "frame" of the metaphor, in my terminology) imposes extension of meaning upon the focal word. (Black, 1954, p 286) De tal manera que el foco obtiene un nuevo significado por medio del marco, el nuevo marco produce la “extensión” del significado de la palabra focal al estar ambos activos simultáneamente e interactuar, para ello el lector debe mantener el significado anterior y el novedoso en la mente y ponerlos en interacción. Con esto la metáfora supera el estado de sustitución para generar una tensión entre ambos significados activos en un mismo término. Para entender su propuesta Black (1954) usa una metáfora, invita a verla como un filtro donde hay dos asuntos, siendo uno el principal (principal subject) y el otro subsidiario (subsidiary subject). El asunto principal es el que se quiere ver a través el asunto subsidiario. Para que una metáfora funcione el lector debe de tener un conocimiento común sobre el asunto subsidiario asociado a él conocido como sistema de tópicos acompañantes (system of commonplaces); este sistema de ideas son el conjunto de creencias que tiene una comunidad lingüística sobre el asunto subsidiario, y que no requieren un conocimiento especializado. De manera que al hacer uso del sistema de ideas asociadas al asunto subsidiario para entender al asunto principal, el lector deba de evocar el sistema de ideas del asunto subsidiario y adaptarlas al asunto principal de manera normal o anormal, a partir de lo cual se construye un sistema de implicaciones asociadas sobre el sistema principal a partir del sistema de implicaciones del sistema subsidiario, lo cual permite inaugurar nuevas implicaciones en el asunto principal determinadas por el sistema de implicaciones del sistema subsidiario. Este sistema sirve como referente semántico para configurar el modo de aprensión del asunto principal, aplicándole 41 algunos tópicos comunes del asunto subsidiario, destacando de este modo unos de sus rasgos y ocultando otros. Black usa una metáfora más para explicar su teoría: verla como pantalla que filtra y transforma al asunto principal proyectado sobre el asunto subsidiario; de ese modo la descripción del sistema principal es determinada por el sistema de implicaciones del asunto subsidiario, lo cual hace ocultar unos de sus aspectos y enfatizar otros que no serían visibles de otra forma. Con lo cual se organiza la visión e intelección del primer asunto. Para hacer más inteligible la relación entre asuntos obsérvese la Figura 1. Figura 1. Teoría interaccionista de la metáfora Black (1954). Como se observa, cada asunto tiene su propio sistema de ideas asociadas, la metáfora funciona cuando a partir del sistema de implicaciones, llamémoslo I, generado por el conjunto A de ideas asociadas del asunto subsidiario X, se organiza la descripción del sistema principal Y a través de algunos de sus tópicos acompañantes. De manera que se hace encajar algunas las implicaciones características de X: X2, X4, X8, al asunto Y para destacar y ocultar algunas de sus cualidades y así organizar la visión que se tiene del asunto principal. En resumen, desde esta primera propuesta de Black (1954) de la teoría interaccionista, la frase metafórica tiene dos asuntos: uno el principal y otro el subsidiario; los cuales son sistemas de cosas. La metáfora funciona cuando se aplica al sistema principal el sistema de implicaciones Foco/Principal Subject: Y: (System of commonplaces) Y1 Y2 Y3 Y4 Y5 Y5 Yn Marco/Subsidiary Subject: X: (System of commonplaces) X1 X2 X3 X4 X5 X6 X7 X8 Xn X2 X4 X8 42 asociadas del sistema subsidiario; el sistema de implicaciones está conformado por el sistema de tópicos acompañantes del sistema subsidiario. La metáfora permite organizar, destacar, suprimir y organizar características del sistema principal, aplicándole creencias comúnmente asociadas al asunto subsidiario. Lo cual permite extender el significado del sistema primario sin negar su anterior significado produciendo una interacción entre estos. El nuevo significado es resultado de la interacción semántica entre ambos asuntos. De esta manera Black busca superar las dificultades que presentaban los enfoques sustitutivo y comparativo de la metáfora, ya que para ambos las metáforas pueden ser reemplazables por oraciones literales sin pérdida de contenido cognitivo; pero para el enfoque interaccionista las metáforas no pueden ser remplazadas pues por medio de su funcionamiento se genera un nuevo significado que no es reductible al significado literal del asunto principal ni del subsidiario, ni es reemplazable por una expresión literal L, ya que no existe expresión así en el lenguaje. Este nuevo significado permite penetrar de manera intelectual en el asunto principal de una manera que no es posible sin la metáfora. Al organizar la visión del asunto principal se gana contenido cognitivo, el cual se pierde cuando se parafrasea una metáfora, pues no hay una expresión L que funcione como sustituto cognitivo del significado metafórico. Por estas razones Black asegura que la metáfora tiene contenido cognitivo que corresponde al nuevo significado de la frase metafórica; más cuando se suprime las metáforas del discurso, se pierde también la capacidad inquisitiva que estas facultan. El primer artículo de Black fue ampliamente discutido por lo que la metáfora comenzó a incorporarse a la agenda de la filosofía. En 1977 Black escribe otro ensayo para hacer algunas precisiones a su teoría interaccionista de la metáfora, con la cual evita dos formas de comprenderla que aparentemente eran irreconciliables: la trivialización de la metáfora entendida como un símil elíptico que dominaba en la tradición retórica, y el verla como el acceso a una forma de conocimiento trascendental por la tradición romántica. El primer enfoque, poco sofisticado, heredo una comprensión de la metáfora empobrecida y reduccionista, que fuerza la lectura de la frase metafórica como si fuera un enunciado literal, y por lo tanto desviado o absurdo, que puede y debe ser remplazado por otra oración literal. Por ello en este artículo Black (1977) adoptó una posición anti reduccionista y anti positivista que reconoce la autonomía del significado metafórico del significado literal; la irreductibilidad de la metáfora al símil; y que además de sostener su valor cognitivo, quiso defender su capacidad creativa. 43 Esta vez reconoce al crítico literario S. T. Coleridge como uno de los primeros teóricos en asignar a la metáfora su capacidad creativa al permitir generar un nuevo significado a partir de medios sintácticos y semánticos convencionales, el cual no puede ser inferido del léxico; y que más bien proviene de un mecanismo semántico especial que opera en la frase metafórica. Por ello el interés de Black (1977) se centró en aquellas metáforas que están vivas, o como el las llama, activas. En estas reconoce dos aspectos: el énfasis (emphasis) y la resonancia (resonance), el primer elemento se refiere a que no se pueden sustituir las palabras de la frase metafórica, y el segundo al grado de elaboración de implicaciones nuevas que ésta permita. Entre más énfasis tenga una metáfora más resonante será, y en tal caso ambos elementos conforman una metáfora fuerte (strong metaphors). Para explicar la capacidad creativa de las metáforas fuertes Black analiza su funcionamiento a partir de los elementos de la teoría interaccionista mejorada. 1) La frase metafórica está compuesta de dos elementos: el primario y el secundario; en lugar del principal y el subsidiario de la primera versión. 2) Sólo el asunto secundario es visto como un sistema de cosas, el cual permite establecer un sistema de relaciones o complejo implicativo. 3) El enunciado metafórico funciona de la siguiente manera: “‘projecting upon’ the primary subject a set of ‘associated implications,’ comprised in the implicative complex, that are predicable of the secondary subject” (Black, 1977, p. 442), es decir, del complejo implicativo del asunto secundario se desprenden un conjunto de implicaciones asociadas que son proyectadas sobre el asunto primario. 4) Con lo cual se seleccionan, enfatizan, y organizan las características del asunto primario al aplicarle oraciones isomorficas, por medio de los miembros que componen el sistema de implicaciones del sistema secundario. 5) De esa manera ambos asuntos interactúan, ya sea seleccionando algunas de las propiedades relevantes del sujeto secundario para construir un complejo implicativo que encaje con el asunto primario, e inducir un proceso análogo sobre el asunto secundario. En la figura 2 se representa el funcionamiento de la metáfora-tema: X es Y, a partir de la teoría interaccionista revisada. De tal modo que del complejo implicativo P compuesto por el sistema de oraciones que caracterizan al sistema secundario X, se seleccionan algunas de estas oraciones: X3, X5, X6, y se construye un sistema de implicaciones asociadas que encajen con el sistema secundario Y, y lo pasen a describir por medio de las oraciones isomorficas: X3’, X5’, X6’, de manera normal o anormal. Algunas de las implicaciones del conjunto (X1-Xn) permitirán 44 la extensión del significado de Y, mientras que otras no; sin embargo, como la metáfora fuerte tiene un alto grado de resonancia, permanecerá abierta el establecimiento de nuevas implicaciones. De ahí que las metáforas requieran de cierta ambigüedad e indeterminación semántica para garantizar su efectividad. Figura 2. Teoría interaccionista de la metáfora Black (1977) Aunque en su estudio inicial Black (1954) haya desistido de identificar las metáforas con las analogías, en este ensayo advierte (Black, 1977) que la estructura del sistema de implicaciones del sistema secundario Y tiene isomorfia, es idéntico o análogo al sistema de implicaciones del sistema primario X, de tal manera que crea una red de isomorfismos en la que las oraciones de X corresponden a los de Y. Es decir, que en cada metáfora está basada en un conjunto de analogías, o, mejor dicho: cada metáfora es un instrumento que permite trazar implicaciones por medio de analogías entre las estructuras de dos asuntos de dominios diferentes, las cuales exigen un esfuerzo imaginativo por parte del lector para establecerlas. Sin embargo advierte que la implicación de analogías en el funcionamiento de la metáfora no es lo mismo la identidad entre la metáfora y la analogía, ya que en la comparación se pierde la capacidad sugestiva que faculta la primera. El funcionamiento de la metáfora fuerte descrito por Black hace que le reconozca que tiene capacidad creativa al crear y descubrir relaciones entre dos asuntos, en sus palabras: “The imputed ‘relations’ in a generative metaphor, Foco/Primary Subject: Y X3' X5' X6' Marco/Secondary Subject: X: (Complejo implicativo "P") X1 X2 X3 X4 X5 X6 X7 X8 Xn X3 X5 X6 45 one might say, must have a ‘subjective’ as well as an ‘objective’ aspect, but each may contribute to the other” (Black, 1977, p. 452). Para Black las metáforas como instrumentos cognitivos crean las relaciones en el sentido de que una vez percibidas se hacen presentes o efectivas, por ello son tanto subjetivas como objetivas; de tal manera que algunas metáforas permiten percibir aspectos de la realidad que ella misma ayuda a construir. En ese sentido para Black el mundo siempre es percibido bajo cierta perspectiva, la metáfora como instrumento cognitivo participa en la construcción de una perspectiva desde la cual se puede ver de manera novedosa un dominio de referencia, sin por ello romper el compromiso ontológico que asume Black; como bien lo señala Bustos (2000): “la posición epistemológica y ontológica de Black consiste en que la perspectiva no es sino la realidad misma, o la realidad cognoscible” (p. 144) el mundo para Black siempre es comprendido desde una perspectiva que provee una forma particular de conocer la realidad. De este modo su postura epistemológica y ontológica es nominalista y perspectivista9. Debido a su capacidad creativa, la metáfora cumple una fuerte función cognoscitiva al permitir obtener penetración intelectual y conocimiento que no es posible por medio del lenguaje literal ni por comparaciones, ya que las similitudes y analogías que establece la metáfora son en parte creadas y en parte descubiertas. Más cuando se suprime la metáfora de la ciencia dichas semejanzas se dejan de percibir, o, para decirlo con palabras de George Steiner: “lo que no se nombra no existe”. A partir del análisis funcional de la metáfora desde la teoría interaccionista de Max Black se defendió su valor cognitivo, inquisitivo y creativo, y se reconoció la autonomía del significado metafórico de los significados literales de las palabras que componen la frase. Sin embargo queda precisar las funciones de la metáfora en la ciencia, para ello se examina la propuesta de la Mary Hesse, filósofa de la ciencia que reviso y critico la primera versión de la teoría de Black con el fin de precisar las funciones y compromisos de la metáfora en el contexto de la ciencia que permitan diferenciarla de otro tipo de metáforas como las literarias o las religiosas, y además la usa para poder sugerir otro modelo de explicación científica Hesse (1966), al igual que Black (1962), piensa que el modelo deductivo de la explicación científica presenta una serie de problemas, en especial el modelo nomológico- deductivo de Hempel y Oppenheim10, pues supone que el lenguaje del explanandum, es decir, lo que se quiere explicar, tiene una relación de isomorfia entre el significado y la realidad, que es 46 invariable, y además puede ser completamente deducido de las leyes del explanans. Para Hesse, el modelo deductivo de la explicación científica puede ser complementado por la teoría interaccionista de la metáfora, de tal modo que se considere a la explicación científica como la redescripción metafórica del explanandum. Hesse (1966) parte de la teoría interaccionista de Black y reconoce que la metáfora tiene valor cognitivo. Redefine a los asuntos de la versión de Black, al asunto primario lo identifica como el explanandum, el cual es un sistema de enunciados describibles en lenguaje observacional no problemáticos, y que requiere ser explicado, mientras el sistema secundario está constituido por un lenguaje observacional o teórico proveniente de una teoría más familiar. Ambos sistemas están conformados por ideas asociadas y creencias compartidas por una comunidad lingüística. La metáfora consiste en usar el lenguaje del sistema secundario y trasladar sus ideas e implicaciones asociadas para describir al sistema primario o explanandum; de ese modo se seleccionan y suprimen características del primero, que es visto y organizado a través del segundo, lo cual permite apreciar nuevas implicaciones. Y lo mismo aplica de manera inversa: ver al segundo sistema a través del lenguaje asociado al primero. De ese modo ambos sistemas interactúan y permiten el cambio de significado de sus ideas asociadas. A partir de le teoría de interaccionista revisada, la descripción del explanandum deja de entendida como empíricamente invariante a los cambios de la teoría que lo explica, ya que el funcionamiento de la metáfora permite su redescripción, con lo cual se amplía su significado y varía en consecuencia la extensión de su referencia. Hesse advierte una importante consecuencia a partir de su lectura, y por la cual critica a Black: mantener la división Aristotélica entre el lenguaje literal y el metafórico, dice: The interaction view sees the language as dynamic: an expression initially metaphoric may become literal (a ‘dead’ metaphor) and what is literal may become metaphoric. (…) What is important is not to try to draw a line between the metaphoric and the literal, but rather to trace out various mechanisms of meaning-shift and their interaction (Hesse, 1966, p. 166) Hesse adopta un enfoque novedosamente diacrónico del lenguaje científico, en el que todo el lenguaje literal sería un caso límite del metafórico, el cual se objetiva por el acuerdo intersubjetivo de la comunidad lingüística que lo comparte. Por ello el lenguaje aparentemente 47 observacional que compone al explanandum está en continua expansión por medio de la redescripción metafórica. Lo que la lleva a postular la radical tesis de que todo el lenguaje es metafórico, y a proponer su teoría reticular del significado (network theory of meaning). Para ello Hesse (1988) se apoya en los “parecidos de familia” que Wittgenstein expone en sus Investigaciones Filosóficas11, para describir la formación de categorías normativas y el funcionamiento de la metáfora. De acuerdo a Hesse la teoría de los universales de Aristóteles sostiene que al predicar una propiedad, llamémosla P, a un objeto supone la objetividad universal de tal cualidad, lo cual implica comprometerse con una descripción esencialista de los objetos. Para evitar esto, Hesse utiliza los parecidos de familia para describir la predicación de la misma propiedad P sin asumir ningún universal. A partir de los parecidos de familia los miembros de la clase F se parecen en el aspecto relevante para P, de modo que los casos de los miembros a los que se predica P y que conforman la clase F son relativamente claros. Bajo este esquema el cambio de significado en los predicados de la clase F son para Hesse (1988) como los cambios de significado que se producen por la metáfora, ya que ambos son dependientes de similitudes y diferencias de algunos aspectos captados por analogía. Dado que las extensiones de significado se producen todo el tiempo en la red sistémica del lenguaje, para la filósofa inglesa todo el lenguaje es metafórico, porque el mismo proceso semántico que participa en la conformación de categorías normativas que permite tener significados más o menos estables en todo el lenguaje, también faculta el cambio y creación de nuevos significados. Al usar como herramienta conceptual los parecidos de familia, Hesse reinterpreta el proceso de asignación y cambio de significados en el lenguaje, afirmando que el significado metafórico no es desviado, sino es más bien el que permite la conformación de los significado del lenguaje, de ahí su conclusión de que todo el lenguaje es metafórico. En consecuencia la metáfora, lejos de ser una desviación del uso propio de las palabras como se venía sosteniendo desde Aristóteles, es una operación constante en el lenguaje que permite la creación continua de nuevos significados irreductibles a la paráfrasis literal y que permite conformar nuevas categorías por convención, y que cuenta con plena función cognitiva; de tal manera que la distinción entre el lenguaje literal y metafórico es pragmática, pues la base semántica de las palabras es de naturaleza metafórica. Es importante notar que la teoría reticular del significado de Hesse representa una excepción notable dentro de la filosofía de la ciencia empirista, ya que permite discutir la validez 48 de la distinción entre el lenguaje teórico y el lenguaje observacional, que para Hesse (1966) es también de carácter pragmático y no semántico, ni mucho menos ontológico; ya que lo enunciados observacionales son interpretaciones de los eventos dependientes de un marco de asunciones que comparte una comunidad científica. Ésta tesis la acerca a la tradición historicista de la filosofía de la ciencia. Además, el lenguaje al tener una estructura reticular y holista, el cambio en una parte del léxico afecta a la totalidad del lenguaje (Hesse, 1988). A partir de la complementación entre la teoría reticular del lenguaje y la teoría interaccionista de la metáfora, además de criticar la primera versión de la propuesta de Black (1954) por mantener la división entre lenguaje literal y metafórico, Hesse (1988) le señala que suprima de la teoría interaccionista la función de la analogía para evitar identificar a la metáfora con el símil. Ella sostiene que reconocer la participación de la analogía no hace que la metáfora se agote en la enumeración de analogías. La analogía si bien es condición necesaria para el funcionamiento de la metáfora, eso no significa su igualdad ni reducción al símil; pues la metáfora se caracteriza por su capacidad creativa para crear nuevas analogías continuamente. Y es justamente esa capacidad la que faculta a la metáfora para sugerir explicaciones plausibles12. Como sostiene Carl Hausman: “las metáforas quedan empobrecidas cuando se reducen a símiles, porque los símiles se mueven hacia la clausura de las relaciones entre significados superpuestos en la metáfora” (citado en Bustos, 2000, p 15). Tanto para Black (1977) como para Hesse (1988) la metáfora se caracteriza por el poder establecer analogías entre las implicaciones de dos dominios diferentes. La metáfora así entendida tiene un carácter semántico abierto que multiplica las relaciones posibles, mientras que la comparación las angosta y las agota. La capacidad creativa de la metáfora proviene de ser una invitación constante a establecer nuevas relaciones entre los términos, de la cual carece el símil, y de crear nuevos dominios de referencia, al generar un excedente de sentido autónomo del significado literal. La metáfora creativa lleva a aprehender desde un punto de vista diferente aspectos de la realidad que esta ayuda a construir, aumentando así la legibilidad del mundo. Al entender la explicación teorética como la redescripción metafórica del explanandum, Hesse (1966) advierte que la introducción de nuevo vocabulario teórico no es por sí solo explicativo, para ello exige como condición que este permita realizar predicciones empíricas exitosas, las cuales pueden ser correctas o incorrectas. Del mismo modo para Black (1977) es un error evaluar las metáforas de acuerdo a criterios de veracidad, sino que es más apropiado hablar 49 de lo correctas o incorrectas que son. El hacer predicciones a partir de las metáforas permite por un lado garantizar su poder explicativo y por otro tener un criterio por el cual se puede evaluar su plausibilidad. Como bien lo señala Sampieri (2014): “Para Hesse los predicados metafóricos deben ser susceptibles de aceptación y contrastación, no ser sólo maneras insospechadas y novedosas de introducir entidades o de reajustar y describir el mundo, sino también deben ser plausibles” (p. 58). Lo que quiere decir es que las entidades explicativas e hipótesis propuestas a partir de la extensión de significado que faculta la metáfora deben ser contrastadas para ser plausibles dentro de la red teórica, utilizando como criterio de evaluación el que la nueva entidad permita realizar predicciones empíricas exitosas. Así se puede evaluar a una metáfora como correcta o incorrecta, lo cual garantiza los límites del lenguaje científico y preserva la objetividad de la actividad científica. Las metáforas así entendidas se pueden contrastar y de esa manera justificar su función cognitiva, predictiva y explicativa en la ciencia. Por todo lo anterior se entiende a la ciencia como un proceso de redescripción del mundo, como lo señala la propia Mary Hesse: “the continuous adaptation of our language to our continually expanding world, and the metaphor is one of the chief means by which this is accomplished” (1966, p. 176-177). Es decir, el lenguaje que describe al explanandum es continuamente corregido y expandido por la redescripción metafórica, al mismo tiempo que la base empírica se va modificando, lo cual requiere que el lenguaje descriptivo realice ajustes y re- descripciones de la misma. Con ello Hesse (1988) reconoce la interacción entre el individuo y el medio ambiente, en el que el sistema reticular del lenguaje va realizando ajustes aproximados por medio de la redescripción metafórica entre el lenguaje y el mundo, de modo que los significados metafóricos se van volviendo descriptivos por medio del acuerdo intersubjetivo. De acuerdo a Sampieri (2014) la postura de Hesse evita la concepción esencialista y referencialista del lenguaje científico, bajo su tesis de que todo el lenguaje es metafórico y la estructura reticular del lenguaje se inscribe en la tradición nominalista y holista, pero conserva algunos compromisos empíricos para poder mantener la objetividad en las explicaciones científicas. Por lo que Hesse sustenta un realismo moderado y falibilista que según ella permite ir haciendo ajustes aproximados en la red del lenguaje teórico, ya que concibe al lenguaje científico como un ajuste continúo entre lenguaje y el mundo, siendo la metáfora uno de los principales recursos de asignación y extensión del significado. Para Hesse, el lenguaje no describe esencias, sino que opera por el reconocimiento de parecidos y semejanzas por analogía que permiten 50 cambiar significados que por acuerdo se convierten en categorías normativas para conceptualizar el mundo. Este procedimiento de redescripción continua del lenguaje aplicado al explanandum, llevaría a sostener que la base empírica es interpretada por el lenguaje y al mismo tiempo el lenguaje es modificado por los hechos del explanandum. De modo que la descripción empírica del explanandum no describe su esencia, por lo cual la descripción no es invariable, sino que el explanandum está sujeto continuamente a la redescripción, y así se garantiza la base realista falibilista. En resumen la teoría de Hesse sobre a metáfora sostiene un compromiso epistemológico con el realismo moderado y falibilista, pero no con un esencialismo ontológico sobre la relación entre el lenguaje y la realidad. En ese sentido Hesse estaba en contra del fundacionismo epistémico. Como lo dice Goodman en su teoría de la verdad, hay que ser: “ontológicamente realistas pero epistemológicamente nominalistas” (citado en Sampieri, 2014, p. 77). La redescripción metafórica de la base empírica y su continua corrección garantiza la objetividad convencionalista en la ciencia, y al mismo tiempo posibilita la inserción de nuevas categorías explicativas en la red teórica, reguladas por el criterio de contrastación que permita realizar una predicción empírica exitosa. Estas ideas la llevan a tener una postura diacrónica sobre la formación del lenguaje teórico de una teoría y dejar la tesis referencialista del lenguaje y correspondentista de la realidad, sin por ello abandonar su compromiso empirista. Por último, aunque el problema filosófico de la referencia de la frase metafórica es muy importante, su tratamiento conceptual requiere de una considerable extensión que excede los límites del presente trabajo, sin embargo se observa de pasada que de acuerdo a Sampieri (2014) para Hesse la extensión de la referencia metafórica se basa en una semántica de mudos posibles, no entendidos como entidades completamente ficticias, sino que al mantener el realismo moderado, genere redescripciones del mundo empírico entendiéndolo desde otro punto de vista, y así permita ampliar el lenguaje teórico hasta poder dar cuenta de otras posibilidades de existencia de la base empírica. Los mundos posibles son la posibilidad de que un acontecimiento suceda de un modo predicho por la metáfora, que de ser exitosa le provea de plausibilidad a la referencia metafórica. De este modo la metáfora vincula lo ya aceptado y lo que es un estado posible por medio del pensamiento analógico generando así una apertura explicativa y predictiva en las teorías. En este sentido la metáfora genera los vasos comunicantes entre la realidad y la posibilidad13. 51 1.3.3 Teorías Pragmáticas Aunque las teorías semánticas e interaccionista de Back y Hesse son las que consideramos en la presente investigación las mejores para explicar las funciones de la metáfora en la ciencia, y las que usaremos para realizar justificar el traslado de los conceptos de la cibernética y de la teoría de la información al modelo clínico del BTC (4.3); resulta útil advertir otras teorías que también la ha estudiado filosóficamente desde el enfoque pragmático. Las teorías pragmáticas niegan que haya un significado metafórico adicional al significado literal de la oración, pues las frases sólo tienen los significados léxicos de las palabras. Lo que la metáfora hace es sugerir comparaciones resultado del uso que le da el hablante o el oyente a la frase metafórica; y dado que no existe el significado metafórico, tampoco tienen contenido cognitivo. Desde la versión pragmática, John Searle (1979) considera que las teorías semánticas de la metáfora tanto comparativas como interaccionistas son inadecuadas para explicar su funcionamiento ya que no hay implicado ningún mecanismo semántico particular que produzca un cambio de significado en la oración metafórica. Por medio de contraejemplos demuestra que ambas propuestas tienen puntos débiles. En el caso de la teoría comparativa sostiene que hay metáforas que no expresan una semejanza subyacente, y aun cuando hay dicha semejanza, esta no es esencial para las metáforas, pues en realidad los enunciados de semejanza y los de significado metafórico tienen diferentes condiciones de verdad. Por ello les reprocha la tesis de que la comparación por medio de enunciados de semejanza participe en la composición del significado de la oración metafórica; para él la semejanza sólo ayuda a la comprensión de las metáforas. Mientras que de la teoría interaccionista cuestiona si todas las metáforas tienen el marco y el foco dado que algunas sólo pueden estar compuestas de elementos metafóricos. Además piensa que no es claro como estos elementos entran en interacción14. De cualquier modo ambas teorías fallan por no distinguir entre lo que Searle identifica como el significado del hablante (speaker’s utterance meaning) y el significado literal de la oración (sentence meaning), el primero es el significado que le da el hablante a una oración al usarla, mientras el segundo lo que las oraciones significan literalmente. Él sostiene que no hay un par de significados, uno el literal y otro el metafórico, sino que las oraciones sólo tienen un significado que es el literal. Por lo que el significado metafórico nunca es el significado de la oración, es decir, no es semántico, y sin embargo siempre es el producto del significado 52 proferencial del hablante. Por lo cual una teoría que explique el funcionamiento de la metáfora debe formar parte de una teoría de la comunicación que esclarezca cómo es posible que una oración con su significado léxico diga algo más o diferente al mismo durante la comunicación entre dos personas. Dicha teoría debe dar cuenta de los principios que regulan la relación entre el significado del hablante y el literal para producir un significado en la oración metafórica, y así dilucide cómo el oyente interpreta y comprende el significado del hablante diferente al significado literal, y cómo el hablante formula un enunciado metafórico. De este modo Searle vuelve a la metáfora un problema de uso del significado literal, cuya respuesta excluye una modificación al nivel semántico de la oración. Bajo este contexto, cuando el significado de la oración (S) y el significado del hablante (T) coinciden se considera que es una oración literal (S = T)15. Mientras en la oración metafórica el significado del hablante es diferente al significado de la oración (S ≠ T), por la intención del hablante de significar algo más de lo que significa literalmente. Searle explica que cuando alguien quiere expresar una metáfora y usa la expresión (utter) S es P, pero quiere significar (means) S es R, de modo que el predicado P tiene su significado literal y es diferente que el significado de R, y el predicado de la oración S es R significa metafóricamente por ser el significado del hablante; el oyente necesita un conocimiento mayor que el de las reglas de lenguaje para interpretar que S es R a partir de S es P, y además atribuirle intención al hablante para interpretar su oración por medio del principio de caridad interpretativa, el cual atribuye al hablante una acción comunicativa racional. La pregunta que busca responder Searle entonces es: ¿Cómo es posible que el hablante pronuncie S es P y signifique y comunique que S es R? Para responder a tal pregunta hace falta una teoría de la interpretación metafórica que explicite cuales son los principios que comparten el hablante y el auditorio para darle un sentido metafórico a las oraciones. En primer lugar el oyente tiene que identificar si tiene que buscar o no una interpretación diferente a la normal. En caso de necesitarla por la evidente falsedad de una oración: S es P entonces precisa de recurrir a una serie de estrategias para interpretarla metafóricamente como S es R. Por lo que el oyente se ve obligado a buscar significados alternativos de la siguiente manera: 53 When you hear ‘S is P’ to find possible values of R look for ways in which S might be like P, and to fill in the respect in which S might be like P, look for salient, well known, and distinctive features of P things (Searle, 1979, p. 103) El oyente debe buscar los valores de R y encontrar aquellos en que S puede ser como P: R1, R2, R3, R4, Rn. Después de ese rango indefinido de valores posibles de R el oyente debe restringir y seleccionar aquellas características que sean relevantes parecidas a S; al final el oyente debe usar lo que sabe de S y P para escoger los valores de R que son más plausibles para asignar significado metafórico a la proferencia dependiendo del contexto comunicativo en que sea dicha. Por último, Searle distingue entre un enunciado metafórico simple y otro abierto (open ended); mientras el primero el significado alternativo de R es único, en el segundo el rango de los valores de R es indefinido. Pero ambos significados pasan necesariamente a través del significado literal de S es P. A partir de su propuesta Searle considera que no es posible parafrasear las oraciones metafóricas pues la paráfrasis no puede reproducir el contenido semántico que tiene el oyente en su comprensión, y que está al margen del contenido semántico del significado léxico de la oración. Es por ello que Donald Davidson (1978) crítica a Searle porque a pesar de que este niegue que exista un significado metafórico producido por un mecanismo semántico sugiere que exista a nivel proferencial, aceptando con ello que existe un significado metafórico y que haya una dualidad de sentidos en las oraciones. Su radical propuesta no busca resolver el problema de la metáfora, sino disolverlo, esto es que, en lugar de problematizar y proponer una teoría de la referencia metafórica, él niega que exista tal problema porque no hay ninguna referencia para la oración metafórica justificable. Davidson piensa que ha sido errada la manera de explicar la metáfora por todos los demás estudiosos desde Aristóteles hasta Black, debido a que niega la tesis que haya algo llamado “extensión del significado” metafórico. Davidson sostiene que las metáforas no dicen nada más allá de lo que dicen las palabras literales que la componen, por lo que lo que las palabras ordinariamente signifiquen será lo único que podrá ser expresado en la metáfora, no más. Para Davidson no hay cambio de significado en la operación metafórica ya que lo que diga esta tiene que estar necesariamente basado en el significado literal de las palabras. Por ello la veracidad de una frase metafórica no se evalúa más que atendiendo a los criterios que se utilizan para evaluar las frases literales y es 54 por eso que la metáfora semánticamente dice siempre una mentira o lo mismo que una mentira. Mientras que el símil si puede tener valor de verdad. Con esto niega cualquier esfuerzo por justificar la autonomía del significado metafórico de alguna frase o que exista alguna verdad metafórica, de ahí que no haya necesidad de hacer la paráfrasis literal de la metáfora. ¿De dónde viene entonces la cualidad novedosa que distingue a la metáfora? De su uso en el contexto de escucha. Para este filosofo la metáfora resulta explicable no por un efecto semántico especial, sino por la forma en que opera en el dialogo entre dos personas. Por ello a su postura se le llama pragmática pues entiende al significado en relación al contexto de su uso. De hecho, para Davidson, dado que Wittgenstein cancela la posibilidad del lenguaje privado y que más bien el lenguaje sólo puede comunicarse con los demás, la verdad objetiva es resultado de la comunicación interpersonal, es decir, por medio de la comunicación se consensua el uso apropiado, literal y fijo de las palabras, y con ello la objetividad de su significado (Conesa, & Nubiola, 1999). Por lo cual las sugerencias de la metáfora también se establecen por acuerdo, y no requiere de acudir a una teoría semántica para justificar ningún significado metafórico. La metáfora es pues un resultado interpretativo de un acto del habla. El éxito de la metáfora se da entre la interacción de dos comunicantes, más no por un cambio en el significado de las palabras. Por lo que Davidson subordina la semántica a la pragmática y suprime cualquier significado metafórico al significado literal. La metáfora solo invita a ver las cosas en términos de otras, a establecer comparaciones, pero no dice cómo es que en realidad son esas cosas, es por ello que al no tener referencia ni significado propio, no tiene valor cognitivo ni epistémico. A pesar de lo dicho, Davidson reconoce que la metáfora es un recurso legítimo en la filosofía y en la ciencia pero niega categóricamente que haya dualidad de sentido en las oraciones metafóricas, para él sólo existe el significado literal. Las diferencias entre el enfoque semántico y el pragmático son claras, si bien para Davidson todos los significados de las palabras que componen al lenguaje son literales, para Hesse todo el lenguaje es metafórico. Las teorías pragmáticas presentan dos problemas, en primer lugar no pueden responder a cómo es se identifica y funciona una metáfora en contextos interaccionales donde no hay señales metacomunicativas como en el discurso escrito (Black, 1954). En segundo lugar no responden en cómo es que exactamente se asigna un significado que no es el semántico en la interacción comunicativa, es decir, no precisan cuál es ese mecanismo 55 extra lingüístico que explique cómo es que se interpreta la metáfora en una conversación en curso. Black le responde a Davidson y realiza un examen sistemático de su artículo haciendo notar que Davidson reduce a la metáfora al enfoque comparativo por decir que el significado metafórico se limita al significado literal de las palabras, y que su examen no da cuenta de las metáforas fuertes, dice: Thus I have said in the past that the producer of such a metaphor "is employing conventional means to produce a nonstandard effect, while using only the standard syntactic and semantic resources of his speech community. Yet the meaning of an interesting metaphor is typically new or 'creative', not inferable from the standard lexicon (Black, 1979, p.140) Lo importante para Black es dar una teoría que explique como una metáfora puede dar un nuevo significado no reductible al significado literal de las partes de la frase. La diferencia entre Black y Davidson es que mientras el primero afirma que si hay un cambio de significado en la frase metafórica; el segundo niega que el significado vaya más allá del significado literal de las palabras de la frase. La ventaja de la propuesta de Black es que permite comprender como funciona la metáfora independientemente del contexto de su uso y del significado proferencial, lo cual permite su estudio en el dominio textual del discurso. Además de que Black nunca niega la participación de los significados literales en la metáfora, sino más bien afirma que la oración metafórica necesita de estos para la construcción del significado metafórico por medio del principio de interacción semántica entre los asuntos de la frase metafórica. Es interesante notar como tanto Davidson como Hesse dan una lectura particular sobre la negación del lenguaje privado que propone el segundo Wittgenstein dentro de sus teorías sobre el lenguaje. Para ambos el lenguaje se objetiva y adquiere su carácter literal al convencionalizarse por medio del acuerdo intersubjetivo de una comunidad lingüística; la diferencia está en que para Davidson una vez acordado el lenguaje permanece de ese modo fijando su referencia, mientras que para Hesse la formación de categorías normativas por convención es a posteriori de la continua redescripción metafórica de cualquier lenguaje descriptivo. En la teoría de Davidson se presenta el problema de que no explica cómo es que se genera el significado literal de las palabras del lenguaje, los significados tendrían que ser dados desde el inicio a cada palabra, con 56 lo cual se niega que se hayan dado por acuerdo intersubjetivo, y por tanto la tesis de la objetividad del lenguaje literal basada en convenciones se volvería insostenible. Por otro lado no se podría explicar cómo es que las categorías convencionales pueden nombrar nuevas cosas como lo exige cualquier lenguaje, y en consecuencia ampliar el conocimiento, dando la imagen de un lenguaje petrificado. Pues como bien advierte Black (1977) el lenguaje literal es insuficiente para expresar las correspondencias y analogías entre las cosas, por lo que los limites conceptuales del lenguaje no son rígidos. A estas objeciones responde la teoría del sistema reticular del lenguaje de Hesse, para la cual la base semántica de todo el lenguaje, incluyendo al literal, es metafórica; el lenguaje literal sería efectivamente producto del acuerdo intersubjetivo por medio del intercambio comunicativo que permite el lenguaje, pero lejos de quedarse fijado para siempre, la continua redescripción metafórica por medio del reconocimiento de semejanzas cambia el significado y así permiten la formación de nuevos conceptos. Al final con la teoría interaccionista de Black y Hesse la metáfora logra autonomía e irreductibilidad en dos sentidos. Primero, “Autonomía porque el significado de la metáfora es independiente de las acepciones literales de sus elementos componentes, e irreductibilidad en cuanto que el significado metafórico es intraducible a paráfrasis literales.” (Bustos, 2000, p.54). La irreductibilidad del significado metafórico a los significados literales que componen la frase le provee de contenido cognitivo autónomo. Y segundo porque el funcionamiento de la metáfora que permite inaugurar implicaciones y relaciones entre dos dominios por medio del establecimiento de analogías en la que se cifra su capacidad creativa también la hace irreductible al símil, en el que la comparación que media entre dos términos es evidente; mientras que en la metáfora, al mantener implícita dicha semejanza, exige la participación creativa del lector a buscar las familiaridades insospechadas entre los dos asuntos que componen la frase metafórica y el sistema de significados asociados a ambos asuntos, o, en el mejor de los casos a crearlas, seleccionando propiedades del asunto secundario y predicándolas al primario de manera insospechada. Por lo que las asociaciones potenciales entre los términos se amplían, y pueden producirse nuevas implicaciones y relaciones entre estos, produciendo nuevos sentidos. La interacción por analogía no agota las relaciones, sino que las anima, de modo que la metáfora siempre está abierta semánticamente a una lectura que inaugure relaciones inéditas entre dos dominios de la realidad. La metáfora funciona como una provocación al pensamiento para ver lo semejante entre lo desemejante, manteniendo en tensión creativa al pensamiento y al lenguaje. 57 1.3.4 Metáfora y Modelo El uso de modelos como parte de la actividad científica no es del todo claro, ya que generalmente se le utiliza con equivoco como remplazo o sinónimo de teoría. En este apartado se examina la naturaleza de la relación entre la metáfora y los modelos teoréticos para reivindicar las funciones que tienen ambos instrumentos cognitivos en la lógica de la investigación científica. Para ello se discuten las tesis de Black y Hesse, quienes además defender las funciones de la metáfora en la actividad científica, establecen la relación entre la metáfora y los modelos, los cuales funcionan por medio de la analogía. Ambos filósofos notaron que quienes califican a la metáfora como ornato suelen entender el uso de modelos en ciencia como artificios de poca seriedad teórica o sólo con valor heurístico, por lo que deciden hacen un reexamen del valor de los modelos al reivindicar su poder explicativo. Como advertimos al inicio de esta sección la introducción de la distinción entre los contextos de descubrimiento y de justificación serviría para mostrar las funciones heurísticas de la metáfora en la ciencia, y al mismo tiempo demostrar que los procesos heurísticos tienen valor epistémico pues también constituyen parte del proceso de construcción del conocimiento científico: la metáfora al sugerir patrones de investigación, orienta la dirección de la empresa científica y supone la aceptación de un conjunto de compromisos cognitivos. Ahora defenderemos la función de la metáfora en el contexto de justificación como conformadora de modelos teóricos. Ya que hay filósofos que piensan que la metáfora es útil para las primeras fases de la investigación heurísticamente, pero que son prescindibles cuando una ciencia desarrolla un lenguaje matematizado al concluir su proceso de metrización. Por ello se busca señalar la relación entre la metáfora y de los modelos, y argumentar cuales son las funciones de los modelos en la producción de conocimiento científico en el contexto de justificación. A partir de su primer análisis sobre la metáfora, Max Black (1954, 1977) reconoce que ésta tiene valor cognitivo, inquisitivo y creativo en todos los campos en donde es utilizada; sin embargo, al no precisar su función dentro de la actividad científica pasa a proponer la relación entre la metáfora y los modelos científicos. Para Black (1962) los modelos, al igual que las metáforas, tienen valor cognitivo, y para demostrarlo sigue un desarrollo argumentativo análogo al de su exposición de la metáfora distinguiendo entre tres tipos de modelos: modelos a escala, modelos analógicos y modelos teoréticos. 58 Los modelos a escala son todos aquellos imitan y representan cosas reales o imaginarias, destacando algunas de las propiedades relevantes de éstas y obviando las irrelevantes; con el modelo se intenta hacer que se parezca al original en las características seleccionadas y de conservar las proporciones relativas entre las magnitudes relevantes con el fin de hacer manejable y visible lo que se desea comprender, pero dado que la similitud es parcial y asimétrica, es decir, si A es modelo de B, B no puede ser modelo de A, y a las distorsiones introducidas en el modelo, no es posible hacer un modelo a escala fiel que permita sacar inferencias precisas a partir del modelo sobre el original, por lo que estas son precarias y necesitan validación y corrección suplementaria. El modelo a escala del sistema solar, de la torre Eiffel, o la reproducción de experimentos a escala son ejemplos de estos modelos. Los modelos analógicos son aquellos en lo que se reproduce la estructura o red de relaciones del original en un medio diferente. A diferencia del modelo a escala donde se busca imitar al original en términos de sus proporciones, en el modelo analógico se busca reproducir la estructura o configuración de relaciones del original, por lo que el principio del modelo es el isomorfismo. Por medio de reglas de interpretación se hacen inferencias a partir de las características relevantes del modelo, pero dado que la configuración de relaciones se puede corporizar en muchos medios diferentes se corre el riego de realizar falacias al momento de hacer inferencias a partir del modelo, por ello para Black los modelos analógicos ofrecen hipótesis, más no demostraciones16. A partir del funcionamiento de la metáfora descrito en la teoría interaccionista revisada, se sostuvo que las metáforas funcionan por medio del isomorfismo entre los complejos implicativos de los asuntos principal y secundario, y dado que el funcionamiento de los modelos analógicos es también por el isomorfismo estructural entre el original y el modelo, para Black (1977) el asunto secundario es un modelo análogo, por lo que considera que en cada metáfora aguarda un modelo sumergido. De acuerdo a Black (1962) los modelos que son útiles para la investigación científica son los teoréticos, pues permiten hacer inferencias y dar explicaciones causales de algo que se desea explicar al introducir el lenguaje perteneciente de un domino bien conocido en otro dominio que se desea conocer a través una analogía subyacente. Antes de explicar el funcionamiento de los modelos teoréticos conviene reconocer que para Black su uso exige asumir un compromiso ontológico, ya que sin esté los modelos sólo parecen ser ficciones heurísticas sin poder 59 explicativo, pero cuando se acepta se pueden hacer enunciados existenciales que permitan postular explicaciones. El poder explicativo requiere del compromiso ontológico para no sólo ser heurístico. Se puede hacer uso de los modelos teóricos de manera existencial o ficticia, es decir, en los primeros se describen a las entidades como materiales reales, mientras en los segundos no, Black establece una serie de condiciones para el uso de los modelos teoréticos. 1) un campo de investigación donde estén reconocidos ciertos hechos o regularidades que se deseen explicar, a este se le puede llamar dominio primario. 2) después se describen las entidades de un dominio menos problemático, más familiar y mejor organizado conocido como dominio secundario. 3) por medio de reglas de correlación se trasladan los enunciados del dominio secundario a enunciados correspondientes al dominio primario. 4) Por medio de reglas de correlación las inferencias del dominio secundario se trasladan y se contrastan frente a los datos del dominio primario. El funcionamiento del modelo teorético que describe Black es análogo al de la metáfora, por ello sostiene que los modelos son una metáfora sostenida y sistemática, en sus palabras: “Use theoretical models resembles the use of metaphors in requiring analogical transfer of a vocabulary. Metaphor and model-making reveal new relationships; both are attempts to pour new content into old bottles” (Black, 1962, p. 238-239). Ambas operaciones se componen de dos asuntos o dominios; se toma uno de ellos mejor conocido para conocer otro que se pretende conocer; por medio de la estructura isomorfica que se presume comparten ambos dominios se pueden establecer analogías entre ellos; y del mismo modo en que una metáfora ayuda a penetrar intelectualmente en el foco de la frase, así el modelo sirve como instrumento especulativo para conocer el dominio original, al poner en relación cognoscitiva, por medio de la transferencia de lenguaje analógico, el dominio primario con el secundario, permitiendo establecer nuevas relaciones e implicaciones. De esta manera se busca sacar inferencias y hacer predicciones sobre los datos del dominio primario, de tal modo que los progresos del dominio secundario permitan tratar al dominio primario como algo menos problemático. La única diferencia para Black entre las metáforas y los modelos es que mientras las primeras funcionan por medio del sistema de ideas asociadas comunes del asunto secundario, los modelos requieren él dominio del lenguaje de la teoría científica mejor asentada del dominio secundario; entre más implicaciones, preguntas e hipótesis experimentalmente fértiles sobre el dominio primario faculte el modelo más prometedor será éste. 60 Turbayne (1970) sigue a Black en la idea de que un modelo es una metáfora “extendida” en el sentido de que a partir de una metáfora fecunda –o más- se puede construir una serie de asociaciones para estudiar un campo de interés de una nueva manera, y amplía la simetría explicativa que existe entre el dominio primario y el secundario. Mantiene que es provechoso el uso de modelos tanto para la materia modelada como para la del modelo pues además de que posibilita conocer de manera innovadora lo que se desea estudiar, permite plantear preguntas inéditas en campo secundario a través de los resultados de dominio modelado, e incluso podría sugerir hipótesis y respuestas para el dominio original. De modo que ambos dominios se ven beneficiados por el uso del lenguaje analógico, al aumentar las correspondencias y posibilidades de relación entre ellos se posibilita que de su comercio de ideas se obtengan resultados que favorezcan aumentar el conocimiento de ambos. Black (1962) advierte que quienes tienen una noción de la teoría científica como un sistema deductivo compuesto por fórmulas matemáticas como el físico francés Pierre Duhem, tienden a considerar a los modelos del mismo modo que a las metáforas: como instrumentos cuya función es heurística a inicios de la investigación, pero prescindibles en los estados maduros y que pueden ser reemplazados por fórmulas matemáticas. Sin embargo, así como en la metáfora los significados extendidos producto de la interacción entre los asuntos no pueden ser parafraseados, ya que permiten ver al asunto principal de una nueva manera, los modelos son instrumentos especulativos que por medio de la trasferencia de implicaciones permiten ver nuevas conexiones invisibles de otro modo. Además, el isomorfismo entre ambos dominios garantiza la base racional y la validez del uso de modelos en la investigación científica. La identidad de estructura isomorfica entre los dominios legitima la transferencia analógica de vocabulario y faculta las inferencias que se hagan de un dominio hacia el otro para conocer al dominio primario. La supresión de los modelos teoréticos en la ciencia significaría despedirse también de la riqueza de implicaciones que estos permiten y de las hipótesis que pueden sugerir. Los modelos permiten conocer conceptualmente una materia, por tanto es innegable su valor como instrumento cognitivo de investigación y su capacidad irremplazable de ampliar las posibilidades de explicación en la investigación científica. Mary Hesse (1966) comparte con Black la idea de que los modelos no sólo son artificios mnemotécnicos o heurísticos que si bien ayudan al descubrimiento, pueden ser desechados 61 cuando cumplen su función como cree Duhem, sino que más bien son esenciales en la estructura lógica de las teorías para que estas puedan hacer predicciones empíricas. La explicación del modelo que propone Hesse está sumamente emparentada con su caracterización de la metáfora, el modelo también está pensado como complemento a la teoría deductiva de la explicación científica para hacerla más sofisticada. El modelo tiene dos dominios, uno llamado explicandum que es el conjunto de enunciados observacionales que describen lo que se quiere explicar, y el otro dominio está compuesto por enunciados teóricos u observacionales que son mejor conocidos. Entre algunas de las propiedades de ambos dominios se establecen una serie de analogías por las que funciona el modelo y que permiten conocer lo nuevo por lo familiar17. Hesse (1966) identifica tres tipos de analogías: negativa, positiva, y neutral. Las analogías negativas son aquellas propiedades que no comparten ambos dominios; las positivas son aquellas propiedades que se sabe que tiene el dominio modelo y se quieren atribuir al dominio a conocer; y las neutras son aquellas propiedades que tiene el dominio modelo pero aunque no se sabe si son positivas o negativas, aunque se espera que las tenga el dominio a conocer para poder hacer nuevas predicciones sobre él por medio de las analogías neutrales. El modelo usa las analogías positivas y neutrales para construir correspondencias uno-a-uno entre las propiedades observables del explicandum y las del otro dominio, seleccionado aquellas que son relevantes para la proyección priorizando aquellas características que son más esenciales o útiles. Por medio de esas correspondencias se proyecta la estructura relacional y causal del dominio que sirve como modelo para configurar al explicandum. Sin embargo, las analogías neutrales son las importantes en este mecanismo pues son las que permiten aventurar predicciones y sugerir hipótesis y explicaciones plausibles sobre el comportamiento del dominio que se quiere conocer. En la figura 3 se explica cómo funciona el modelo para Hesse (1966). A partir del conjunto de propiedades P del dominio o sistema modelo X, se establecen una serie de analogías con el conjunto de propiedades observables Q del explicandum Y; el modelo funciona omitiendo las analogías negativas: X1, X2, X7, y usando las analogías positivas: X3, X4, X6, X8, y neutrales: X5, para construir una serie de correspondencias uno-a-uno entre X y Y: X3', X4', X5', X6', X8'. La isomorfia estructural de que se espera comparten ambos dominios permite la transferencia de vocabulario como lo hizo notar Black (1962). 62 Figura 3. Funcionamiento del modelo teórico Hesse (1966). A partir del funcionamiento del modelo, las analogías neutras (X5´) permiten postular hipótesis y predicciones empíricas sobre el dominio que se quiere conocer, y además postular entidades explicativas plausibles (α), tal como lo define Sampieri: Para Hesse un modelo es la representación de una nueva entidad relacionada y explicada a través de leyes y entidades familiares; en este sentido es la proyección de propiedades, relaciones y funciones desde un sistema conocido a uno desconocido con miras a su comprensión. En esta proyección habrá similitudes compartidas positivas, negativas y desconocidas (neutras). Son estas últimas las que incentivan la dinámica explicativa de una teoría dando lugar a predicciones sobre posibles comportamientos del nuevo sistema y a la postulación de nuevas entidades explicativas plausibles (2014, p. 84) Para Sampieri en el modelo las analogías además de poner en relación elementos y propiedades, proyectan sobre el dominio a conocer procesos, leyes, y relaciones causales que lo dotan de estructura y que permiten hacer predicciones sobre el funcionamiento del mismo. Además facultan la introducción de hipótesis y entidades explicativas plausibles en una teoría. Explicandum: Y (Conjunto de propiedades Q) X3' X4' X5' (α) X6' X8' Dominio modelo: X: (Conjunto de propiedades P) X1(-) X2(-) X3(+) X4(+) X5(/) X6(+) X7(-) X8(+) Xn 63 Como también advierte Sampieri (2014), en Hesse las metáforas y los modelos funcionan por medio de las analogías establecidas entre un dominio mejor conocido y otro que se quiere conocer, son éstas las que permiten realizar hipótesis sobre la dinámica del último. La analogía neutra hace que el modelo, al igual que la metáfora, tenga un carácter creativo que faculta la postulación de entidades explicativas plausibles y con ello la introducción de nuevo vocabulario teórico en la teoría. Por lo cual sería más conveniente pensar en el modelo como un uso extendido y sistemático del pensamiento metafórico, ambos justificados por el pensamiento analógico, el cual permite comprender un sistema menos conocido a través de otro mejor conocido. Pero el modelo, además de poner en interacción elementos y propiedades, involucra también la proyección de relaciones cáusales, leyes y procesos entre sistemas; lo cual permite poder hacer predicciones empíricas e hipótesis sobre las relaciones causales entre las entidades, y así describir el funcionamiento del explicandum. A partir de su propuesta Hesse (1966) justifica que los modelos son esenciales en las teorías científicas al permitir realizar nuevas predicciones empíricas sobre la dinámica del sistema modelado; ahora bien, esas predicciones pueden ser correctas o incorrectas, pero el modelo cumple con su función predictiva, la cual permite evaluar la validez en una teoría. De ahí que las predicciones del modelo sirvan para poner a prueba la teoría, ya sea para corroborarla o para refutarla. Además, al seguir las predicciones que sugiere el modelo y ponerlas a prueba por medio de la experimentación se puede reconocer su viabilidad y fertilidad. Si la predicción es incorrecta se puede concluir que el modelo es incorrecto, pero si es correcta puede llegar a sugerir una teoría. De no ser útil su estudio no resulta del todo inútil el esfuerzo, pues saber cuál no es el camino es tan importante como descubrir uno correcto. Sin embargo renunciar a la posibilidad de probar las vías de investigación que sugieren los modelos, es renunciar también a la posibilidad de realizar algún progreso. En el mismo sentido, la postulación de nuevo vocabulario teórico explicativo y predictivo como las entidades explicativas plausibles en una teoría por medio de las metáforas y los modelos no significa su aceptación inmediata, ya que debe ser seguida por su contrastación, manteniendo de ese modo el compromiso de Hesse con el realismo moderado y falibilista. Las predicciones pueden ser adecuadas o no, como cualquier otra hipótesis, y es justo la posibilidad de ser contrastadas lo que las ubica dentro del contexto de justificación y aseguran su legitimidad dentro de la actividad científica. 64 Además, el modelo al comunicarse dentro de la comunidad científica permite que otros teóricos puedan desarrollar sus implicaciones, y evaluar las entidades explicativas plausibles propuestas a partir del modelo para aceptarlas por acuerdo intersubjetivo. El reconocimiento de las funciones de las metáforas y los modelos nos vendría a indicar un modo no convencional de introducir conceptos en las teorías científicas, y a señalar que estas no son conglomerados acabados y cerrados de creencias en las que la referencia de cada concepto queda fijada de una vez y para siempre, sino que más bien son sistemas abiertos e inconclusos sujetos continuamente a cambios por la redescripción metafórica y cuyos límites conceptuales van modificándose permanentemente. De esta manera se encuentra coherencia entre la teoría reticular del lenguaje y el desarrollo del sistema conceptual de una teoría que formula Hesse, ya que modo que la teoría a la par que el lenguaje va extendiéndose continuamente por la necesidad de explicar nuevos fenómenos, por lo que está en continuo proceso de construcción. Lo que haría ver la actividad científica como el constante ajuste entre la experiencia y los conceptos que utilizamos para describirla tal como sostenía Hesse (1988). Esto viene a responder a la crítica de que las metáforas son suposiciones o sugerencias temporales, sólo pertinentes en los estados inmaduros de la investigación, y por tanto prescindibles cuando la teoría está acabada. Ya que no hay posibilidad de reconocer cuando una teoría está madura si aceptamos que su sistema conceptual se está transformando y articulando continuamente. La historia de la ciencia demuestra que aun las certezas científicas más confiables han sido remplazadas por otras que son consideradas más adecuadas. Por lo que las metáforas son postuladas por necesidad teórica como genuinas entidades explicativas, y que al ser plausibles progresivamente pasan a formar parte del universo ontológico de la teoría. Estas ideas llevan a concebir a los conceptos teóricos como entidades sujetas a desarrollo histórico cuya referencia no es fija, y a la ciencia como una actividad diacrónica y dinámica que parte de lo aceptado a lo posible por medio de la metáfora (Sampieri, 2014). Por todo lo anterior, la propuesta de Hesse logra reconocer, “la importancia cognitiva de las metáforas científicas, tanto en el contexto de descubrimiento (en cuanto instrumentos heurísticos) como en el de justificación (predicción y contrastación).” (Bustos, 2000, p. 12). La participación de la metáfora en la lógica de la investigación científica no puede reducirse al sus funciones heurísticas, sino que además participa en el contexto de justificación al facultar la postulación de predicciones empíricas por medio de los modelos teóricos. 65 Capítulo 2. Desarrollo Histórico-Conceptual de la Cibernética A partir del análisis conceptual de la metáfora desplegado en el primer capítulo se reconoció, siguiendo las tesis propuestas de Black y Hesse, que las principales funciones de la metáfora en la investigación científica son introducir conceptos plausibles en un sistema teórico y la configuración de modelos teóricos a partir de una o más metáforas, en base en esto se propone realizar la justificación teórica del traslado de los conceptos de la cibernética y la teoría de la información en forma de metáforas al modelo de terapia breve del BTC. Para ello en este segundo capítulo desarrolla la historia de las ideas de los conceptos de la cibernética y la teoría de la información, mostrando en primer lugar los proyectos militares en que se originaron, y después su exposición y discusión en las conferencias Macy, teniendo presente su contexto histórico e intelectual. Y en el tercer capítulo exponer el modo en que estas ideas, junto con los aportes conceptuales de Gregory Bateson a la antropología, fueron usadas para servir de base teórica al modelo terapéutico del BTC. En la primera parte de este capítulo se relata la historia de las principales ideas de la cibernética: feedback, causalidad circular, homeostasis, y comando y reporte; y de la teoría de la información: información, mensaje, redundancia y la codificación analógica y digital. Para ello es necesario conocer las investigaciones de los que nacieron y se desarrollaron dichos conceptos, es decir, averiguar su contexto de descubrimiento. En la segunda parte se describe la discusión de dichos conceptos en la serie de conferencias auspiciadas por la Josiah Macy Jr. Foundation, primero en 1942, y culminada la Segunda Guerra Mundial de manera ininterrumpida de 1946 a 1953. Dentro de estas reuniones además se discutieron herramientas conceptuales como la teoría de los tipos lógicos de Russell, la paradoja de Russell, y la teoría de juegos de John von Neumann. En resumen, la primera parte del capítulo prioriza conocer el origen y definición de los conceptos, y la segunda parte su presentación y discusión dentro de las conferencias Macy. Finalmente en la tercera sección del capítulo se describen las metáforas que orientaron las discusiones en las conferencias Macy; la posición de algunos de sus miembros respecto al uso de modelos científicos como parte del desarrollo de la ciencia y las diferentes investigaciones que se desarrollaron después de las conferencias Macy sobre cibernética. Cabe anticipar que lo se conoce como cibernética es el resultado del esfuerzo de varios científicos provenientes de disciplinas heterogéneas, quienes tuvieron como meta presentar sus 66 trabajos bajo la sospecha de que tenían los mismos problemas, y con el deseo de estructurar un lenguaje común que les permitiera resolverlos en base a analogías formales. 2.1 Antecedentes: Segunda Guerra Mundial El contexto histórico que propicio las investigaciones que dieron origen a cibernética y de la teoría de la información fue la Segunda Guerra Mundial. De acuerdo Heims (1991) la necesidad de desarrollar tecnología militar propició que los científicos residentes en EU fueran llamados a ocupar puestos estratégicos de acuerdo con su especialidad para realizar investigaciones que resolvieran problemas militares. Tres de los principales hombres responsables del desarrollo de la cibernética debieron participar en estas actividades. El matemático Norbert Wiener trabajo para la National Defense Research Commite (NDRC) en los aspectos matemáticos de la artillería antiaérea. Mientras que John von Neumann, también matemático, fue consultor en el “Manhattan Project” en Los Álamos, Nuevo México, cuya misión era construir la bomba atómica para USA. Y Claude Shannon, ingeniero que a partir de su trabajo en criptografía desarrollo lo que se conoce como la teoría de la información. La participación de los tres en estas labores les permitió desarrollar una serie de conceptos que más tarde alentarían reuniones en torno de ellos para su discusión, terminada la guerra, en el escenario de las conferencias Macy. 2.1.1 Proyecto de Artillería Antiaérea: 1941-1943 En esta sección se expone el génesis de los conceptos de feedback, causalidad circular, control y homeostasis de manera conjunta ya que se desarrollaron en el mismo proyecto de investigación, el proyecto de artillería antiaérea, y representan integrados una nueva forma de explicar el comportamiento intencional. Para iniciar es indispensable ubicar a Norbert Wiener (1894-1964), él fue un brillante matemático estadounidense que obtuvo su doctorado en matemáticas a los 18 años. Después se integró como académico en el Massachusetts Institute of Technology (MIT) en 1919. Participo desde 1933 en un seminario interdisciplinar en la Harvard University Medical School, en el cual, siguiendo lo que relata Wiener en la introducción de su famoso Cybernetics (1998), se reunían los estudiantes del MIT y de la Harvard Medical School para discutir intensamente temas relativos al método científico. Entre los asistentes al seminario se encontraba el fisiólogo 67 mexicano Arturo Rosenblueth (1900-1970). Rosenblueth trabajaba como asistente en el departamento de Fisiología de la Universidad de Harvard en el laboratorio de Walter B. Cannon entre 1931 a 1943 gracias a una beca Guggenheim. Cannon fue quien propuso el término “homeostasis” para explicar el proceso mediante el cual el cuerpo mantiene la regularidad interna necesaria para optimizar los procesos que conservan la vida mediante procesos autorregulados. Cannon a su vez había retomado la noción del médico experimental del siglo XIX Claude Bernard de la estabilidad del milieu intérieur (medio interno) ante los cambios del medio externo para proponer la homeostasis. En dicho seminario Wiener y Rosenblueth se conocieron y entablaron amistad. Wiener estuvo aprendiendo fisiología a lado de Rosenblueth hasta 1944, ya que se interrumpió la continuidad las sesiones del seminario de filosofía de la ciencia por el regreso de Rosenblueth a México en ese año, y el aumento de las actividades de Wiener relacionadas con la guerra (Heims, 1977). En diciembre de 1940 Wiener se une al equipo de investigación dirigido por Warren Weaver, quien era un matemático aplicado encargado de la división de ciencias naturales de la Rockefeller Foundation, y jefe de la sección de Fire Control en la NDRC; dicha sección estableció su centro de operaciones en el MIT ordenado por Karl Compton, quien fue jefe de la División D (Dirección, Control, e Instrumentación) de la NDRC. El proyecto estuvo financiado de 1941 hasta 1943. La misión encargada a Norbert Wiener era resolver los problemas de la artillería antiaérea, específicamente se encargaría de la parte matemática de la orientación y el control del disparo de un dispositivo junto con el ingeniero Julian Bigelow, un técnico llamado Paul Money y “Miss Bernstein”, quien realizaba los cálculos. El problema era que los proyectiles antiaéreos y los aviones se desplazaban a velocidades parecidas, por lo tanto para que dieran en el blanco los misiles, el disparo debía ser hecho de tal modo en que coincidieran en un momento futuro con la posición del avión. La labor de Wiener consistió en diseñar un artefacto que predijera la dirección del avión enemigo y que disparara acertadamente al objetivo, por lo que se requería que el artefacto que realizara el disparo hiciera cálculos matemáticos para ajustar constantemente el ángulo de dirección del blanco, anticipando la trayectoria del avión sin que se desviara demasiado. Para ello se debía predecir la posición futura del avión basado en la posición pasada, tomando en cuenta las posibles acciones evasivas del piloto. Wiener y Bigelow entonces imaginaron en un soldado controlando el predictor, y trataron de modelar esa conducta por 68 medio de fórmulas matemáticas; entonces usaron el término de los ingenieros de control conocido como feedback (retroalimentación) para señalar este proceso de continuo ajuste entre el estado ideal y el estado actual del objetivo, es decir, entre la posición actual del avión y la posición en la que se supone va a estar para realizar el disparo, ambos advirtieron la importancia del feedback en el comportamiento que requiere ajustes durante su ejecución para realizar un fin determinado (Heims, 1991; Kline, 2015) Durante ese trabajo Wiener y Bigelow debían utilizar su formación matemática en datos continuos para correlacionar, en palabras de Kline: “past, present, and predicted positions to filter out the noise. They used the remaining signal, the message, to obtain an optimum target position by minimizing errors between predicted and actual positions” (2015, p. 20). El dispositivo debía entonces predecir estadísticamente en base a las posiciones pasadas del avión la posición en que estará en otro momento futuro a través de la trasmisión de mensajes. Montagnini (2007) comenta que el dispositivo antiaéreo funcionaba de este modo: “a radar detected the position of an enemy airplane and sent the relative signal to a computer; the computer predicted the future position and sent the relative signal to a gun which automatically oriented itself and shot the plane.” (p. 1013). Un radar localizaba la posición de avión y enseguida mandaba una señal o mensaje a una computadora, la cual operaba en función de una teoría de predicción estadística, al realizar el cálculo de ángulo de disparo y así orientaba el arma; en caso de que el primer disparo fallara entonces, por medio de retroalimentación negativa o también llamada “regenerativa”, se calculaba la diferencia entre la posición predicha y posición real del objetivo para que la computadora recalculara el ángulo del disparo siguiente. Es necesario advertir que el funcionamiento del dispositivo por feedback implica una causalidad circular, es decir, los datos del radar pasan a la computadora, estos al dispositivo que fijan la dirección del disparo, y si éste fallaba el mensaje de error entraba de nuevo en el sistema del radar para iniciar de nuevo la operación. La causalidad circular permite que los datos de salida se tomen como información de entrada de nuevo para realizar nuevos cálculos y de ese modo minimizar el error en disparo siguiente. El dispositivo empezó a presentar problemas de control pues un ajuste demasiado brusco del ángulo del disparo desviaba excesivamente la dirección del proyectil y, en consecuencia, el dispositivo hacía un ajuste en el dirección contraría más brusco, provocando con ello oscilaciones descontroladas. Al ver este fenómeno, Wiener solicito en 1942 consultar a 69 Rosenblueth como médico para saber si existía alguna enfermedad en el hombre donde también ocurrieran fuertes oscilaciones al realizar un comportamiento intencional que requiriera ajustes continuos. Rosenblueth contesto que se presentaba un temblor descontrolado en los pacientes con lesiones en el cerebelo ya que, al intentar tomar un objeto, como un vaso, ellos mostraban gran dificultad pues tenían temblores involuntarios en sus extremidades. De su consulta Wiener y Rosenblueth se percataron que la retroalimentación era también un proceso necesario para la acción intencional de los humanos. De ese modo comenzó el establecimiento de analogías formales entre el comportamiento intencional y el control en máquinas y hombres; y entre el funcionamiento del sistema nervioso central y las computadoras (Heims, 1991). El proyecto de artillería antiaérea término en febrero de 1943 y en el mismo año Rosenblueth, Wiener y Bigelow publican el producto del trabajo conjunto en el famoso artículo “Behavior, Purpose and Teleology” en la revista Philosophy of Science. Este artículo se considera por antonomasia el primer texto de la tradición intelectual de la cibernética, pues en él se introduce la terminología y las analogías que dan origen a la cibernética18 (Dupuy, 2009; Heims, 1991; Vargas, 2004). Rosenblueth, Wiener y Bigelow (1943) sostienen que el objeto de su estudio es el comportamiento y la aproximación behaviorista, con inputs y outputs como categorías de análisis. Los autores entienden el comportamiento como cualquier cambio con respecto al ambiente. De esa amplia definición realizan progresivamente distinciones dicotómicas para clasificar el comportamiento basadas –curiosamente- en cambios de energía. La primera clasificación es entre comportamiento pasivo y activo, este último se divide en intencional y no- intencional, el primero se caracteriza por que está dirigido a un objetivo, como ocurre en la actividad voluntaria del hombre y los servomecanismos, mientras el comportamiento no- intencional carece de objetivo definido. La siguiente distinción opera sobre el comportamiento intencional y es significativa por introduce el concepto de feedback para explicar el comportamiento en máquinas y hombres, mientras que al comportamiento que emplea feedback le denominan “teleológico”, al que no usa feedback le llaman no-teleológico. El feedback se clasifica en positivo y en negativo. En el feedback positivo el output que entra en el input tiene el mismo signo, en este tipo de retroalimentación se agrega la misma energía de salida a la entrada, por lo cual no sirve para corregir a una maquina; por otro lado en el feedback negativo pasa lo siguiente: “the signals from the goal are used to restrict outputs which would otherwise go 70 beyond the goal” (Rosenblueth, Wiener y Bigelow, 1943, p. 19) la restricción que impone el feedback negativo regula el funcionamiento de la maquina dentro de los límites fijados y sirve para mantener el control del sistema. De lo anterior concluyen que todo el comportamiento intencional requiere del feedback negativo para su regulación y control, por ejemplo el tomar un objeto en movimiento precisa de tener información sobre el desplazamiento del objeto en relación a la mano que lo desea sujetar, y en base a esa información corregir progresivamente la dirección de la mano durante toda la operación, y para ello debe valerse de la retroalimentación, la cual se pude entender sencillamente de la siguiente manera: “the property of being able to adjust future conduct by past performance.” (Wiener, 1989, p. 33). El poder ajustar la acción futura y con propósito en base al pasado. Es importante advertir desde ahora que este tipo de explicación presentaba una discontinuidad importante con las explicaciones basadas en la casualidad lineal. Una última dicotomía que establecen Rosenblueth, Wiener y Bigelow (1943) es dividir el comportamiento “teleológico” –entendido como comportamiento controlado por feedback- entre comportamiento predictivo y no-predictivo, el primero debe advertir la posición futura de un objetivo en las coordenadas temporal y espacial; el segundo no requiere tal predicción para su propósito. Gracias a la introducción de las ideas de feedback, causalidad circular y control se anunciaba una nueva forma de abordar el problema de la teleología en el comportamiento, como lo señala Heims (1977): “Rosenblueth, Wiener, and Bigelow had, in effect, announced a new paradigm in science, according to which one seeks an overarching theory to include machines and organisms; the theory would clearly involve ideas of information, control, and feedback.” (p. 143). El valor del artículo reside en que permite el comportamiento intencional en máquinas y organismos vivos bajo las mismas ideas formales; en que inicia una serie de analogías entre sistemas vivos y mecánicos para su mutua comprensión, y en que utiliza conceptos provenientes de la ingeniería para el estudio del comportamiento intencional. El feedback funciona como principio explicativo para comprender el comportamiento intencional en máquinas y en organismos vivos, y la posibilidad de analizar los problemas en máquinas y hombres bajo este principio, por ejemplo, cuando la retroalimentación negativa no es adecuada, siendo más bien excesiva, y actúa en el sistema como si fuera positiva provocando oscilaciones descontroladas 71 que hacen perder el objetivo, como ocurre con máquinas mal calibradas o con las personas con daño en el cerebelo. 2.1.2 Teoría de la Información Life is an island here and now in a dying world. The process by which we living beings resist the general stream of corruption and decay is known as homeostasis Norbert Wiener La teoría de la información tiene doble paternidad: Norbert Wiener y Claude Shannon. Quienes a pesar de que tuvieron diferentes tareas durante la Segunda Guerra Mundial y contrarias aproximaciones en matemáticas, ambos llegaron a la noción de información casi al mismo tiempo y con concepciones complementarias. A continuación se especifica el contexto de descubrimiento de cada noción de información para cada matemático. Cabe decir desde el inicio que se entiende a la información como “noción” ya que, por un lado, la historia del concepto en física es larga, y por lo tanto su definición no es uniforme en esa disciplina; además, al ser producto de un tratamiento matemático formal, es decir específicamente simbólico, es difícil hace de ella una descripción semántica. Por lo que en este escrito se refiere, se le llama información a la cantidad calculada en el trabajo de Wiener y Shannon, y que fue objeto de discusión en las conferencias Macy. Para lo cual se describirá el tipo de tareas que llevaron a cabo cada uno, el concepto de información que expusieron en sus publicaciones, y las semejanzas y diferencias entre sus explicaciones19. El contexto donde Wiener desarrollo el concepto de información es el mismo donde concibió las ideas de la sección anterior: el proyecto de artillería antiaérea. Pues como Kline acertadamente afirma: “While Wiener’s antiaircraft project led directly to the feedback and control ideas in cybernetics, it led indirectly to his definition of information” (2015, p. 25). En el proyecto de artillería antiaérea Bigelow usaba el término información como ingeniero para señalar la entrada de datos en una máquina; en “Behavior, Purpose y Teleology” el término que se usa para explicar el funcionamiento del feedback es energía más no información (Rosenblueth, Wiener y Bigelow, 1943). Por otro lado el termino mensaje, preveniente de la ingeniería de la comunicación, se usó para diseñar el predictor y se entendía de la siguiente manera: “The ‘message’ represented the 72 true path of the plane; ‘noise’ represented tracking errors” (Kline, 2015 p. 20), el mensaje era, a saber, la dirección real del avión en vuelo, en contraposición del ruido que significaba direcciones equivocadas que debía evitar el predictor. Por lo que el término información no usaba como la medida que registra la probabilidad de una elección, eso sucede entre 1944 y 1947 mientras Wiener colaboraba con Walter Pitts, quien fue estudiante de Rudolf Carnarp, sugerido por neurólogo Warren McCulloch en 1943, en el estudio del funcionamiento del cerebro basado en la analogía con las operaciones que realizan las computadoras digitales, basado en teoría estadística, series de tiempo y redes neuronales. Durante ese tiempo Wiener participo en las primeras cinco conferencias Macy. En 1947 se traslada a México con el fin de colaborar con Rosenblueth en el Instituto de Cardiología para estudiar problemas relacionados con biología matemática gracias a un subsidio de la fundación Rockefeller. Durante su primer año de estancia en México escribe “Cybernetics. Or Control and Communication in the Animal and the Machine”, libro donde realiza una síntesis de ideas que había formulado a lo largo de su carrera (Heims, 1991). Wiener llamo cibernética a su libro cibernética por lo siguiente: “Hence ‘Cybernetics,’ which I derived from the Greek word kibernetes, or ‘steersman’, the same Greek word from which we eventually derive our word ´governor’. (Wiener, 1989, p. 15). Por lo tanto la palabra cibernética estuvo desde el inicio familiarizada con la idea de control. Wiener consideraba a la cibernética como una nueva ciencia que trataría con los problemas de control y comunicación en animales, máquinas y humanos. En dicho libro se amplía la explicación del control en humanos y maquinas basado en el proceso de retroalimentación; además describió la similitud entre el funcionamiento del cerebro humano y las computadoras digitales; la necesidad de la retroalimentación para la homeostasis, y la fusión de máquinas y humanos en ciborgs. También es en ese documento expone la relación entre información y entropía. Por su parte Claude Shannon estudio brevemente con Wiener en el MIT; pero su carrera y la matemática preferida por ambos era diferente, mientras que Wiener trabajaba con matemáticas de tipo continuo o análogo; Shannon escogió a las matemáticas que utilizaban cantidades discretas, es decir, problemas de tipo digital (si-no). A pesar de las diferencias, Shannon sentía un gran respeto y admiración por el trabajo de Wiener. Y por su parte Wiener llego a recomendar en 1941 a Shannon para un trabajo en matemática aplicada (Kline, 2015). 73 Shannon obtuvo doble título en educación superior en matemáticas y en ingeniería eléctrica en 1936. La maestría la realizo en ingeniería eléctrica en el MIT trabajando como asistente en el Rockefeller Differential Analyzer. A Shannon estudiando las maquinas digitales de estados discretos en los Laboratorios Bell en el verano de 1937 se le ocurrió aplicar algebra Booleana para analizar la lógica digital en circuitos. Al terminar su tesis llamada “Symbolic Analysis of Relay and Switching Circuits” gano el premio que concedía el American Institute of Electrical Engineers, el cual la publico en 1938. Su tesis consistía en una teoría matemática sobre circuitos eléctricos. En 1939 Shannon comenzaba a interesarse por el análisis de sistemas de transmisión de comunicación como la radio y el telégrafo, donde habría transformaciones matemáticas de la “inteligencia” que se enviaban y recibían en los medios de comunicación. Ese es considerado el primer antecedente de la teoría de su información que desarrollaría en los años posteriores. Shannon recibió la maestría en ingeniería eléctrica y el doctorado en matemáticas en la misma ceremonia en 1940 (Kline, 2015). Al terminar sus estudios superiores Shannon regresó a trabajar a los Bell Labs en la primavera de 1940, para después integrarse a la Universidad de Princeton para colaborar con el matemático Hermann Weyl; pero Warren Weaver le pidió a Shannon posponer su beca para trabajar en sus proyectos militares en Princeton. Shannon acepto trabajar en un proyecto llamado oficialmente “Mathematical Studies Relating to Fire Control” el 1 de diciembre de 1940, la misma fecha que inicio el contrato de Wiener en el proyecto antiaéreo en el MIT. Pero mientras la labor de Wiener era del dominio público, la de Shannon era clasificada como secreto. Se tienen noticias que aplico sus estudios en tres áreas: en artillería antiaérea, en un sistema de comunicación secreto y en criptografía (Kline, 2015). Es posible que durante el trabajo se Shannon en la artillería antiaérea conociera la teoría estadística de comunicación de Wiener, debido a visitas que probablemente realizo Shannon a Wiener en el MIT desde 1941. El segundo proyecto de Shannon consistía en desarrollar un sistema de comunicación secreto que permitiera al presidente de USA Franklin Roosevelt y el primer ministro británico Winston Churchill comunicarse de manera segura y secreta. Claude Shannon se encargaría de darle seguridad matemática al llamado “Proyecto X”20. De acuerdo con Kline en 1945 Shannon, “drew together the intellectual strands of his wartime research on fire-control systems and Project X to produce ‘A Mathematical Theory of Cryptography,’ the classified report that formed the basis for the theory of information he 74 published in 1948” (2015, p. 32). Es decir, como producto de su trabajo en el control de la artillería y en el desarrollo en criptografía en el Proyecto X produjo las herramientas matemáticas para proponer su famosa teoría de la comunicación y la medida de la información. La criptografía, tal como la define Watzlawick (979), consiste en cifrar un mensaje para ocultarlo y generar desinformación. Así al enviar un mensaje secreto una tecla se encriptaba para producir un criptograma de modo que espías enemigos desconocieran el contenido del mensaje. La innovación de Shannon consistió en usar la teoría de la probabilidad para tratar la selección de mensajes. Ya en un reporte de 1945 Shannon escribía una definición estadística de información. Aunque su definición es estrictamente matemática se puede entender como la medida de la información que es generada cuando es tomada una decisión entre posibles elecciones. Es en ese momento donde Shannon utiliza la fórmula de la entropía al percatarse de su similitud con la fórmula que él desarrollo para la criptografía. La simultaneidad de los trabajos matemáticos de Wiener y Shannon sobre la medida estadística de la información es evidente. Wiener en 1946 había escrito un documento tratando lo que se conocería como teoría de la información donde se medía la cantidad de información. Mientras que Shannon trabajaba en los AT&T’s Bell Telephone Laboratories en 1945 en el proyecto secreto de criptografía se acercaba a la misma noción de información. Eso Wiener ya lo sabía porque había escuchado a Shannon hablar en una conferencia sobre el tema, por lo que se apresuró a trabajar en su teoría estadística. En 1947 Wiener recupero un documento donde exponía las ideas relacionadas con la teoría de la información por su colaborador Walter Pitts – que lo había extraviado-. En 1948 tanto Shannon como Wiener publicaron la suma de sus respectivos trabajos, el primero en dos partes en el Bell System Technical Journal titulado como “A Mathematical Theory of Communication”, el primer tomo en junio y el segundo en octubre, en el mismo mes de octubre se publicaba el libro “Cybernetics: Or Control and Communication in the Animal and the Machine” de Wiener. En palabras de Kline: “Both men bridged communication theory and physics by defining information with an equation that was similar to the formula for the physical concept of entropy, the unavailability of a system’s energy to do work” (2015, p. 10). Aunque ambos matemáticos vinculan su cantidad con la fórmula de la entropía tienen una diferencia significativa, en seguida se revisa el concepto para cada uno. En Wiener la idea de la información nació por la necesidad de predecir eventos –o estados futuros- medidos en series de tiempo, y la elección entre dos posibilidades, cada una 75 representada por 0 y 1. Wiener aplico la teoría estadística a la ingeniería de la información y de ahí derivó la fórmula para la cantidad de información, que es la cantidad unitaria de la transmisión de alternativas igualmente posibles. Después Wiener advirtió que esa cantidad era lo contrario a la medida de que calcula la entropía en un sistema, entropía entendida de la siguiente manera: “nature's statistical tendency to disorder, the tendency for entropy to increase in isolated systems, is expressed by the second law of thermodynamics” (Wiener, 1989, p. 28). Es decir, la entropía en física indica que hay menos energía disponible para trabajar y por lo tanto el sistema tiende al desorden y a la ausencia de diferenciación. Por lo tanto, “Wiener defined information as negative entropy, which means, for communications systems, that if the selection of messages becomes more random (more disordered), less information will be transmitted” (Kline, 2015, p. 13). La información al ser la medida contraria del desorden, es entonces la medida del orden y la organización de un sistema de comunicación, pues a mayor información menos entropía. Wiener en la segunda edición de su libro para el público en general The Human Use of the Human Being (1989) escribe una definición menos técnica del concepto de información: Just as entropy is a measure of disorganization, the information carried by a set of messages is a measure of organization. In fact, it is possible to interpret the information carried by a message as essentially the negative of its entropy, and the negative I logarithm of its probability (p. 21). La información es trasmitida por un conjunto de mensajes al sistema, y se encarga de asegurar la organización del mismo, al mismo tiempo que previene que este colapse por el exceso de entropía, esto es, un exceso de ruido que lleve a la desorganización. La información es la selección entre un conjunto de posibilidades y es la medida del orden en un sistema comunicacional. Por otro lado Shannon desarrollo medida de información para transmitir mensajes de manera eficiente en un canal de comunicación de manera segura. Dicha medida estadística la explica Karl Pribram de la siguiente manera: “When the number of alternatives or possibilities (uncertainties) had been reduced by half, one bit of information was said to have been transmitted. Shannon and Weaver noted that such a measure was related to the idea of entropy.” (Pribram, 1990, p. 81), es decir, la medida de Shannon mide las alternativas posibles en un 76 proceso aleatorio, en la que cada una de las alternativas tiene la misma posibilidad de ser el resultado de la elección, por lo cual es la medida estadística de la incertidumbre de un sistema; cuando se conoce el resultado se gana un bit de información, o dicho de otro modo, se reduce un bit la incertidumbre. Dicha fórmula, advirtió Shannon, es igual a la de la que mide la entropía, por ello se le conoce como fórmula Shannon de la entropía, la entropía en su medida representa la suma de la probabilidad de las alternativas (incertidumbres) igualmente posibles, por lo que a mayor entropía tiene un sistema más información puede ser ganada. Por ejemplo, entre el lanzamiento de una moneda en la que hay dos posibilidades, cara o cruz, y el lanzamiento de un dado en el que hay seis alternativas, hay más incertidumbre, es decir, entropía en el dado que en la moneda; por lo cual hay más ganancia potencial de información en el dado. En los casos en los que hay completa certeza de un resultado, como cuando no hay alternativas, no hay entropía y por lo tanto no es posible ganar información. Por estas razones se dice que la fórmula de Shannon es la de la entropía, pues mide la aleatoriedad del sistema y con ello la potencial información que se puede ganar. En resumen, mientras Shannon propuso una medida de la información cuya fórmula es la misma que la que mide la entropía positiva, esto es, que mide la aleatoriedad en la comunicación de los mensajes; Wiener propuso una medida que mide la entropía negativa, es decir, la información en un sistema, pues señala la cantidad de orden al reducir el número de incertidumbre o elecciones igualmente probables al enviar un mensaje, y de ese modo impone restricciones al sistema para mantener el control del mismo. Dada la simultaneidad entre los trabajos de Wiener y Shannon y sus coincidencias el crédito por la teoría de la información se le da a ambos. Al notar las similitudes entre sus cantidades ambos matemáticos se dieron cuenta de que sus fórmulas eran contrarias, pero sobre todo complementarias y trataban el mismo asunto. Sin embargo, a Shannon no le interesaba definir su fórmula de la entropía semánticamente, ya que sólo le interesaba usarla matemáticamente para su concepto de información. De hecho rehuía a considerar semánticamente su teoría, pues lo que le preocupaba era transmitir mensajes en presencia de ruido certeramente, independientemente del contenido del mensaje. Y tampoco le parecía lícito describir prosaicamente un concepto matemático. La explicación del concepto de información de Shannon semánticamente se debe a su colaboración con Warren Weaver en el libro “The Mathematical Theory of Communication” publicado en 77 1949. Más tarde Shannon desarrollo una teoría general de la comunicación que podía ser aplicada a sistemas biológicos o a máquinas (Kline, 2015). Mientras que con el tiempo Wiener integro la fórmula de la información a la cibernética como la teoría sobre la comunicación, y se volvió tan popular al grado de ser el referente de toda una época; para decirlo con las palabras del propio Wiener: “la época actual es la era de la comunicación y el control” (1998, p. 65). La información para Wiener era un principio para estudiar a todos los sistemas comunicativos, no solamente los correspondientes a la ingeniería, sino también a los biológicos y sociales. Por ello, para Wiener entender la transmisión y adquisición de la información era importante para comprender la organización de cualquier sistema por medio de la comunicación, ya que es necesaria para que cualquier agente, vivo o mecánico, particular o social, se adapte a su medio ambiente y pueda hacer las trasformaciones necesarias en su entorno para garantizar su supervivencia; particularmente para un organismo biológico es indispensable contar con la información adecuada para mantener la homeostasis. Por lo cual Wiener cree que es muy importante estudiar el proceso comunicativo (Wiener, 1989). Wiener sostiene que se puede entender la vida como un sistema homeostático regulado por medio de la retroalimentación negativa que constantemente intercambia de información, al respecto afirma: It is my thesis that the physical functioning of the living individual and the operation of some of the newer communication machines are precisely parallel in their analogous attempts to control entropy through feedback. Both of them have sensory receptors as one stage in their cycle of operation: that is, in both of them there exists a special apparatus for collecting information from the outer world at low energy levels, and for making it available in the operation of the individual or of the machine. (…). The information is then turned into a new form available for the further stages of performance (1989, p. 26-27). Es decir, que la vida lucha contra la entropía por medio del feedback para garantizar el control y el orden del mismo modo que lo hace las máquinas. Ambos procesos requieren órganos receptores de información, en el caso de los humanos estos reciben datos del mundo externo por medio de la piel, mientras las máquinas lo hacen a través de celdas fotostáticas u otros sensores. 78 Después de la recepción de mensajes del exterior y su codificación, la información obtenida sirve para planear la siguiente acción de modo que los órganos efectores operen sobre el medio externo. De este modo para Wiener el sistema nervioso central se puede entender como un aparato con sensores y efectores que toma decisiones basando su funcionamiento en los datos del pasado. Así tanto las maquinas como la vida buscan ir en contra de la segunda ley de la termodinámica, es decir, de la entropía, para mantenerse funcionando por medio de la retroalimentación negativa. La vida se mantiene operando en contra de la homogeneidad y la desorganización aumentando la complejidad, diversidad y auto-organización de los sistemas biológicos. Por lo tanto la información, aunque es menos probable que el desorden, tiende que imponer orden tomando decisiones para garantizar el control de los sistemas. Como enseguida lo afirma Wiener, “The metaphor to which I devote (…) is one in which the organism is seen as message. Organism is opposed to chaos, to disintegration, to death, as message is to noise” (p. 96). El matemático al terminar por igualar la entropía con la muerte del organismo, este último se convertiría en el portador de información, es decir, en un mensaje. Por lo anterior el estudio de los mensajes es tan importante para Wiener pues permite conocer a cualquier sistema independientemente de su tamaño o composición, la información es lo que hace que una máquina se mantenga en funcionamiento, y se preserve la vida en el caso de que sea un sistema biológico. De esta manera se podría investigar a la sociedad en base del estudio de la comunicación entre las personas, que sería el intercambio de información por medio de los mensajes. Dado que la vida se mantiene por feedback para garantizar el intercambio de información entre los organismos y el medio, Wiener piensa que el mismo proceso sirve para explicar el aprendizaje, por ello afirma: ...feedback is a method of controlling a system by reinserting into it the results of its past performance. If these results are merely used as numerical data for the criticism of the system and its regulation, we have the simple feedback of the control engineers. If, however, the information which proceeds backward from the performance is able to change the general method and pattern of performance, we have a process which may well be called learning (1989, p. 61). 79 Así Wiener clasifica en dos los efectos que puede tener el feedback en la regulación de un sistema, en el primero el feedback se limita a mantener el orden actual del sistema manteniendo al sistema dentro de las variables preestablecidas; pero el segundo feedback puede modificar la futura pauta del organismo a partir de la información anterior, a eso último le llama aprendizaje. De igual modo el aprendizaje desempeña un significativo papel para ir en contra de la entropía al permitir llegar a un tipo de organización más funcional que le permita al organismo integrarse eficientemente a su ambiente. Es importante mantener en mente esta distinción entre los niveles de retroalimentación, pues es usada después en modelo clínico del BTC. 2.2 Conferencias Macy En esta sección se desarrolla lo sucedido en las conferencias Macy ocurridas al finalizar la Segunda Guerra Mundial. En las cuales se presentaron y discutieron los conceptos de expuestos en la sección anterior. En primer lugar se señala su origen y se destaca los científicos que participaron y las discusiones que mantuvieron en torno a sus trabajos; los cambios que provocaron las publicaciones que hicieron durante las conferencias en los debates que mantenían dentro de ellas; y las metáforas que guiaron las pláticas entre matemáticos, ingenieros y neurofisiólogos con científicos de las ciencias sociales. 2.2.1 Teleological Society Antes del establecimiento de las conferencias Macy de manera formal en 1946 hubo una serie de reuniones que sirvieron de antecedentes a dichas conferencias. En primer lugar, bajo los auspicios de la Josiah Macy Jr. Foundation, organización creada en 1930 con el fin de financiar investigación científica en medicina, y promover la colaboración interdisciplinaria entre los científicos en USA, Frank Fremont-Smith, director médico y executivo de la fundación, organizo un encuentro con el título “Cerebral Inhibition Meeting” en mayo de 1942, el cual trataba sobre hipnosis y reflejos condicionados. Los asistentes a la reunión, que dio lugar en el Beekman Hotel, Nueva York, fueron los antropólogos Gregory Bateson y su esposa Margaret Mead, Arturo Rosenblueth, Frank Fremont-Smith, el médico e hipnotista Milton H. Erickson, el psiquiatra converso al psicoanálisis, como Freud, Lawrence Kubie, el neurofisiólogo, psiquiatra y filósofo Warren McCulloch, y el científico social Lawrence Frank (Heims, 1991). 80 En esa fecha Wiener y Bigelow aun trabajaban en el proyecto militar de artillería antiaérea en el MIT, por lo cual asistió Arturo Rosenblueth a esta reunión y aprovecho la ocasión para presentar las nociones de retroalimentación, causalidad circular y control, y que más tarde se publicarían en el artículo “Behavior, Purpose and Telelology” en 1943. En la misma reunión Warren McCulloch expuso el trabajo que realizo junto con Walter Pitts donde evaluaban matemáticamente las redes neuronales, las cuales idealmente funcionaban como computadoras digitales y que también se publicarían en 1943 (Heims, 1991). Después de esa primera presentación a la comunidad científica y debido al entusiasmo con que fueron recibidas sus ideas Wiener, Bigelow y Rosenblueth advirtieron que los humanos y las maquinas podían ser estudiados bajo los mismos principios de la comunicación y la ingeniería de control. Por lo cual Wiener, bajo la sospecha de que los problemas que había tratado en la construcción del dispositivo para a derribar aviones y los problemas que tenía Rosenblueth con sus pacientes eran formalmente los mismos, organizó una reunión el 6 y 7 de enero de 1945, en el Advanced Study, Princeton, junto con John von Neumann y Haward Aiken; a la que asistieron matemáticos, ingenieros y neurofisiólogos. Tanto Wiener como Aiken sugirieron llamar al grupo “Teleological Society” debido al artículo de 1943 de Wiener. En aquella reunión –en la que no participaron científicos sociales- Wiener trato temas sobre sistemas de comunicación; von Neumann hablo sobre computadoras; McCulloch, Walter Pitts y el neurofisiólogo mexicano Rafael Lorente de Nó, que trabajaba en el instituto Rockefeller, expusieron el funcionamiento del cerebro desde sus aproximaciones (Kline, 2015). Después de esta reunión organizada por Wiener, y emocionado por los resultados, el matemático planeo junto con von Neumann instaurar un grupo de estudio sobre estas ideas que incluyera la participación de neurofisiólogos, matemáticos e ingenieros; e incluso pensó en poner un centro de investigación interdisciplinario en el MIT para entender las relaciones entre fisiología e ingeniería con su colega matemático von Neumann. Estaba seguro de que los problemas de ingenieros y neurofisiólogos eran formalmente los mismos. Pero el lugar donde trabajaba von Neumann, el Princeton Institute of Advanced Study, le concedió el permiso para construir un prototipo de computadora, conocida después como JONIAC. Von Neumann acepto la oportunidad y por lo tanto el proyecto con común no se materializo. Wiener, sin resentimientos, le sugirió llevar a Julian Bigelow como ingeniero (Heims, 1991; Kline, 2015). 81 De acuerdo con Heims (1977) von Neumann asistía a las reuniones porque estaba interesado en los cálculos lógicos hechos por McCulloch y Walter Pitts para describir el funcionamiento del sistema nervioso, con el propósito de utilizarlos para la descripción del propósito en las computadoras que él diseñaba. El mayor acercamiento de von Neumann a las ciencias sociales se dio en 1943 cuando escribe junto al economista Oskar Morgestern el libro “Theory of Games and Economic Behavior” en el cual se utilizan las matemáticas en las ciencias sociales a través de la teoría de juegos; el libro fue publicado en 1944. El éxito de la reunión fue comunicado por Wiener a Rosenblueth por vía epistolar, ya que el fisiólogo mexicano no pudo asistir a la conferencia de 1945 debido a que dejo Estados Unidos al no ser renovado su contrato en la Harvard Medical School, y aunque McCulloch deseaba que Rosenblueth trabajara con él en Chicago, decidió regresar a México a dirigir el Instituto Nacional de Cardiología (Dupuy, 2009). Wiener decidió trabajar en el MIT y en instituto dirigido por Rosenblueth, financiado por la Rockefeller Foundation por cinco años entre 1947 y 1952, para estudiar biología matemática, en temas como la excitación en el musculo cardiaco y la oscilación neuromuscular conocida como “clonus” (Heims, 1977, Kline 2015). Estas primeras sesiones fueron el preámbulo para establecer las conferencias Macy, de las cuales hablaremos enseguida. 2.2.2 The Cybernetics Group: 1946-195321 Gregory Bateson, a partir de la conferencia donde escucho a Arturo Rosenblueth hablar sobre feedback y su importancia para explicar el comportamiento teleológico en 1942, se la paso pensando durante la guerra en esos conceptos y su posible aplicación en las ciencias sociales. Así que después de trabajar para Office of Strategic Services en el suroeste de Asia con el fin de disminuir la moral nacional de los japoneses, regreso a EU buscando herramientas conceptuales de mayor confianza que las que ofrecía la antropología para explicar sus observaciones en Nueva Guinea, y que le permitieran un grado mayor de abstracción para poder realizar generalizaciones (Price ,1998). Por lo que Bateson le pidió a Frank Fremont-Smith que organizaran más conferencias sobre los temas que expuso Rosenblueth (Bateson, 1971j; Lipset, 1991). Al mismo tiempo Warren McCulloch fue a sugerir a Fremont-Smith continuar las conferencias. Acordada una nueva cita financiada por la fundación Macy, enseguida Fremont- Smith le confió a McCulloch que hiciera una lista de invitados en torno a los conceptos presentados por Rosenblueth en la reunión de 1942: el feedback, la causalidad circular y las 82 analogías formales entre máquinas y humanos; junto con Bateson selecciono a los participantes buscando que además de matemáticos, ingenieros y neurofisiólogos asistieran científicos sociales, para mantener un espíritu interdisciplinario que buscaba generar la Fundación Macy22. Wiener, aunque no participo en la organización de la conferencia, sugirió como asistentes a Julian Bigelow; y también al filósofo Giorgio Santillana, el cual sin embargo no fue tomado en cuenta (Kline, 2015). El objetivo general de las conferencias era tratar de resolver problemas que tenían en diversas disciplinas a través de un lenguaje común, teniendo como núcleo las ideas presentadas los matemáticos, ingenieros y neurofisiólogos, y que después se convertirían en la base teórica de la teoría de la información y la cibernética. Otro objetivo era estimular el trabajo interdisciplinario al reunir a los científicos mencionados junto con especialistas de las ciencias sociales, de modo que estos últimos pudieran aprovechar las herramientas conceptuales presentadas en las conferencias. De ese modo se abría la posibilidad de superar los límites tradicionales entras las ciencias “duras” y las “blandas”, ya que gracias a las conferencias Macy la cibernética y la teoría de la información se conocieron en las ciencias sociales y fueron usadas para diversas investigaciones. Bajo ese contexto las conferencias Macy se reanudaron el 8 y 9 de marzo de 1946 como sucesoras de las reuniones de la “Teleological Society”, de hecho informalmente se les conocían como “Conference of Teleological Mechanism” (Heims, 1977); pero oficialmente se titularón “The Feedback Mechanism and Circular Causal System in Biology and the Social Sciences Meeting.” Título que claramente reflejaba que el interés principal estaba en discutir el concepto de retroalimentación en los sistemas que funcionaran de acuerdo a la causalidad circular, ya sean biológicos, mecánicos o sociales (Heims, 1991). Los miembros de la primera conferencia Macy fueron varios que ya habían estado presentes en la reunión sobre inhibición cerebral y otros invitados, entre el primer grupo se encontraban Gregory Bateson, Lawrence K. Frank, Frank Fremont-Smith, Lawrence S. Kubie, Margaret Mead, Warren McCulloch y Arturo Rosenblueth; mientras los nuevos participantes que se integraron fueron Norbert Wiener, Julian H. Bigelow, John von Neumann, Walter Pitts, el estudioso del cerebro Gerhardt von Bonin, el neurofisiólogo Ralph W. Gerard, la psicóloga Molly Harrower, el ecologista George Evelyn Hutchinson, el psicólogo experimental Heinrich Klüver, el sociólogo Paul Lazarsfeld, el psicólogo Kurt Lewin del MIT, el neurofisiólogo Rafael 83 Lorente de Nó, el filósofo Filmer S. C. Northrop y el matemático Leonard J. Savage (Heims, 1975; Heims, 1991; Kline, 2015). Las conferencias se organizaron regularmente cada seis meses con una duración de dos días de 1946 a 1948; y a partir de 1949 y hasta 1953 se realizó sólo una por año. En total participaron 70 científicos, algunos permanentes, otros las abandonaban y otros más se integraban como invitados. Las primeras 9 fueron en el Hotel Beekman, en Nueva York; la última se dio cita en Nassau Inn en Princeton. El primer ciclo de conferencias, es decir las 5 primeras no se documentaron de manera oficial, sólo se cuentan con los apuntes a mano de Margaret Mead y otros hechos por McCulloch, así como la correspondencia entre algunos de los miembros, por lo cual los detalles de su proceso son poco conocidos. La principal particularidad de este primer ciclo fue que, como su nombre lo indica, la atención estaba puesta en la discusión del feedback. El último ciclo de cinco conferencias inicia a partir de 1949 y fueron registradas y editadas para su publicación por Heinz von Foerster, Margaret Mead y el psicólogo Hans Teuber (Kline, 2015). Las discusiones características de las primeras cinco conferencias fueron alrededor de los conceptos de feedback, causalidad circular, control, homeostasis y la metáfora, como la nombra Dupuy (2009), de que el cerebro es una máquina; mientras que en las últimas cinco conferencias, es decir, de 1949 a 1953, después de la publicación de Cybernetics y los dos tomos de Shannon en los Bell System Technical Journal en 1948, el leitmotiv de las discusiones fue la teoría de la información, por lo que la metáfora central paso a ser la noción de información, su codificación y transmisión en los sistemas. Por lo cual los invitados, ponencias y debates se orientaron en torno a la información. Lo que se mantuvo sin alteraciones fue la presidencia de todas las conferencias, ya que Warren McCulloch siempre estuvo al frente de ellas. En 1946 además recibe un subsidio de Macy Foundation para estudiar neurofisiología. Otro aspecto invariable fue la jerarquía de las participaciones en las conferencias, ya que reflejaba el valor que tenían las ciencias exactas y las ciencias sociales para los organizadores, de modo que los matemáticos e ingenieros realizaban sus ponencias primero, después participaban los neurofisiólogos que utilizaban los conceptos de los ingenieros para el estudio del cerebro basados en las máquinas digitales, y, al final, los científicos sociales, quienes usaban como metáforas los términos expuestos por los grupos anteriores para dotar de mayor rigor sus propios modelos teóricos (Heims, 1991). 84 La conferencia inaugural de la reunión de 1946 la dio John von Neumann, quien presento su trabajo sobre el diseño de las maquinas digitales y analógicas; además expuso los procesos de comunicación y control en las computadoras más avanzadas de su época y hablo sobre las analogías entre el sistema nervioso y las computadoras (Heims, 1977). De acuerdo a las notas hechas por McCulloch sobre la distinción hecha por von Neumann entre las maquinas analógicas y digitales, él matemático: contrasted these digital machines with analogical mechanisms in which numbers were represented continuously by magnitudes of length, force, voltage or whatnot, and he pointed out the superiority of the former to the latter with respect to their ability to extend their precision indefinitely by the addition of like components. (McCulloch citado en Pias, 2005, p. 545) La diferencia es que las máquinas analógicas trabajan con magnitudes continuas como la fuerza y el voltaje pero, en opinión del matemático, las máquinas digitales son superiores porqué permiten una mayor precisión y por tanto mayor eficacia en la construcción de máquinas computadoras. Al día siguiente Neumann expuso brevemente su teoría de juegos (Heims, 1991). Después de Neumann el primer día el turno fue para Lorente de Nó, él explico que las redes neuronales operan como si funcionaran de acuerdo con un proceso binario, es decir, el que una neurona estimulara o no a otra a través del axón. En respuesta a la exposición de Neumann, Wiener explico que el efecto que tiene una computadora cuando intenta resolver un problema sin solución es como si esta resolviera una paradoja del tipo de Russell y en consecuencia la computadora empieza a oscilar descontroladamente entre respuestas de tipo si-no. Al respecto, en las notas de McCulloch se encuentra la siguiente declaración en la primera conferencia: “(...) it ought to go into a series of operations instead of coming to a conclusion, so that if it first decided that something was true it would next decide that it was false and vice versa. (Wiener citado en Montagnini, 2007, p. 1016). Esto es que la computadora entra en un estado en el cual cuando decida que algo es correcto enseguida dirá que es falso, sin que pueda detenerse en una elección. Es importante señalar desde ahora que la paradoja de Russell es de naturaleza matemática, es expuesta en el libro publicado en tres tomos entre 1910 y 1913 que Bertrand Russell escribió junto a Alfred North Whitehead, Principia Mathematica. Wiener estaba familiarizado con las teorías de Russell ya que de joven había sido discípulo suyo. Wiener la usa 85 para esclarecer el comportamiento de las maquinas digitales ante la resolución de algunos problemas. En la tarde del primer día de conferencias Wiener y Rosenblueth explicaron el papel el feedback negativo en el comportamiento intencional; Wiener se enfocó en mostrar el diseño de dispositivos con objetivos y Rosenblueth explicar la función de la homeostasis en la respiración, la regulación de la presión sanguínea y el movimiento ocular llamado nistagmus. En la misma ponencia Wiener comento que las máquinas tienen órganos receptores y efectores que les ayudan a orientarse en el medio para conseguir sus objetivos; y expuso la historia de dispositivos que funcionaban por medio de retroalimentación negativa desde Grecia hasta el regulador centrífugo de James Watt para regular la velocidad en dispositivos mecánicos. Además en la misma conferencia Wiener afirmo: “The fundamental idea is the message, even though the message may not be sent by man and the fundamental element of the message is the decision” (Heims, 1991, p. 22) con estas palabras empezaba a mostrar la importante idea de información, pues aunque utilizaba el termino mensaje señalaba que estaba relacionado con el proceso de decisión. Por ello Kline (2015) afirma que aunque Wiener había hablado de información desde la primera conferencia, fue después de la publicación de Cybernetics que los participantes de las conferencias le prestaron atención. Y aunque no es claro si Wiener ya relacionaba con información con entropía; si llego a comentar que la energía era un concepto inadecuado para estudiar la comunicación en los sistemas. En el segundo día de la primera conferencia Macy Bateson y Mead expusieron los conceptos de la equismogénesis y el deuteroaprendizaje, los cuales explicaremos en el siguiente capítulo. Bateson hablo además sobre los elementos necesarios para una adecuada estructura teórica en las ciencias sociales, y de la dificultad para describir los mecanismos de estabilidad en las culturas que había estudiado (Heims 1977). La discusión que siguió a la ponencia del antropólogo fue sobre la relación entre el sistema nervioso central con las computadoras (Montagnini, 2007). Wiener volvió a tomar la palabra para decir que el cerebro es una máquina que trabaja con información, y no con energía. Unos meses después de la primera reunión Wiener escribió un documento llamado “Time, Communication, and the Nervous System” y lo envió a los participantes de la conferencia por medio de McCulloch. En este escrito realiza el resumen de varias ideas sobre la teoría de la información, la ingeniería en comunicación, y la teoría del control en máquinas, con el cual hacia 86 un análisis de la biología, la psicología y las ciencias sociales. A su parecer todas estas disciplinas tienen como vínculo la comunicación, afirmaba: “The unifying idea of these diverse disciplines is the MESSAGE, and not any special apparatus acting on message” (Wiener citado en Heims, 1991, 22). Aunque el concepto de información ligado a la entropía fue desarrollado durante 1947, ya empieza a ser la idea central del trabajo de Wiener para, por un lado, tener un lenguaje formal común por el cual las diferentes ciencias pudieran ser investigadas, y por otro estudiar el aprendizaje y la adaptación de los organismos vivos y mecánicos a su ambiente. Después de la primera conferencia Macy y por sugerencia de Paul Lazarsfeld, Bateson organizo una conferencia especial con el fin de presentar el concepto de causalidad circular a los científicos sociales, y que la discutieran con Wiener y von Neumann. Esta tuvo lugar el 21 y 22 de Octubre de 1946, bajo los auspicios de la The New York Academy of Science. La novedad de la causalidad circular es que desafía a la causalidad lineal y a la dirección unidireccional característica de las explicaciones científicas, las cuales omitían deliberadamente las explicaciones teleológicas, por ello el tema de esa reunión fueron los mecanismos teleológicos en la sociedad. A está presentación asistieron Wiener y Rosenblueth quienes expusieron su teoría sobre el movimiento de los animales basado en la retroalimentación y su oscilación. También participaron Lawrence Frank, el neurocirujano William Livinsgton, el ecologista George Hutchinson, los sociólogos Talcott Parsons y Robert Merton, y del antropólogo Clyde Kluckhohn (Dupuy, 2009; Montagnini, 2007). La segunda conferencia Macy fue llevada a cabo en octubre de 1946, en ella se cambió el nombre oficial a “Teleological Mechanisms and Circular Causal Systems”. Después de esa reunión Frank arreglo un simposio en en el cual, “Norbert Wiener presented (probably for the first time, before a major scientific audience) a unified version of the theory emphasizing the key concepts of message, communication, information, feedback, automaton, and so on” (Dupuy, 2009, p. 72). Wiener progresivamente iba unificando los conceptos que había desarrollado en una sola teoría que tuviera como ejes la información y el feedback. Para la tercera conferencia Macy, organizada en marzo de 1947, Wiener acuña por vez primera el término “cibernética” para integrar estas ideas (Dupuy, 2009). En la cuarta conferencia asistió el psicólogo de la Gestalt Wolfgang Köhler a discutir con Wiener y McCulloch la propuesta teórica de la escuela de la Gestalt23. La quinta conferencia, en 1948, fue dedicada a examinar la estructura del lenguaje, para ello Bateson y Mead invitaron al 87 psicólogo Alex Bavelas, y a los lingüistas Dorothy Lee, Roman Jackobson y John Letz (Heims, 1991). En la sexta conferencia Macy llevada a cabo en 1949 arriba a EU desde Viena el ingeniero Heinz von Foerster24, quien es invitado por McCulloch a integrarse a las reuniones como relator y secretario (Pakman, 2006). De acuerdo a Umpleby (2015) fue Foerster quien sugirió cambiar el nombre de las oficial de las conferencias a “Cybernetics: Circular Causal and Feedback Mechanisms in Biological and Social Systems.”, en honor al libro de Wiener “Cybernetics: Or Control and Communication in the Animal and the Machine”. También debido a ese libro y a la publicación de Shannon la temática de las discusiones cambia del examen del feedback al estudio de la noción de información. En ese sentido McCulloch afirmo que la metáfora energética no era la correcta para estudiar las patologías del sistema nervioso central y que resultaba mejor la de información. Wiener por su parte sostuvo que la noción de información era mejor para estudiar a una máquina, al sistema nervioso central y que era compatible con la biología. Además presento su trabajo en prótesis médicas. Debido a ese cambio McCulloch invito a el matemático Claude Shannon a las siguientes dos conferencias Macy para hablar sobre su teoría de la comunicación. En la conferencia de 1950 Shannon presento su estudio sobre la redundancia en el idioma inglés, la redundancia es el la parte del mensaje que impone restricciones por medio de reglas de combinación, en el lenguaje ingles la aparición de ciertas letras más que otras en un texto, es decir, la probabilidad de frecuencia de las de letras aparezcan, lo cual es un factor de restricción al trasmitir información. Por ejemplo, es más frecuente o redundante la letra E que la letra Z; y es más frecuente que a una T le siga la H. En la octava conferencia de 1951 presento máquina para resolver laberintos llamado “Theseus”, el cual buscaba modelar el aprendizaje. Shannon también asistió a la décima conferencia. En la conferencia séptima también se discutió la distinción entre claves digitales y analógicas, ya que no había quedado claro para varios científicos sociales, entre ellos Bateson. Dicha división fue introducida por von Neumann en su participación inaugural en la primera conferencia. Los ingenieros de la reunión respondieron lo siguiente: “scientists and engineers labeled a system as ‘digital´ if it dealt with a signal or a numerical quantity in a discrete fashion and ‘analog’ if it dealt with them in a continuous fashion” (Kline, 2015, p. 47). Es decir, las máquinas digitales trabajaban con estados discretos de encendido y de apagado (on-off) como la 88 von Neumann, en Princeton; y las analógicas operaban con cantidades continuas como la de Vannevar Bush25. Debido a la atención del concepto de información en las últimas cinco conferencias Kline (2015) piensa lo siguiente: “In adopting the language and concepts of cybernetics and information theory, scientists turned the metaphor of information into the matter-of-fact description of what is processed, stored, and retrieved in physical, biological, and social systems” (p.6). Es decir, la información y su transmisión empezaron a utilizarse para describir fenómenos biológicos, mecánicos y sociales por los miembros de las conferencias Macy. Durante las reuniones Wiener ofreció tres sentidos para entender la información: 1) como una medida estadística que correlaciona mensajes y ruido; 2) como oraciones significativas y 3) la cantidad de información como la medida resultado de la elección entre mensajes posibles. (Kline, 2015). Por lo que era se hacía posible utilizarla en otros campos de investigación. Otros de los participantes significativos que asistieron a las conferencias fueron los psicólogos Leon Festiger, Donald G. Marquis, Theodore C. Schneirla, y Nathan W. Ackerman; el médico ingles W. Ross Ashby, y el crítico literario I. A. Richards26 (Heims, 1991). Es notorio que en la última reunión en 1953 von Neumann, Wiener y Lazarsfeld no asistieron. La ausencia de Wiener se debía a que terminó de relacionarse de manera definitiva con McCulloch y Walter Pitts en 1952 por razones personales al haber un malentendido entre ellos (Dupuy, 2009; Kline, 2015). 2.2.3 Metáfora y Modelo en las Conferencias Macy En este apartado se desarrolla la discusión la discusión que sostuvieron algunos de los miembros de las conferencias sobre el uso de las metáforas y la validez del uso de modelos teóricos en la ciencia. Desde el inicio la metáfora central de las conferencias Macy fue que el hombre es una máquina27. Ya en el artículo firmado por Rosenblueth, Wiener y Bigelow de 1943 se anunciaba el nacimiento de una ciencia que busca estudiar al hombre por medio de analogías formales tomadas de los procesos de las máquinas. Explicar el funcionamiento del sistema nervioso central usando el feedback negativo, el ver al cerebro como una computadora digital de acuerdo con McCulloch y Pitts; y el esfuerzo de von Neumann por entender el cerebro para poder diseñar maquinas computadoras más eficaces ilustran el uso de este metáfora y como permitió postular 89 hipótesis y explicaciones novedosas. Por ello Kline (2015) afirma lo siguiente: “The central analogy of cybernetics—that both humans and machines could be studied using the same principles from control and communications engineering—” (p. 152). Desde 1943 McCulloch y Pitts trabajaron en un modelo matemático que representaba el funcionamiento de las neuronas (Heims, 1975). Como lo dice Kline: “McCulloch and Pitts had made their reputation creating a logical model of the brain as a computer composed of digital neurons. Von Neumann and Bigelow had used this model to design and build the electronic computer at Princeton” (2015, p. 47). En su modelo del cerebro McCulloch propuso que este se componía de una red de neuronas ideales, y que cada una se comporta como una computadora digital que envía un impulso a su neurona vecina computado en 0 o 1, esto es, en términos de todo-o-nada. Él idealizó la anatomía y la fisiología del cerebro y la naturaleza de la mente de tal modo que ambos se podían explicar en términos computacionales. Como Dupuy advierte para McCulloch, “The brain is a machine and the mind is a machine, and the machines in each case are the same: therefore mind and brain are one and the same.” (2009, p. 54). Al introducir el formalismo lógico-matemático en el funcionamiento del sistema nervioso central, el cerebro era entendido como un computador digital y la mente el producto de los cálculos del cerebro. Por lo cual para McCulloch su modelo tenía una realidad ontológica, no solo heurística como pensaba von Neumann, quien sirviéndose de las ideas del neurofisiologo pudo diseñar computadoras digitales más avanzadas. Sin embargo los psicólogos Hans Teuber y Erick Erickson, quien fue invitado por única vez en 1948 por Bateson, y el neurofisiólogo Ralph Gerad se esforzaron en mantener presente que la metáfora no debía tratarse como realidad concreta, como también sugiere Turbayne (1970), y usarla con reserva para no cosificarla. En la reunión en 1950 Gerad discutió intensamente con McCulloch, von Neumann y Pitts. Pues la descripción del cerebro como una maquina digital no satisfacía a Gerad, quien expreso su crítica afirmando que simplificaba la totalidad del funcionamiento del cerebro y desestimaba la parte químico-biológica del mismo en su modelo. Bigelow contestó que era prioritario para los matemáticos e ingenieros concentrarse en las operaciones de computación parecidas a las que realizan las máquinas digitales, y por lo tanto ignorar la neurofisiología del cerebro. La explicación de McCulloch y Pitts de las neuronas, como advertía von Neumann, era en términos de neuronas ideales más no reales y por ello se podía tener ciertas licencias explicativas que omitieran la base real del cerebro. 90 También durante las conferencias se debatió la función de los modelos en la ciencia. Es oportuno recordar que desde 1933 Wiener y Rosenblueth discutían el método científico en el grupo de estudio con sede en la Universidad de Harvard. Ellos mismos publicaron un artículo con el título “The Role of Models in Science” en la misma revista donde lo hicieron en 1943. En dicho artículo afirman que por medio de la abstracción se remplaza el objeto de estudio por un modelo científico, al que clasifican en dos tipos: los modelos materiales y los modelos formales o intelectuales. El primero tiene la siguiente definición: “is the representation of a complex system by a system which is assumed simpler and which is also assumed to have some properties similar to those selected for study in the original complex system.” (Wiener & Rosenblueth, 1945, p. 317), el modelo, por tanto, debe ser más simple que el fenómeno original pero debe mantener propiedades similares específicas para que sea útil en la investigación científica, su función en consecuencia es principalmente didáctica. Además sirve para llevar a cabo experimentos por medio del él y así s epoda conocer más sobre el fenómeno modelado. La principal diferencia entre modelo material y el sistema original sólo en términos de escala, es decir de tamaño. Por otro lado el modelo formal se define así: “is a symbolic assertion in logical terms of an idealized relatively simple situation sharing the structural properties of the original factual system.” (Wiener & Rosenblueth, 1945, p. 317), este modelo se requiere de mayor abstracción ya que exige el uso lenguaje simbólico, esto es matemático, para representar relaciones ideales entre las variables; es pues necesario que el modelo mantenga isomorfia –estructura equivalente- con el sistema original para que tenga valor y utilidad científica. Para Wiener y Rosenblueth el conocimiento científico consiste en ir construyendo modelos preferentemente formales, pero también reconocían el valor de los modelos materiales. Los modelos tenían una gran importancia para este par de pioneros en la cibernética, pero aclaraban que un modelo, por acabado que sea, siempre es parcial e imperfecto por la imposibilidad del hombre de tener una aprehensión directa y univoca de la realidad y, por tanto, el conocimiento debe ser entendido siempre parcialmente. Es interesante advertir que la clasificación de modelos que proponen Rosenblueth y Wiener es notablemente parecida a la que realiza Black, pero se diferencian mínimamente en los criterios que fijan para su utilización. En la clasificación de Black (1962) los modelos a escala corresponden a los modelos materiales, y los modelos teoréticos corresponden a los modelos formales de Wiener y Rosenblueth (1945). 91 Para ejemplificar el uso de modelos materiales presentados en las conferencias Macy están el guante que ayuda a la audición de Wiener, el ratón electromecánico llamado “Theseus” de Shannon y la maquina homeostática de Ross Ashby. En 1948 Wiener empezó a desarrollar el esquema de una prótesis medica en forma de guante que ayudaría “escuchar” a las personas con problemas auditivos, el cual trasformaría las señales auditivas en vibraciones sensitivas que sentirían las personas en sus dedos (Kline, 2015). Por su lado el ratón de Shannon fue presentado en la conferencia de 1951, la tarea de “Theseus”, nombre con el que fue bautizado el autómata, era encontrar el “queso”, este era un objeto metálico, dentro de un laberinto. La posición del objetivo se podía poner en el lugar que sea dentro del laberinto y cambiar cada vez que el ratón tuviera éxito. El ratón recorría todos los espacios por medio ensayo del tipo prueba y error hasta que daba con el “queso” y después, gracias a una memoria, el ratón “recordaba” el camino hacia el objetivo evitando realizar todo el recorrido de nuevo. Este aparato mostró como a través del feedback las maquinas pueden aprender. Ross Ashby es invitado en 1952 por McCulloch, quien lo conoció en “Radio Club” en Inglaterra. El dispositivo de Ashby llamado homeostato trataba de modelar las capacidades del cerebro humano para adaptarse en al medio ambiente Este modelo ejemplificaba como un organismo cambia a su ambiente o se adapta a él usando el azar para reorganizarse, y así simulaba el funcionamiento del cerebro. En el mismo año de 1952 Ashby público “Desing for a brain” donde expone las características del homeostato considerado como un cerebro artificial. Rosenblueth (1955) confesaba años más tarde que para él, “las máquinas no sólo son modelos materiales para algunas funciones cerebrales, sino que constituyen también un modelo teórico” (p. 46). Esto es porque permiten entender el modo en cómo operan las funciones cerebrales al corporizar los procesos en las máquinas, por lo que no se limitan a tener una función didáctica, sino también explicativa. Por estas razones Kline (2015) piensa que de acuerdo con la clasificación que Black (1962) de los modelos, el ratón de Shannon sería un modelo analógico y la cibernética conceptualmente un modelo teorético La presentación de distintos conceptos de las Conferencias Macy por parte de varios investigadores de diferentes contextos académicos y disciplinarios, y que se agruparon la rúbrica de cibernética, y su discusión durante dichas conferencias tenían la ambición de crear una ciencia unitaria que tomara como principios ordenadores estos conceptos y así desarrollar un lenguaje 92 común, Años más tarde Rosenblueth (1955) diría que en la cibernética, “la heterogeneidad es más aparente que real; hay analogías formales y funcionales que proporcionan uniformidad.” (p. 33). Los conceptos estaban basados en analogías que se corporizaban en varios campos, de ahí su utilidad heurística para resolver diversos problemas y sugerir hipótesis novedosas. Y aunque el proyecto de desarrollar una ciencia unificadora no se llevó acabo dichos términos influyeron de manera significativa en muchas disciplinas como la ingeniería eléctrica, las ciencias de la computación la Inteligencia Artificial, las ciencias cognitivas, la robótica, la biología, la neurología, la sociología, la economía, la política, la psicología, la lingüística, la música, la arquitectura, la filosofía y la terapia familiar (Umpleby, 2015). Al término de las conferencias Macy la cibernética se desplego en varias tradiciones de investigación. El trabajo de los matemáticos John von Neumann y Wiener dio lugar a la computación, la robótica y la Inteligencia Artificial, y al progreso de la ingeniería eléctrica respectivamente. Las investigaciones de Warren McCulloch para entender el funcionamiento del sistema nervioso y las operaciones del cerebro desde la “epistemología experimental”, fueron seguidas por Heinz von Foerster; ambos, junto con junto Rosenblueth, fundaron en 1958 el Biological Computer Laboratory (BCL) en la Universidad de Illinois por el que pasaron las principales figuras de la segunda generación de cibernéticos como los biólogos chilenos Humberto Maturana y Francisco Varela, quienes se destacaron como investigadores sobre las bases biológicas cognición, y Gordon Pask,. Durante los años sesenta y principio de los setenta el BCL fue el principal centro de investigación en cibernética en USA. Durante casi veinte años Foerster dirigió el BCL y fue el principal teórico en cibernética de segundo orden, nombre con el diferencio en 1974 en un conferencia dictada en Filadelfia a la cibernética de primer orden, es decir, la cibernética de los sistemas observados, de la cibernética de segundo orden, esta es la cibernética de los sistemas observadores y que se caracteriza por considerar al observador dentro de la observación. El BCL cerró sus puertas en 1976 debido al recorte del gobierno a la investigación científica básica28; por lo que von Foerster decidió retirarse de la Universidad de Illinois y mudarse a California en el mismo año29 (Umpleby, 2015). Otra línea de investigación fue iniciada por Gregory Bateson y Margaret Mead, quienes introdujeron el enfoque cibernético en las ciencias sociales. Es la tradición que inauguro Bateson con distintos proyectos que usaron como premisas las categorías presentadas en las conferencias Macy la que nos interesa en el presente trabajo, y la que se examina en el siguiente capítulo. 93 Capítulo 3. Gregory Bateson: Historia de una Aventura Intelectual Now I a fourfold vision see And a fourfold vision is given to me Tis fourfold in my supreme delight And three fold in soft Beulahs night And twofold Always. May God us keep From Single vision & Newton’s sleep William Blake En el presente capítulo se despliega el recorrido biográfico y conceptual a través de la trayectoria intelectual de Gregory Bateson, quien, en palabras de Vargas (2004), “desempeñó un papel fundamental para llevar los conceptos de la cibernética a la explicación del comportamiento” (p. 7). Como acabamos de ver en el capítulo anterior, Bateson y Mead asistieron a las conferencias Macy, ellos fueron quienes iniciaron el traslado de los conceptos de la cibernética y de la teoría de la información para el estudio del comportamiento. Bateson al asimilar y usar estas herramientas teóricas inauguró el estudio del comportamiento desde la tradición cibernética por medio de una serie de investigaciones en antropología, teoría del aprendizaje, psiquiatría, comunicación, terapia familiar, etología, y epistemología. Marcelo Pakman, a su vez, afirma: A Gregory Bateson y Margaret Mead les ocupo llevar esta red de nociones al campo de las ciencias sociales. De ahí llegaría a la terapia familiar a través de los contactos de Bateson con el grupo que fundaría el Mental Research Institute (Pakman, 2006, p. 22) En el famoso proyecto de Bateson sobre las paradojas en la comunicación propuso la hipótesis del doble vínculo, lo que marcó el inicio del estudio de la etiología de la esquizofrenia desde un enfoque comunicacional e interaccional, lo cual provoco que uno de los miembros del “equipo Bateson”, Don Jackson, fundara un instituto, el Mental Research Institute, para investigar las enfermedades mentales desde ese enfoque. A su vez, uno de los proyectos del MRI, el Brief Therapy Center, integro el lenguaje formal desarrollado por Bateson para describir el proceso terapéutico y justificar su modelo clínico. 94 Por lo anterior, para comprender el traslado conceptual de los conceptos de la cibernética y de la teoría de la información al modelo del Brief Therapy Center, y reconocer la importancia del trabajo teórico de Bateson en dicho proceso, resulta necesario examinar como sus investigaciones sirvieron de puente entre los conceptos presentados en las conferencias Macy y el modelo clínico del BTC. Por lo que en este capítulo se pasa a describir diacrónicamente como los conceptos expuestos y discutidos en el segundo capítulo de información, mensaje, comando y reporte, codificación analógica y digital, redundancia, feedback, causalidad circular, homeostasis, calibración, además la teoría de los tipos lógicos y paradoja, y que conforman el universo conceptual del modelo del BTC, llegaron a la psicología clínica por medio de las investigaciones de Gregory Bateson y su equipo en forma de metáforas. En primer lugar se examinan los antecedentes intelectuales de Bateson: la influencia de su padre en su formación científica y filosófica, sus estudios en biología y sus principales aportes conceptuales a la antropología: la cismogénesis simétrica y complementaria, y el concepto de deuteroaprendizaje. Después se describe su participación en las conferencias Macy, y la relación que mantuvo con Norbert Wiener. Enseguida se señala el cambio profesional que realizo Bateson al pasar del estudio de las comunidades de Nueva Guinea a la comunidad de los psiquiatras a principios de los años cincuenta junto a Jurgen Ruesch, lo cual fue su primer intento de aplicar los conceptos ya citados para estudiar la comunicación y sus patologías. Enseguida se expone la manera en que influyeron los conceptos presentados en las conferencias Macy a Bateson para proponer un novedoso proyecto de investigación que tenía el objetivo de estudiar los principios y las paradojas de la comunicación; y que después le permitió formular la hipótesis interaccional de la etiología de la esquizofrenia conocida como doble vínculo. Después se examina como enriqueció su teoría del aprendizaje por medio de la teoría de la información. Y al final se presenta brevemente en que consiste la epistemología cibernética que él formulo en la última década de su trabajo, y la relevancia de esta en el ámbito terapéutico. A lo largo de esta exposición se apela a la creación de una unidad de sentido, por ello se intenta vincular la experiencia vital del Bateson junto con el desarrollo de sus ideas; esta tarea exige la descripción de los principales hechos biográficos y, al mismo tiempo, la discusión de los cambios teóricos de sus ensayos destacando los conceptos que recuperara el BTC para la fundamentación teórica de su práctica clínica. 95 3.1 Biólogo y Antropólogo Gregory Bateson nació 9 de mayo de 1904 en Grantchester, Inglaterra; fue el tercer hijo de William y Beatrice Bateson. William fue un importante biólogo que redescubrió y defendió el trabajo de Mendel cuando comenzaba a establecerse la ortodoxia Darwinista en la biología de su tiempo. Él pensaba que la mutación que demostró Mendel en sus experimentos, es decir, la discontinuidad entre las especies de guisantes en distintas generaciones, explicaba mejor el proceso evolutivo que la teoría de Darwin. William estuvo muy interesando en los problemas de la simetría, esto es la segmentación en los animales, y además es reconocido por ser quien acuño el término “genética”. La familia paterna de Gregory tuvo dos generaciones de académicos en la Universidad de Cambridge, caracterizados por su disciplina y ateísmo. Por lo que Gregory recibió una educación esmerada y aristocrática. Creció influido por las ideas de Jean-Baptiste Lamark, Samuel Butler y William Blake, y por la gran apreciación que sentía su padre por el trabajo científico y, sobre todo, artístico (Lipset, 1991). Los dos hermanos mayores de Gregory murieron tempranamente, el más grande, John, murió en acción durante la primera Guerra Mundial en 1918; mientras que Martin se suicidó de manera trágica por una decepción amorosa en 1922. De modo que Gregory, cuyo nombre se debe a la admiración que sentía su padre por Mendel, quedo como el único sucesor de la carrera científica de William Bateson, por ello primero estudio en 1922 ciencias naturales en Cambridge. Después, a los 21 años, tuvo la oportunidad de ir de viaje a las Islas Galápagos por la invitación de un griego millonario en 1925. Durante ese viaje tuvo contacto cultural con poblaciones de aquella zona diferentes a la suya. A su regreso a Inglaterra Gregory se interesó profundamente por el estudio de la antropología motivado por el encuentro con estas comunidades (Wittezaele y García, 1994) Gregory entonces le comunico a su padre el interés de cambiar de horizonte disciplinario basado en el argumento de dedicar su vida a una ciencia menos impersonal como lo es la vida en el laboratorio del biólogo. William, debido a su primera experiencia con su hijo Martin, quien deseaba ser artista y no se sintió apoyado por su él pues consideraba al arte como una actividad restringida para el hombre de basto talento y genio, decidió en cambio permitir a Gregory cambiar de carrera (Lipset, 1991). 96 En 1926 Gregory comienza a estudiar antropología en Cambridge bajo la tutela de Alfred C. Haddon; después inicia su trabajo de campo en el rio Sepik, de Nueva Guinea. Ahí conoce una serie de culturas que tenían poco contacto con la civilización Occidental, por ejemplo los baining tenían aún la práctica de cazar cabezas. Él joven antropólogo al inicio se sentía frustrado por no poder involucrarse en la vida de aquellas personas, pues lo excluían deliberadamente de los ritos y ceremonias importantes. Además se percató de la falta de rigurosidad en la metodología de investigación y en los instrumentos conceptuales para describir sus observaciones antropológicas. Después de estar entre los baining Bateson encuentra a los sulka, también habitantes en las cercanías del rio Sepik, unos meses después decide regresar a Inglaterra para escribir un informe. Al terminar vuelve a Nueva Guinea a realizar investigación de campo junto con los Iatmul para estudiar la formación y las relaciones de género entre ellos, ahí conoce casualmente a un par de antropólogos que hacían trabajo de campo en la misma área en 1932. El originario de Nueva Zelanda, Reo Fortune, y a su esposa americana Margaret Mead; ambos alumnos de Franz Boas. Los tres se sienten entusiasmados de encontrarse e interactuar con alguien familiar a su cultura después de pasar bastante tiempo en tierras extranjeras, por lo que pasan mucho tiempo platicando y analizando sus vidas, sus respectivos países y sus relaciones. Mead y Fortune introducen a Bateson en el estudio de la Gestalt, teorías psicológicas del aprendizaje y de la personalidad, y el psicoanálisis. Además leen y discuten ávidamente Patterns of Culture, que la misma Ruth Benedict les envía, y que influye de manera importante en la construcción de sus categorías de análisis para la organización sus observaciones antropológicas (Lipset, 1991; Wittezaele y García, 1994). Al regresar a Inglaterra y después de un tiempo de trabajo, en 1936 Bateson publica su primer libro como producto de la experiencia de campo llamado Naven: A Survey of the Problems Suggested by a Composite Picture of the Culture of a New Guinea Tribe Drawn from Three Points of View. El nombre del libro es el de un ritual realizado por los Iamul que hacen para celebrar el logro de un hijo de una hermana (laua) como matar a un forastero, cazar algunos animales, viajar a otro pueblo y regresar, casarse o ser poseído, o el de una hija como dar a luz a un niño. El ritual consiste en que el hermano de la madre (waus) se viste con ropa femenina y andrajosa, se nombra como la madre del laua y actúa de tal modo que caricaturiza la tradicional forma sumisa de ser de las mujeres Iatmul; mientras la tía (mbora) se viste con elegante ropa 97 masculina e imita las actitudes características de los hombres como sus peleas. La ceremonia podía tener un grado tal de inversión de papeles que la mbora simulaba tomar parte activa en el acto sexual y el wuau representar el alumbramiento de un niño (Berman, 1987). Bateson piensa que, “Naven was a study of the nature of explanation (…), it is an attempt synthesis, a study of the ways in which data can be fitted together, and the fitting together of data is what I mean by ‘explanation’” (1958a, p. 49-50), pues el estudio tiene tres niveles de análisis, en el primer nivel es etnográfico pues presenta el conjunto de las observaciones de la sociedad Iatmul; en el segundo la organización de los datos por medio de ciertas categorías como “ethos” y “eidos”; y por último discute la manera en que elaboro sus categorías de análisis, es decir, la forma en que llego elaboro los principios que guían su explicación. Desde estos tres puntos de vista el análisis del ritual y de la comunidad fue más profundo y, sobre todo, acercaba a Bateson al metaanálisis de la forma en que él formula y usa sus herramientas conceptuales, y a la naturaleza de la explicación, es decir, a cuestiones de tipo epistemológico. Uno de los términos antropológicos más relevantes que propuso en Naven y que le sirvió para explicar sus observaciones de las interacciones entre los habitantes de la sociedad Iatmul fue el de cismogénesis, el cual hace referencia al proceso social donde las interacciones acumulativas entre dos individuos tienden a aumentar un comportamiento específico y desencadenan un proceso de diferenciación progresiva30. Distinguió dos tipos de cismogénesis: la simétrica y la complementaria. En la primera dos grupos o personas intercambian el mismo comportamiento, pero con mayor intensidad en respuesta al otro; mientras en la cismogénesis complementaría el comportamiento de un grupo o persona alienta un comportamiento diferente, pero complementario, de otro grupo; e.g., en la pauta interaccional de dominación-sumisión, un comportamiento sumiso de A hace que B tenga una actitud más dominante. Ambos tipos de cismogénesis tienen en común la escalada por la acumulación progresiva de comportamientos cada vez más intensos. En caso de la cismogénesis simétrica aumenta la rivalidad entre las personas, y en el de la cismogénesis complementaría aumenta la diferenciación. Bateson se preguntaba el motivo por el que la sociedad Iatmul no explotaba y en cambio lograba cierta estabilidad. Aunque llego a sospechar que ambos casos de cismogénesis se complementaban equilibrándose a través de una relación funcional, nunca lo llegó a confirmar (Bateson, 1935). Al mismo tiempo, al término del trabajo de campo en Nueva Guinea Margaret Mead se divorcia de Reo y Bateson se regresa a su país de origen. Tiempo después Bateson y Mead se 98 reencuentran en Singapur, y se casan en 1936. Enseguida comienzan a trabajar juntos estudiando a las sociedades de Bali en Nueva Guinea hasta 1939. A ambos les preocupaba la manera de tomar datos en antropología, por lo que para mantener la mayor fidelidad posible en el reporte de sus observaciones crean una nueva metodología: mientras Mead hace entrevistas a los lugareños, Gregory toma fotografías y filma las prácticas de la comunidad. Con esto logran mostrar las secuencias interaccionales en las distintas actividades de los miembros de la cultura balinesa. De su intensa colaboración publican en 1942 Balinese Character: A Photographic Analysis. Dado que su estudio fue financiado para estudiar la demencia precoz (Lipset 1991), Bateson y Mead advierten que el carácter de los Balineses se parece formalmente al tipo de inadaptación esquizoide en la cultura Occidental; pero piensan que no tienen las clasificación adecuada para tipificar el carácter de los habitantes pues, de acuerdo a Ruth Benedict, las desviaciones de carácter son dependientes de cada cultura, pues la estructura de carácter normal de una cultura puede ser considerada desviada en otra. Lo que implica que hay cierto grado de estandarización en el carácter de una cultura particular, para que a partir de esa norma pueda manifestarse la desviación. Por lo que buscan métodos para describir el medio cultural donde se aprende el carácter, es decir, comienzan a estudiar el proceso de socialización en el que niño aprende a hacerse miembro de su cultura. Y, bajo el supuesto de que un adulto tuvo experiencias de niño similares a las de un niño de su comunidad, comienzan describir las secuencias interpersonales de comportamiento entre los niños y los miembros de su familia durante el proceso de aprendizaje. De ese modo se espera obtener la descripción relacional de la estructura del carácter y reconocer la función de la cultura en la formación de carácter de sus miembros. (Bateson, 1944) En 1942 Bateson (1942a) publica un primer esbozo de su teoría del aprendizaje, en ella intenta explicar cómo los hábitos de pensamiento son aprendidos. Los hábitos de pensamiento se encargan de puntuar las secuencias de hechos de tal modo que ordenen cierto contexto de percepción; por lo que diferentes hábitos de pensamiento muestran distintas formas de percibir las secuencias de comportamiento o lo que la Gestalt llama hábitos de ver un marco contextual de comportamiento, verbigracia, un perro en experimento de condicionamiento adquiere el hábito de puntuar y con ello ordenar la experiencia de tal modo que después del sonido de la campana empiece salivar. Para Bateson características como el libre albedrío, la dominancia, la pasividad, etc., son el resultado de adquirir el hábito de puntuar la corriente de eventos – 99 incluyendo el propio comportamiento- de una determinada manera y así percibir un contexto familiar en cada experiencia nueva. Los hábitos de pensamiento aprendidos se generalizan para organizar la corriente de experiencia. Para explicar estos hábitos de apercepción Bateson parte de los experimentos de aprendizaje de laboratorio y nota el fenómeno común en el que el sujeto experimental se hace más hábil en resolver una tarea similar después de varias repeticiones de experimentos, y se hace más capaz de resolver los problemas parecidos. El sujeto aprende a aprender. Al aprendizaje simple le llama proto-aprendizaje, y al aprendizaje que muestra un cambio respecto al aprendizaje simple le llama deuteroaprendizaje, en este, “the subject has acquired a habit of looking for contexts and sequences of one type rather than another, a habit of ‘punctuating’ the stream of events to give repetitions of a certain type of meaningful sequence.” (Bateson, 1942a, p. 173) El sujeto adquiere el hábito de buscar contextos y secuencias específicos, y el hábito de puntuar la corriente de eventos en un tipo de secuencia especifica. Lo que le ayuda, de acuerdo a los términos de la Gestalt, a buscar ciertos tipos de contextos de percepción. A partir de este marco propone una tipología de contextos de aprendizaje que originan hábitos de puntuación y apercepción distintos. En los contextos pavlovianos se espera que se adquiera el hábito de puntuar la secuencia de hechos de tal modo que las personas piensen que todos los eventos están predeterminados y sólo puede encontrar los signos de lo que pase, como el sonido de una campana, pero sin influir en la ocurrencia de dichos eventos, por lo que no les queda más que esperar. Este contexto de aprendizaje conduce a percibir lo que se podría denominar fatalismo. Mientras en los contextos de evitación instrumental Bateson vio como ejemplo la conducta de los habitantes de Bali, ya que los niños aprenden por medio de una serie de secuencias de provocación por sus madres, seguidas de falta de atención, que los actos hay que realizarlos por sí mismos, sin esperar una recompensa futura, pero que está influida por el miedo para evitar un desastre, como el acróbata que se balancea constantemente para no caer al vacío. Por lo que los contextos de aprendizaje pavloviano, de evitación o recompensa instrumental, aprendizaje memorístico o serial, y sus múltiples combinaciones dan lugar a distintos hábitos de percepción de la corriente de hechos; a organizar la experiencia de acuerdo a contextos específicos, y a actuar de acuerdo a estos. De acuerdo a esta teoría del aprendizaje, la cultura, al determinar la organización de los contextos de aprendizaje, determina no sólo el contenido del aprendizaje, sino en la forma en que 100 se trasmiten las pautas de interacción entre sus miembros, a partir de las cuales se organiza la experiencia, se conforma el carácter y se estructura la manera de ver el mundo. Bateson (1944) pensaba que al describir las secuencias interpersonales del comportamiento involucradas en los contextos de aprendizaje, se pueden obtener las definiciones operacionales de la sumisión, dominación, etc. Esta teoría permite entender la manera en que la cultura conforma el carácter de sus miembros, y se perpetua a ella misma, como producto de un proceso interaccional en los contextos de aprendizaje. A partir de esta teoría además planteo que las pautas que caracterizan la clasificación del comportamiento en pautas de cismogénesis simétrica y complementaria son aprendidas. Lo relevante del concepto de la cismogénesis es que representa el acercamiento a la explicación de la conducta de manera interaccional, es decir, explica que el comportamiento de un individuo está siempre en relación con el de otro (Berman, 1987; Wittezaele & García, 1994). Bateson continuo detallando y usando la cismogénesis como categoría de análisis para clasificar y comparar grupos, culturas y países (véase Bateson, 1942b; Bateson, 1949). Del mismo modo su teoría del aprendizaje es interpersonal ya le permite explicar la formación de carácter como producto de la socialización por medio de contextos de aprendizaje. Y que es justo por el estudio del carácter adquirido por medio de contextos repetidos de aprendizaje, y a sus perturbaciones, que Bateson se comenzó a deslizar del terreno de la antropología a la psicología, y a estudiar las patologías derivadas de ciertas secuencias de interacciones. Por todo lo anterior la labor antropológica de Bateson se caracterizó desde el inicio por su enfoque naturalista, interaccional y contextual para la explicación del comportamiento, ya que se ocupó más del aspecto relacional que del simbólico de una cultura. También es notable que pusiera más atención al modo por el cual se trasmiten las pautas de conducta en el proceso del aprendizaje, que del contenido del mismo. Ambos hábitos intelectuales los mantendrá en todas sus investigaciones posteriores y caracterizaran su manera de organizar los datos con los que trabaja. La primera hija de Mead y Bateson nace en Nueva York en 1939, mientras Gregory estaba en Inglaterra buscando la manera de prestar servicio durante la guerra en su país de origen; la nombran Mary Catherine Bateson. En 1944 Bateson es enviado al Pacifico por EU (Lipset, 1991). 101 3.2 Participación en las Conferencias Macy31 Antes de partir a la guerra Bateson, invitado por Lawrence Frank, asiste en 1942 a la reunión titulada “Cerebral Inhibition” organizada por la fundación Macy (Heims, 1991). Frank fue alumno del filósofo John Dewey, quien fue alumno del representante del pragmatismo anglosajón William James32. Frank era en esos años el secretario ejecutivo de la Fundación Macy y también dirigía el Departamento de Relaciones Sociales de Harvard. Durante los veranos la familia Bateson se trasladaba a New Hampshire donde convivían junto con otros científicos sociales convocados por Frank, pues era un entusiasta partidario del trabajo interdisciplinario. En 1942 Bateson y su familia se mudan a la planta baja de la casa de Frank, en el número 72 de la calle Perry, Greenwich Village, Nueva York. Durante los años de la guerra, mientras Bateson estaba en actividades de inteligencia militar, Frank invita a Mead y Catherine a vivir ahí junto con su joven esposa Mary y sus seis hijos, conviviendo ambas familias cercanamente (Bateson, 2004)33. En la reunión de 1942 Bateson conoce a Warren McCulloch (Bateson, 1971j). Y además tiene contacto por primera vez con el concepto de feedback negativo presentado por Rosenblueth, el cual representa un giro teórico para entender el comportamiento intencional (teleológico). Bateson se emociona con estas esas ideas al grado en que durante el tiempo en que estuvo en la guerra pensó constantemente en ellas para su posible utilización en las ciencias sociales (Lipset, 1991). De acuerdo con Price (1998) Bateson trabajo para la Office of Strategic Services, (Oficina de Servicios Estratégicos) (OSS) durante la Segunda Guerra Mundial en la primera mitad de la década de los 40’s. Esta oficina era una agencia de inteligencia militar estadounidense. En la India, China, Burma y Ceylon su labor como antropólogo cultural era entender al enemigo y generar estrategias para vencerlo. Una de sus actividades fue la de realizar anti-propaganda para los ciudadanos de Japón y así disminuir su moral nacional34. En general Bateson se sentía insatisfecho por la débil estructura teórica de la antropología inglesa. Por ello buscaba herramientas conceptuales de otros campos para tratar los datos generados de sus observaciones etnográficas de manera científica y rigurosa. Lo que le llevo después de regresar de la guerra en 1945 a insistir a Fremont-Smith para que se reanudasen las conferencias sobre los conceptos que presento Rosenblueth en la reunión de 1942 (Brand, 1976). 102 Tanto Mead como Bateson pensaban que las ideas de la cibernética podrían servir para darle la rigurosidad de las ciencias físicas a las sociales (Kline, 2015). Por su parte Bateson quería aclarar su idea sobre la causalidad circular, pues creía podría ser un concepto central en las ciencias sociales (Montagnini, 2007). Recordemos que de su trabajo con los Iatmul advirtió que el proceso de diferenciación progresiva al que llamo cismogénesis tenía que llevar a la destrucción del sistema social, sin embargo de alguna manera, que aún no lograba explicar, la sociedad Iatmul lograba alcanzar un estado de equilibro. Bateson además buscaba conceptos que le permitieran un mayor grado de abstracción y generalización de sus observaciones (Heims, 1991). Por estos motivos en 1946 Bateson y Mead se reintegraron a las reuniones financiadas por la fundación Macy, donde conoció el trabajo de los matemáticos Norbert Wiener y John von Neumann. En la primera conferencia Macy Después den 1946 Wiener presenta la teoría de los tipos lógicos de Russell y las paradojas generadas por la confusión entre miembros y clases, esta teoría metamatemática se vuelve tan importante para el pensamiento de Bateson que la utiliza de manera sistemática en toda su obra posterior para organizar en jerarquías la comunicación, el aprendizaje35 y la mente. En la misma reunión conoce la distinción entre las claves digitales y las analógicas introducida por von Neumann y Wiener (Lipset, 1991). Bateson asiste a todas las conferencias y va adquiriendo y asimilando una serie de conceptos presentados en las mismas. La suma de los conceptos que conoció en las conferencias fueron los siguientes: The difference between “analogical” and “digital” processes, coding, circuits, servomechanisms, positive and negative feedback, time series, measure of information and its relation to entropy, binary systems, Russell’s Theory of Logical Types, “pathological” oscillations induced in a computer confronted with a Russellian paradox, the idea that the crucial concept to use in understanding communication systems is “information” and not “energy,”. (Heims, 1977, p. 145). De todo ese bagaje conceptual Bateson principalmente estudio y utilizó las claves analógicas y digitales, la retroalimentación negativa, la noción de información y la teoría de los tipos lógicos de Russell, las paradojas, y asociados a estos la causalidad circular, el control, la 103 homeostasis y el comando y el reporte. El origen y presentación en las conferencias Macy de dichos conceptos ya lo detallamos en el segundo capítulo. Por lo que ahora nos proponemos explicar cómo es que Bateson se apropió de ellos y los traslado para el estudio de la comunicación y de la esquizofrenia, y la propuesta de la epistemología cibernética. Después de ese primer acercamiento Bateson se entregó a la tarea de entender los conceptos y ver de qué modo los podría usar en su trabajo, pero teniendo presente que no serían matemáticamente aplicables. Como lo comenta Heims (1977): “Bateson understood relatively little mathematics; his interest was in the concepts from logical and mathematical theories which he could use, as metaphors or in a heuristic way, to formulate conceptual schemes in the behavioral and social sciences” (p. 146). De este modo los conceptos tendrían que ser usados como metáforas para estudiar la conducta desde una nueva perspectiva: la cibernética. Se impone desde ahora una aclaración: el préstamo de los conceptos no fue siempre del mismo modo en toda la obra de Bateson. Durante su vida profesional y sus publicaciones ha variado el modo en las utiliza y la prioridad de cada uno de ellos. Por lo que debido a los fines que tiene este trabajo el seguimiento teórico que se hace de las ideas de Bateson, aunque es cronológico, no llega a ser exhaustivo. Lo que se busca más bien es que dependiendo del proyecto en él trabaje Bateson se evidencie el modo en que los conceptos son utilizados como metáforas. En su deseo de comprensión, Bateson se acercó a von Neumann y a Wiener para consultarlos sobre la aplicación de sus conceptos en su propia investigación. Con von Neumann el trato fue poco fructífero, pues el formalismo matemático con que se manejaba Neumann le impedía seguir su explicación. Hay que precisar que el interés de Neumann estaba en innovar la tecnología en las computadoras con fines militares. Su participación en las conferencias se justificaba por el deseo de intercambiar ideas con los fisiólogos –sobre todo con McCulloch- para servirse de las analogías entre el sistema nervioso y las computadoras digitales, y mejorar así el funcionamiento de estas últimas de acuerdo con el conocimiento del funcionamiento del cerebro. Por lo que el trato con el antropólogo no era prioritario para sus objetivos. En cambio la relación entre Bateson y Wiener fue larga y fecunda. Heims (1977) afirma que ambos tenían una serie de similitudes como su formación interdisciplinaria y su disposición por trabajar con expertos de otros campos. Además sentían una gran insatisfacción con la alta especialización en un campo y buscaban superar la departamentalización del conocimiento. El 104 mismo Wiener (1998) se lamentaba de esto afirmando que, “Desde tiempos de Leibniz no ha existido probablemente nadie con semejante dominio sobre la actividad intelectual de una época.” (p. 24). Así Wiener estaba interesado en más ciencias además de la matemática, y prefería trabajar en las regiones límites de la ciencia, como lo ejemplifica su constante colaboración con Rosenblueth en fisiología. Wiener al mismo tiempo pensaba que las ideas de la cibernética podían servir como base teórica de una nueva ciencia unificadora. Por lo que Wiener creía que todo podía estar conectado y podía ser explicado bajo los mismos principios formales; lo cual era compartido por Bateson. Ambos mantenían una postura holística e interdisciplinaria de la ciencia (Heims, 1975). En los escritos de Wiener (1989) es notable su conocimiento de varias disciplinas científicas y la búsqueda de integrarlas a través de los principios de la cibernética; por su parte en un ensayo Bateson escribía lo siguiente: I picked up a vague mystical feeling that we must look for the same sort of processes in all fields of natural phenomena—that we might expect to find the same sort of laws at work in the structure of a crystal as in the structure of society. (…) I believe that the types of mental operation which are useful in analyzing one field may be equally useful in another—that the framework (the eidos) of science, rather than the framework of Nature, is the same in all fields (Bateson, 1941. p. 84) Gregory Bateson pensaba, al igual que su padre, en problemas de simetría y regularidades formales, por lo cual creía que había una estructura que se corporizaba en varios escenarios de la ciencia a través de un proceso común y formal. Para él los fenómenos naturales y sociales tenían la misma estructura y por lo tanto podía pensar con las mismas herramientas conceptuales sobre su funcionamiento y organización, usando los conocimientos de un campo más familiar (el biológico), o más establecido (la cibernética y la teoría de la información) para conocer otro que se desee estudiar, en su caso las ciencias del comportamiento y la comunicación. Dicha fe mística en una unidad subyacente facultaba a Bateson para utilizar conceptos de un campo en otro en función de analogías formales o isomorfismos. En coherencia con su postura consideraba la investigación interdisciplinaria como la observación de analogías formales en las relaciones que se dan en diferentes ciencias, decía: “if we think first of the relationships and consider the relata as defined solely by their relationships, then we begin to wonder” (Bateson, 1972, p. 164). 105 Para Bateson siempre fue más importante la forma, la pauta y la relación, antes que el contenido, y los datos. Esto representa una forma de realizar investigación interdisciplinaria que busca la observación de relaciones, procesos y estructuras en diferentes casos, lo que le permitía proponer conceptos con un alto grado de abstracción para explicar todo los casos bajo ideas formales. Por todo lo anterior para Wittezaele y García (1994) la abducción es la operación intelectual característica de Bateson, la abducción, según ellos, es un, “razonamiento por analogía; después de haber puesto en evidencia cierta estructura relacional que explica la evolución de un fenómeno, se buscan otros conceptos que revelen el mismo tipo de estructura” (p. 49). Pues como acabamos de señalar Bateson siempre estuvo atento a la organización formal de los fenómenos y así poder conocer a otros con la misma estructura por medio de analogías. En 1976 Bateson al volver a reflexionar sobre su labor intelectual, definió la abducción de la siguiente manera: “’Abduction’ was a Pierce’ word for that part of the process of inquiry which proposes that given set of phenomena is a case under some previously proposed rule” (p. XII). Sin entrar en muchos detalles la abducción, entendida por Bateson, es que dado un caso que al que se le quiere dar explicación se puede hacer uso de otro caso que se supone tiene las mismas reglas, de ahí que como requisito debe existir isomorfismo estructural entre ambos dominios. Es importante recordar llegados a este punto en este trabajo se busca utilizar la herramienta conceptual de la metáfora, estudiada en el primer capítulo desde los aportes de Black y Hesse, para justificar el traslado progresivo de los conceptos de la cibernética y la teoría de la información a los distintos estudios que llevo a cabo Bateson a lo largo de su carrera profesional, para después mostrar en el último capítulo como estos conceptos trabajados por Bateson fueron retomados por el MRI para desarrollar la base teórica de su modelo terapéutico. Vale la pena recordar que tanto Black (1977) como Hesse (1966) insistían en la importancia de la analogía en el funcionamiento de las metáforas en la ciencia, y además Black (1962) sostenía que el uso de modelos requería isomorfismos formales entre dos dominios de conocimiento para poder usar el lenguaje del dominio más conocido en el que se desea conocer, y así poder proponer explicaciones causales y realizar hipótesis o predicciones sobre este último36. Ejemplo de los hábitos conceptuales de Bateson es que en Naven se sirve de la estructura formal procedente de la biología de la división y diferenciación de los organismos para explicar la estructura social de los Iatmul. Bateson (1941) usa como modelo los tipos de diferenciación animal para resolver un problema de carácter social pues sostiene que la sociedad Iatmul estaba 106 organizada de tal manera que cuando se dividía un grupo, el nuevo clan imitaba las costumbres y cultura de su clan de origen, de la misma forma que en los animales con simetría radial todos los segmentos alrededor de un centro son iguales. Mientras en el caso de la sociedad Occidental, la diferenciación es metamérica, es decir, la segmentación es trasversal, pues la división de grupos o individuos va seguida de una ruptura con la cultura anterior y la creación de nuevas costumbres. Wiener y Bateson compartieron además su evaluación sobre la Teoría de Juegos de von Neumann y Morgestern. En su ensayo sobre Bali Bateson (1949) incorporó la teoría de juegos de para comparar la cultura Iatmul y la Balinesa. Afirmaba que los jugadores ideales de Neumann “jugaban” bajo la premisa de maximizar sus ganancias sin tener la capacidad de aprender nuevas cosas; por lo que no era una manera adecuada de explicar el comportamiento de las personas. Con ello Bateson cuestiona la premisa de la teoría de juegos de que todo sujeto busque maximizar una variable para llegar al clímax, usando como contraejemplo la formación del carácter y las costumbres de los Balineses. El sistema de valores de Bali no busca maximizar ninguna de sus variables sociales como el dinero, el poder, o el prestigio, sino más bien buscaban mantener la estabilidad. En la educación de los niños la madre después de una interacción acumulativa iniciada por ella siempre frustraba el clímax. Por ello la metáfora que Bateson utiliza para explicar el modo de vida de los balineses es la del equilibrio que logra un artista por la postura de su cuerpo por medio del movimiento continuo; de igual modo en las actividades comerciales y artísticas lo importante es la estabilidad obtenida por el movimiento constante. El ethos balines sirve de cuestionar el supuesto de la teoría de que todas las personas actúen para maximizar una variable, ya que ejemplifica una comunidad que busca la estabilidad y que es diferente a los sistemas esquimogénicos como la Iamul y la Occidental. Como consecuencia de este sistema la comunidad de Bali enseña a los niños a hacer una acción por el gusto de hacerla, sin que el objetivo sea obtener una ganancia futura; y privilegian un modo de vida estético a uno de enriquecimiento y acumulación constante de ganancias. Estudiar a la comunidad de Bali le permitió a Bateson poner en duda la idea de que todas las sociedades buscan llevar al clímax sus interacciones acumulativas, esto es, que todos los hombres se organicen por medio de la cismogénesis, y más bien mostrar que es una característica cultural aprendida. Por su parte la crítica de Wiener era que la teoría de juegos podía ser usada con fines militares y podía llevar en consecuencia a conflictos más agresivos entre las naciones. 107 En relación a esto último la actitud de alarma y desaprobación ante el uso del conocimiento de la ciencia –sea matemática o social- con fines bélicos era compartida también por el matemático y el antropólogo. Bateson lo hace evidente cuando se preguntaba de manera retórica –casi irónica: “Are we to reserve the techniques and the right to manipulate people as the privilege of a few planning, goal-oriented, and power-hungry individuals, to whom the instrumentality of science makes a natural appeal?”, (1942a p. 169). De este modo criticaba el uso de las técnicas y conocimientos de las ciencias sociales en favor de la ingeniería social y la manipulación de las comunidades, ya que eso va en contra de los valores de la democracia. Mientras Wiener (1989) se negó después de la guerra a dar más información de su trabajo en misiles pues temía su uso para fines armamentistas; y juzgaba a los matemáticos que sostenían que su trabajo era ajeno a cuestiones morales por dedicarse a la matemática pura, aún dentro de proyectos militares37. Todas estas afinidades intelectuales y éticas entre ellos hicieron que Bateson llegara a solicitar a Wiener aplicar las matemáticas y su poder predictivo en las ciencias sociales, (lo que Black (1954) llama modelado matemático38); pero Wiener mostró escepticismo de dicha operación pues objetaba la falta de objetividad en la recolección de datos de las ciencias sociales, “sin la ventaja de contemplar a sus sujetos desde la distancia intangible de la eternidad y la ubicuidad” (Wiener, 1998, p. 214); es decir, sin objetividad, como sí lo hace a su juicio el físico y el matemático. Además, les señalaba la falta de estabilidad en sus datos estadísticos: “Por lo tanto, las ciencias humanas constituyen un mal campo de verificación de la técnica matemática” (Wiener, 1998, p. 50)39. Sin embargo, la reserva de Wiener sobre el optimismo del antropólogo para utilizar la cibernética en las ciencias de la conducta no devenía en negación. Si bien Wiener desconfiaba de la aplicación matemática de la cibernética a las ciencias humanas, al mismo tiempo animaba hacer el traslado de los conceptos de la cibernética por medio de conceptos formales. Tanto Wiener como Bateson se esforzaron por traducir los formulas de la ingeniería de la comunicación en forma semántica para aplicarlos como metáforas en otras disciplinas científicas. Wiener reconocía que la aplicación de sus conceptos a otras áreas requería considerar ciertas limitaciones ya que propiamente son conceptos matemáticos, y por lo tanto necesariamente había cierta vaguedad en el traslado de esas nociones simbólicas a expresiones semánticas formales. Pero como bien enfatiza Heims (1977): “But like Bateson, Wiener used metaphors from the 108 mathematical sciences to devise conceptual schemes for behavior” (p. 147). La misma opinión tienen Wittezaele y García (1994) sobre este tema: “aunque el nivel de análisis de los fenómenos humanos casi no permite un uso directo de los conceptos cibernéticos. Bateson velara porque las metáforas utilizadas sean formalmente compatibles con los nuevos fundamentos de las ciencias duras.” (p. 100). Como vemos, tanto Wiener como Bateson estaban de acuerdo en la posibilidad del traslado de los conceptos de la cibernética a las ciencias de la conducta de manera rigurosa en forma de metáforas. Para realizar dicho traslado Wiener y Bateson mantuvieron comunicación constante por vía epistolar y visitas informales después de la primera conferencia Macy. Bateson consultaba frecuentemente a Wiener sobre el uso de las ideas tomadas de la cibernética en el estudio del aprendizaje, la comunicación y la psiquiatría. Al respecto Wiener incluso creía apropiado revisar el psicoanálisis en términos de la información, comunicación, retroalimentación, y sistemas: “At the first conference, in March 1946, Wiener criticized the Freudian notion of libido as inappropriate and argued that ‘information’ is a more suitable basic concept for describing psychological events” (Heims, 1991, p. 146). Es importante advertir que es Wiener quien sugiere cambia la metáfora energética de Freud por la noción de información en la historia de la psicología40. Y es el mismo Wiener quien animaba a Bateson para realizar dicha empresa. Antes de describir detalladamente el paso de la metáfora de la energía a la metáfora de la información para el estudio de la comunicación y el comportamiento que realiza Bateson, vale la pena describir cómo es que el antropólogo replantea la explicación que ofreció en Naven de la sociedad Iatmul las novedosas premisas que aprendió en las conferencias Macy. Cómo Bateson reconoce: antes de 1942, “I knew nothing of cybernetics beyond the positive feedbacks of schismogenesis. Negative feedback, information theory, and all that were to me unknown” (Bateson, 1978, p. 198). Sin embargo, en otro lugar agrega: “The writing of Naven had brought me to the very edge of what later became cybernetics, but I lacked the concept of negative feedback” (Bateson, 1971j, p. XI). En efecto, los estudios en antropología que realizo Bateson lo llevaron a reconocer la retroalimentación positiva por medio del cambio progresivo en las pautas de interacción que desencadena la cismogénesis simétrica y complementaria. Bateson se preguntaba porque la sociedad no explotaba debido al aumento progresivo de la cismogénesis; al respecto en un artículo de 1935 escribía: “the differentiation or split between the groups increases progressively toward either breakdown or a new equilibrium.” (Bateson, p. 109 77), la diferenciación a la que se refiere es la producida por el aumento de la equismogénesis simétrica y de la completaría entre dos culturas, dicha diferenciación debía llevar necesariamente al colapso del sistema o a un nuevo equilibrio, a menos que existieran factores que restringieran a ambos tipos de cismogénesis. Bateson hipotético que ambos tipos de cismogénesis de algún modo se equilibraban, pero advirtió la importancia de investigar los factores restrictivos que evitarían que un sistema llegue al colapso. Con estas palabras se anticipaba por 10 años a las herramientas conceptuales que conocería en las conferencias Macy, y que le permitirán explicar esos factores de control. Los cuales son el feedback negativo, la causalidad circular, y los circuitos autocorrectores41. En primer lugar redefine la cismogénesis como un circuito regenerativo; en el caso de la equismogénesis simétrica se comporta de la siguiente manera: “A regenerative or "vicious" circle is a chain of variables of the general type: increase in A causes increase in B; increase in B causes increase in C;.. Increase in N causes increase in A.” (Bateson, 1949, p. 117), esto significa que la acción de un sujeto A desencadena la misma reacción, pero más intensa en B, a la cual A responde con mayor potencia, como es una competencia, hasta generar una escalada que lleve a la explosión del sistema o su agotamiento por la falta de energía. Mientras en la equismogénesis complementaria, la acción de dominio de A, desencadena una acción de sumisión de B, a la cual A responderá con una conducta aún más dominante que la anterior, aunque ambas conductas se complementan, progresivamente se van diferenciado hasta llegar a la fuga del sistema. Si sólo ocurriera ese tipo de retroalimentación la sociedad explotaría por una diferenciación o rivalidad excesiva. Sin embargo, Bateson introduce el concepto de circuito auto- correctivo como modelo conceptual para explicar porque la sociedad Iatmul no sólo no explota, sino que se mantiene estable. Los circuitos auto-correctivos o degenerativos se caracterizan por buscar estados estables (steady states) por medio del feedback negativo, de modo que un incremento en una parte del circuito implica una disminución en otra parte. Al sustituir el equilibrio dinámico por la auto-corrección Bateson se preguntó cuál es la acción correctora que sirve como feedback negativo para contrarrestar las tendencia a la fuga de las interacciones simétricas y complementarias y así le dan estabilidad a la sociedad. La respuesta fue el ritual Naven, este ritual cumple la función regulatoria de complementar las pautas de interacción simétricas de la comunidad Iatmul, pues hace por un lado disminuir la rivalidad simétrica entre 110 los clanes, y por otro lado permite a las mujeres cambiar su rol complementario, rígidamente sumiso, por el de los hombres y pasar a ser ellas las dominadoras durante la ceremonia, atenuando así las tensiones en las relaciones entre ambos sexos. De ese modo los Iatmul deben aprender pautas simétricas y complementarias en determinadas secuencias, de modo que ante tendencias simétricas se activen procesos en la dirección opuesta como acción correctora, como el Naven, que sirve como mecanismo de control en la sociedad Iatmul (Bateson, 1958a; 1959). Para Bateson conocer las ideas de la cibernética significó uno de los acontecimientos más importantes de su vida, al grado de declarar: “I think that cybernetics is the biggest bite out of the fruit of the Tree of Knowledge that mankind has taken in the last 2000 years.” (Bateson, 1971c, p. 481). Bateson comienza a replantear sistemáticamente los problemas que investiga utilizando como premisas las categorías que aprendió en las conferencias Macy, no con el fin de ofrecer nuevas respuestas, sino de plantear nuevas preguntas. Durante su trayectoria el antropólogo siempre reconoció la influencia y la procedencia de los conceptos de la cibernética en su investigación. De este modo abraza las ideas de las conferencias y las comienza a utilizar para trasladarlas de manera formal en el estudio de la comunicación, el aprendizaje, la etiología de la esquizofrenia, la etología de los delfines, y. en la última etapa de su carrera, para proponer una epistemología basada en la síntesis de ideas cibernéticas y ecológicas. A continuación se describe el progresivo traslado de las ideas de la cibernética a las ciencias de la conducta realizado por Bateson. 3.3 Teórico de la Comunicación Al mismo tiempo de su regreso de la guerra a EU en 1945, Bateson se siente desalentado por su participación en el conflicto e inicia un proceso analítico con la junguiana Elisabeth Hellersberg. En 1946 se vuelve profesor de antropología en la Universidad de Harvard, en Cambridge, y en la New School for Social Research de New York. En 1949 se divorcia de Margaret Mead y Bateson decide mudarse a California al no haber sido renovado su contrato en Harvard, instalándose en la clínica psiquiátrica Langley Porter, en San Francisco, invitado por el psiquiatra suizo Jurgen Ruesch desde 1948 a un proyecto financiado por U.S. Public Health Service, para estudiar la comunicación entre los psiquiatras en calidad de investigador asociado. En 1949 también comienza a trabajar como “etnólogo” en el Veterans Administration Hospital (Hospital de la Administración de Veteranos) en Menlo Park, Palo Alto, hasta 1963. Ahí también 111 daba clases a los estudiantes de psiquiatría de antropología cultural (Harries-Jones, 1995; Lipset, 1991). Después de haber asistido al primer ciclo de conferencias Macy, Bateson encuentra el escenario donde puede emplear las categorías que aprendió en las reuniones para estudiar la comunicación en el contexto psiquiátrico, por ello al parecer de Wittezaele y García (1994) el trabajo junto Ruesch significa para Bateson, “intentar una primera aplicación, al mundo de las ciencias humanas, de las ideas desarrolladas durante las conferencias sobre la cibernética.” (p. 97). En el mismo sentido Lipset (1991) comenta que, “el psiquiatra y el antropólogo estaban ampliando las ideas embrionarias de Norbert Wiener sobre la pertinencia de ideas formales acerca del intercambio de información en el campo de la comunicación” (p. 211). Las herramientas conceptuales recién adquiridas por Bateson en las conferencias Macy le interesaron a Ruesch, y juntos buscaron utilizarlas en las ciencias de la conducta para tratar el problema de la comunicación psiquiátrica y sus disturbios. Esa sería la primera disciplina en donde Bateson utiliza el lenguaje de la cibernética para explicar sus observaciones, para examinar el psicoanálisis, la comunicación entre psiquiatras, y el proceso terapéutico. Es importante considerar que en ese tiempo las explicaciones de la psicología americana eran principalmente de corte behaviorista y psicoanalista. Por ejemplo, en las conferencias Macy al psicoanálisis ortodoxo estaba representado por Lawrence Kubie, mientras que Warren McCulloch defendía el enfoque biológico para tratar los problemas psiquiátricos y era demás un agudo crítico de la validez científica del psicoanálisis (Heims, 1991). Por otro lado Frank Fremont-Smith, Lawrence Frank y Margaret Mead impulsaban la “World Federation for Mental Health”, cuya misión era desarrollar un programa que permitiera a la comunidad mundial vivir en paz después de la guerra (Dupuy, 2009). Bateson, con otro tipo de formación y apoyado en los conceptos de que aprendió en las Conferencias, comienza a realizar un tratamiento original de los problemas de la psiquiatría. Como resultado de este esfuerzo en 1951 publica junto con Ruesch Communication: The Social Matrix of Psychiatry, en el cual realizaron la primera síntesis entre las ideas de la psiquiatría, la antropología y la psicología, junto con los conceptos de la cibernética y la ingeniería de la comunicación. En este trabajo Bateson va trazando distinciones conceptuales y hábitos de pensamiento que con el tiempo se volverán muy importantes para sus posteriores investigaciones, por ello resulta provechoso valorar los aportes teóricos de este este libro. 112 La misión del estudio era la siguiente: “conceptualize interpersonal and psychotherapeutic events by considering the individual within the framework of a social situation” (Ruesch y Bateson, 1951, p. 3). Bateson y Ruesch buscaban principalmente la creación de una teoría unitaria de la comunicación en donde el individuo este situado dentro de un grupo de interacción o, como lo llamarón, una matriz social; y de ese modo analizar el proceso terapéutico desde un enfoque interpersonal y contextual. Ambos consideraban que el examen de los procesos de emisión, trasmisión y codificación de la información, resultan de gran interés para el psiquiatra, pues es uno de los campos donde se presentan mayores disturbios en la comunicación entre las personas, sobre todo en los problemas psiquiátricos. Al mismo tiempo tenían el objetivo de analizar las premisas más generales de las ciencias sociales. Es importante advertir que Bateson comienza estudiar el comportamiento como un intercambio de información, y a los problemas psiquiátricos como producto de disturbios en el proceso comunicativo. Su metodología consistió en llevar a cabo entrevistas formales e informales a los psiquiatras; asistir a reuniones psiquiátricas y e ir a terapia como pacientes. Sin embargo, estudiar de manera científica la forma en que las personas se influyen mutuamente implicaba examinar la comunicación interpersonal a través del examen del lenguaje verbal, y además los gestos corporales y las inflexiones en el tono de la voz. Dado que iban a estudiar la comunicación y su transmisión utilizan el concepto de codificación para denotar la sustitución de un tipo de evento por otro, o mejor dicho, la trasformación de un evento por otro, pero manteniendo las mismas relaciones formales. En oposición a la codificación está el ruido, el cual imposibilita la transmisión de un mensaje. Bateson distingue, siguiendo a los ingenieros, tres tipos de codificación: la digital, la analógica y la Gestalt. En la digital la codificación difiere mucho entre el contenido externo y el interno de la maquina computadora. La codificación analógica es aquella donde hay un modelo de representación del suceso externo dentro de la máquina. Y la codificación Gestalten se caracteriza por identificar relaciones formales entre los fenómenos o eventos del mundo externo y clasificarlos después en grupos por medio de categorías formales. A Bateson le resulta plausible que el hombre codifique y piense en términos de las Gestalten, es decir, que lo que se perciba como cosas concretas sean en realidad diferencias, relaciones y cambios, y que sólo al final de ese proceso de codificación el producto sea un “objeto”. 113 Bateson sospecha que el sistema de codificación y el sistema de valores de las personas son parte un mismo problema pues ambos sistemas comparten una serie de semejanzas significativas, siendo la más importante la noción de información de Wiener, entendida como entropía negativa. Al parecer del antropólogo, la información puede tender un puente para reunir a las ciencias naturales y a las ciencias sociales bajo un mismo principio explicativo, y además da la posibilidad de resolver la dicotomía alma-cuerpo, tema que trabajara de manera detallada en los siguientes años. Es a partir de ese momento que Bateson comienza a estudiar la comunicación y la conducta tomando como base la metáfora de la información. Enseguida Bateson introduce la categoría de deuteroaprendizaje, que, como recordaremos, es el tipo de aprendizaje en el que un sujeto aprende a aprender un tipo particular de organización de la experiencia por medio de la puntuación de las secuencias de hechos, y que estructura de una manera particular y significativa el tipo contexto que acompaña la ejecución correcta de una tarea. El deuteroaprendizaje es por lo tanto de orden superior de abstracción en relación al aprendizaje simple de resolver una tarea, pues el sujeto aprende las características formales del contexto. Bateson piensa que el nivel del deuteroaprendizaje se estructura las premisas bajo las que vive una persona. Por ello afirma lo siguiente: “that man lives by those propositions whose validity is a junction of his belief in them.” (Ruesch y Bateson, 1951, p. 212). Lo cual significa que las premisas aprendidas en el deuteroaprendizaje no son objetivas, sino más bien su validez está en función a la creencia que se tenga en ellas; pues no existe una forma universal de organizar los contextos de aprendizaje, por ejemplo, un sujeto expuesto constantemente en un contexto de aprendizaje pavloviano interpretara su medio ambiente como ajeno a su control y estará a la espera de recompensa o castigo, mientras que el sujeto expuesto a un contexto de recompensa instrumental vive en un universo donde estará buscando premios que refuercen su conducta. Bateson advierte que esto podría explicar el “carácter” de las personas haciendo que los educados en contextos pavlovianos sean “fatalistas”. Por lo que el modo en como un sujeto interpreta el mundo y estructura su carácter está en función de las premisas en las que tiene fe, cuando actúa en base a la validez de sus premisas sólo las confirma. Por ejemplo una persona puede aprender a puntuar los contextos de interacción interpersonal de cierta forma y a definir su rol en las relaciones que establezca de manera sistemática de ese modo sus acciones constantemente corroboran su forma de ver el mundo y la naturaleza de sus relaciones: el hombre percibe y conoce de acuerdo a las premisas en las que cree y bajo las que actúa. 114 Al mismo tiempo que Bateson comienza a explicar el comportamiento como un proceso comunicativo desde la metáfora de la información, comienza a modelar la comunicación por medio de la teoría de los tipos lógicos de Russell y Whitehead para estructurarla en niveles. En la opinión de Govener (2006): “He was the first to apply the theory of Logical Types to communication.” (p. 4). Heims (1991) a su vez agrega lo siguiente: “After 1946 Bateson increasingly used the Russell theory as a heuristic device and metaphor for describing human communication” (p. 108). Recordemos que la teoría de los tipos lógicos la recoge de la exposición que hizo Wiener en la primera conferencia Macy para explicar cómo las computadoras oscilan descontroladamente ante un problema sin solución; después Bateson la recupero para el estudio de la comunicación. La teoría de Russell firma que existen clases y los miembros de esa clase, y que los miembros de la clase no pueden ser la clase misma, ni la clase puede ser uno de sus miembros. A Bateson le intereso esta discontinuidad entre miembros y clases, particularmente le fascino la paradoja que se genera cuando una clase es miembro de sí misma. Esto sucede cuando una clase define un grupo de integrantes compuesto por varios miembros y, al mismo tiempo, establece una clase de entidades de no-miembros. Esta última clase de no-miembros es miembro de sí misma. Por lo tanto hay dos clases de clases: las primeras que no son miembros de sí mismas y las segundas que sí lo son. Pero esto último es una violación a la prohibición inicial de que las clases no sean miembros de ellas mismas, dando lugar a una paradoja. Un ejemplo clásico de las paradojas es la formulada por filósofo cretense Epiménides: “Todos los cretenses son unos mentirosos.”, donde la frase total se toma como miembro de sí misma para evaluarse, por lo cual genera autorreferencia para su interpretación, y así se crea una paradoja. Es interesante advertir que si bien Russell al intentar fundamentar las matemáticas por medio de la lógica distinguió entre matemática y la metamatemáticas. Bateson, al examinar la comunicación por medio de la teoría de los tipos lógicos dio lugar a la metacomunicación. La metacomunicación es definida de la siguiente manera: “We shall describe as ‘metacommunication’ all exchanged cues and propositions about (a) codification and (b) relationship between the communicators.” (Ruesch y Bateson, 1951, p. 209). La metacomunicación es la comunicación acerca de la comunicación y se da de manera implícita a través de inflexiones en la voz y gestos, su función es señalar el tipo de codificación que están 115 llevando a cabo entre los hablantes, y el tipo de relación que tienen los involucrados en el sistema comunicacional. Bateson también estructura los mensajes, la unidad mínima de información en el proceso comunicativo, en niveles, y distingue entre mensaje y metamensajes. La idea de la estructura jerárquica de los mensajes se la debe McCulloch, quien fue el primero en plantear que los mensajes tienen dos aspectos: el “reporte” (report) y el “comando” (command), como lo relata Carol Wilder al entrevistar a Bateson: this idea originated so far as I kwon from Warren McCulloch, who pointed out at one of the Macy meetings that every firing of every neuron has both report and command aspects. It’s a report of the firing of whatever preceding neurons caused it to fire and it is a command to fire addressed to its successor. Every message has these two aspects (Bateson citado en Wilder, 1979, p. 179) El origen del reporte y el comando es el trabajo de McCulloch sobre el funcionamiento del disparo entre las neuronas, mientras el reporte se refiere a las neuronas anteriores que dispararon, el comando es el estímulo para el siguiente disparo. La primera vez que Bateson introduce esas nociones es en el ensayo titulado “Information and Codification”, ahí dice que todo mensaje tiene dos clases de significado: “On the one hand, the message is a statement or report about events at a previous moment, and on the other hand it is a command—a cause or stimulus for events at a later moment” (Ruesch y Bateson, 1951, p. 179), siguiendo la analogía con el funcionamiento de las neuronas, en cualquier mensaje existen dos aspectos, uno que reporta o informa sobre algo que paso previamente, y otro que ordena responder de cierta manera. Durante toda comunicación existen estos dos aspectos uno de informe y otro de orden que hacen que un sujeto A estimule a responder a B y viceversa. Bateson habiendo aplicado la teoría de los tipos lógicos a la comunicación, y establecido los niveles en los mensajes se dispone a estudiar las paradojas que hay en la comunicación. En primer lugar afirma que la paradoja se da en los procesos de codificación y que es imposible que no haya confusión de niveles de abstracción en las premisas de la comunicación. También reconoce que al estudiar los enunciados metacomunicativos aparecerán necesariamente las paradojas de Russell, pues no existe un metalenguaje exclusivo para estudiar al lenguaje. Por lo 116 cual tanto las premisas de la comunicación como su estudio llevarán al investigador tratar con la confusión en los niveles de abstracción. Por ello considera indispensable que los estudiosos de la comunicación consideren la tipología lógica de Russell para estudiar el proceso comunicativo y las paradojas comunicacionales. Desde este enfoque comunicacional Ruesch y Bateson tienen la temprana sospecha de que las anomalías del comportamiento son disturbios en la comunicación por la confusión entre el mapa y el territorio, es decir, una confusión entre los niveles de los mensajes. Por lo que uno de los objetivos del a terapia sería ayudar al paciente a comunicarse mejorando su sistema de codificación y de valores. Además llegan a advertir desde una visión cibernética lo siguiente: “The symptoms are efforts at self-corrective change, even though such self-correction may be inept.” (Ruesch y Bateson, 1951, 1951, p. 234); lo cual quiere decir que los síntomas cumplen una función correctiva. Esto implica la introducción de la causalidad circular y el feedback negativo para el análisis de las enfermedades mentales por vez primera. A partir de este marco teórico Bateson y Ruesch se disponen a comprender la epistemología que tienen los psiquiatras, no entendida como la rama de la filosofía encargada de la teoría del conocimiento, sino como las premisas que guían la práctica psiquiátrica. Una de estas premisas es la metáfora energética para explicar el comportamiento en psiquiatría. Como nos recuerda Heims, Bateson: From the Macy meetings he learned that engineering theory was shifting its focus from energy to communication and information, and that Freudian notions of libido and energy appear as conceptually misleading in psychiatry, whereas messages and communication are appropriate if the ideas of cybernetics are valid (Heims, 1991, p. 149) Bateson decide seguir la recomendación de Wiener de cambiar la metáfora energética del psicoanálisis por la metáfora de información en las explicaciones de la psiquiatría, y así pasar del principio organizador de la libido al de mensaje para explicar el comportamiento. Sobre la metáfora energética afirman: Around the concept of "energy" Freud and his followers have constructed theories which they themselves have compared to the theories of nineteenth- 117 century economics. The foundations of psychoanalysis were laid in the same scientific period with the theories of classical economics, and both alike reflect the physics of the 1850's. In that period, the law of the conservation of energy (the First Law of Thermodynamics) formulated by Mayer in 1840 and by Joule in 1845 dominated the trends of orthodox thought (Ruesch y Bateson 1951, p. 247). Para Bateson es comprensible que Freud utilizara la metáfora de la energía pues solo disponía en su tiempo de la energía como concepto puente entre las ciencias físicas y las sociales, ya que tenía utilizar los recursos teóricos de su tiempo para darle un estatuó científico a su teoría42. La metáfora de la energía se hace visible en expresiones metafóricas como trasferencia, energía psíquica, pulsión, aparato psíquico, descarga, represión, libido, etc., las cuales son la base conceptual del modelo psicoanalítico. Sin embargo, Bateson critica la visión del hombre con base en la metáfora energética pues cree lo siguiente: “restrict ourselves to seeing man only in terms of energy conservation, our picture of his situation will resemble that of a billiard ball, the prototype of fatalistic nineteenth-century materialism” (Ruesch y Bateson 1951, p. 249), es decir, la metáfora de la energía lleva implícita la epistemología materialista del siglo XIX, por lo que la imagen científica del hombre refleja dicha epistemología al igualarlo con bolas de billar que son empujadas por fuerzas, de acuerdo a esta metáfora el comportamiento del hombre puede explicarse por medio de las leyes de conservación de la energía, lo cual, cree Bateson, lleva a destruir el espíritu humano43. Por estos motivos sostienen: “With Freud's energy metaphors, however, nothing can be done except an almost total reconstruction of the theory, starting again from entropy considerations44” (p. 451). Debido a las desventajas que ofrece la metáfora energética para las investigaciones en psiquiatría, Bateson intenta aplicar la metáfora de la información para así estudiar comunicacionalmente los problemas psiquiátricos, y de ese modo replantear el puente entre las ciencias naturales y las sociales, por lo que Bateson se dispone a revisar la teoría psicoanalítica en los términos de la teoría de la información. Lo cual representa un giro significativo en las explicaciones de la psiquiatría y de la psicología para el estudio del comportamiento, de la epistemología psiquiátrica y de la explicación del proceso terapéutico. 118 Pues significa el paso de la primera a la segunda ley de la termodinámica, y de la energía a la negentropía (Heims, 1991; Wittezaele y García, 1994). Además invita a la psiquiatría a tener en cuenta el estudio de Gestalten más amplías, desde un enfoque que considere la interacción, la causalidad circular y los sistemas que incluyen al observador. Bateson piensa en una psiquiatría más humanista y reflexiva sobre su quehacer como la que hace Harry-Stack Sullivan. Aunque este fue el primer intento de Bateson de ver el proceso psicoanalítico en términos de la cibernética y de la metáfora de la información, y de aplicar la teoría de la información en el estudio del comportamiento, Wiener leyó el libro de Ruesch y Bateson y califico de valiente el esfuerzo, pero agregaba que era incompleto (Kline, 2015). Todo el bagaje conceptual anterior será desarrollado de manera más sistemática y sofisticada en los siguientes trabajos de Bateson. En 1950 el antropólogo contrae matrimonio con la secretaria que Ruesch contrato para él llamada Elizabeth Summer; y al siguiente año ambos tienen a su hijo John, nombre puesto en memoria del hermano mayor de Bateson (Lipset, 1991). 3.4 Proyecto Bateson: 1952-1962 Hasta ahora se ha revisado el trabajo antropológico y el primer intento de Bateson de usar los conceptos que aprendió en las conferencias Macy para estudiar la comunicación en el contexto psiquiátrico. A continuación se expone la evolución de esas ideas en el proyecto de investigación sobre las paradojas en la comunicación dirigido por Bateson desde 1952 hasta 1962; se reconstruye el proceso intelectual que precedió al planteamiento de la hipótesis del doble vínculo como factor formal de la etiología de la esquizofrenia; y se da cuenta de las consecuencias en las posteriores investigaciones del equipo tras dar a conocer el doble vinculo. Todo con la finalidad de explicitar la manera en que Bateson modela la comunicación por medio de la teoría de los tipos lógicos. Después de terminar su trabajo con Ruesch, el año de 1952 es muy importante para la vida profesional de Bateson. En enero visita constantemente el zoológico Fleishhacker, en San Francisco, para observar la interacción entre los primates esperando encontrar indicios sobre la jerarquía en los mensajes, bajo el principio que la comunicación está estructurada en niveles. En la primavera de ese mismo año empieza su observación y grabación de los juegos entre las nutrías. Se preguntó si estos animales podían metacomunicarse, esto es, si podían distinguir entre 119 los mensajes del juego y los mensajes de una pelea aunque las acciones que denotaban dichas actividades fueran las mismas. Por lo que comenzó a estudiar la naturaleza del juego y a discernir si los animales saben que un mensaje es un mensaje, e identificar si podían distinguir entre los niveles de los mensajes en su interacción (Haley, 1976). Su intuición sobre los niveles en la comunicación y el aprendizaje, la naturaleza del juego y los metamensajes lleva a Bateson en 1952 a buscar financiamiento para un proyecto de investigación. Por lo cual se dirige a Nueva York a visitar a Chester Bernard, presidente de la Fundación Rockefeller, para buscar fondos para su proyecto titulado: “Role of Paradoxes of Abstraction in Communication” (Sobre las paradojas de la abstracción en la comunicación), con el cual buscaba crear una teoría general de la comunicación que se enfocara en explicar los conflictos entre los niveles en la abstracción. Bernard, quien de acuerdo con el mismo Bateson (1971j) tenía en su mesa de noche un ejemplar de Naven, se encarga de aprobar el proyecto por dos años. Recibe los fondos en el otoño de ese año y se acuerda que serán administrados por la Universidad de Stanford. Bateson decide crear un equipo de investigación por lo que comienza a buscar investigadores asociados, el primero en integrarse al “equipo Bateson” es un antiguo alumno suyo de la New School for Social Research, pero ingeniero químico de formación llamado John Weakland. Weakland se había acercado a Bateson en 1947 con el interés de aprender antropología y después paso a ser alumno de Margaret Mead y de Ruth Benedict en la Universidad de Columbia. En el momento en que es aprobado el proyecto de Bateson Weakland se encontraba también en Nueva York, por lo que es invitado inmediatamente por Bateson como investigador. En 1952 Bateson inicia su proyecto en el Hospital de Administración de Veteranos en Palo Alto, buscando aplicar la tipología lógica de Russell en la comunicación de una manera más formal. Poco después de instalarse en Palo Alto Bateson sigue conformando su equipo y entonces entrevista accidentadamente a un joven estudiante de artes llamado Jay Haley, alumno de la Universidad de Stanford en el departamento de comunicación, quien realizaba análisis de películas populares. Haley es contratado como investigador de tiempo completo a pesar de los desacuerdos teóricos que tuvo con Bateson durante su primer encuentro. El último en agregarse al grupo fue el Dr. William Fry, psiquiatra que acababa de terminar su residencia y había tomado clases con Bateson en el Hospital de Veteranos; Fry, invitado por Bateson, decidió unirse como consultor de medio tiempo por sólo un año, ya que después se fue a laborar en la armada, para 120 después regresar a colaborar en el equipo en 1956 (Govener, 2006; Lipset, 1991; Wittezaele y García, 1994). En este punto es indispensable reconocer desde el principio que aunque la idea inicial fue de Bateson, el desarrollo del proyecto y sus resultados son producto de la colaboración entre los miembros del equipo y otros consultores, como Milton H. Erickson, Alan Watts, Alex Bavelas y Ray Birdwhistell. La intención de esta sección del capítulo es la de reconstruir el planteamiento de la hipótesis del doble vínculo destacando la participación de Haley, Weakland, Jackson y Fry, citando partes de las conversaciones teóricas que tenían como equipo, algunas partes del epistolario que mantenían entre ellos, y sus principales publicaciones; de este modo se busca reconocer que la hipótesis y otros aportes teóricos son producto de la interacción y colaboración de todos ellos durante los diez años que duro el proyecto, en los cuales se estimularon e influyeron mutuamente de manera intelectual. La investigación inicia bajo la sospecha de que el lenguaje está estructurado en niveles y que por haber conflicto entre estos se pueden generar paradojas del tipo Russelliano en la comunicación. Recordemos que de acuerdo con la teoría de los tipos lógicos de Russell las clases son de un nivel diferente de los miembros de la clase, esta discontinuidad entre niveles de abstracción puede dar lugar a paradojas en la comunicación cuando, “a negative statement classifying another negative statement occurs in a single message so that the class and its member are self-referent and the discontinuity between the two classes is breached” (Haley, 1976, p. 60). De modo que cuando un mensaje califica a otro en el mismo mensaje genera una paradoja por ser autoreferente al romper la división entre clases y miembros de la clase. Al respecto Lipset (1991) afirma que Bateson, “fue uno de los primeros en sostener que la comunicación puede provechosamente interpretarse en función de la jerarquía de niveles de abstracción o tipos lógicos.” (p. 213). El proyecto de Bateson iba justo en el sentido de ubicar aquellas interacciones donde existieran las paradojas en la comunicación, por lo que el equipo tenía el objetivo de encontrar casos en los que se evidenciaran las paradojas en la comunicación, y además debía crear un lenguaje común que permitiera estudiar los niveles de la comunicación. En el primer año del proyecto intentaron desarrollar este lenguaje teórico común y formal basado principalmente en la discontinuidad entre miembros y clases que establece la teoría de los tipos lógicos, al inicio se propusieron como categorías descriptivas los tipos lógicos, los niveles de abstracción o de comunicación, mensaje y metamensaje. Todos estos conceptos hacían 121 referencia al modo en que un mensaje califica a otro por medio de un metamensaje, este es un mensaje que clasifica a otro mensaje y que le sirve de marco. Con esta clasificación inicial comenzaron a aplicar las categorías para el análisis de la comunicación y sus paradojas, para ello se propusieron inicialmente varios temas, al parecer de Haley (1976) el fenómeno comunicacional donde es más común encontrar la confusión entre los niveles es en la metáfora, dice: “the nature of metaphor has been central to the nature of religious ritual, to art in all its forms, to play and humor, to fantasy and dream, and to the communication of the schizophrenic” (p. 99). Al reconocer la omnipresencia de la metáfora en una serie de escenarios tan dispares y notar la dificultad para estudiarla, decidieron investigar una serie de casos donde se encontraban las metáforas, las paradojas y en general la confusión de niveles en la comunicación, entre los que se incluía el juego entre las nutrias, la hipnosis, el entrenamiento animal, la relación entre un ventrílocuo y su marioneta, el juego, el humor, la comunicación en psicoterapia, el zen y el teatro (Haley. 1963; Winkin, 1982). De acuerdo con Lipset (1991) uno de los residentes del Hospital de Veteranos le sugirió a Haley estudiar a una paciente esquizofrénica del hospital para el análisis de la clasificación de los mensajes, pues mostraba gran dificultad para emitir sus mensajes. En esta variedad de fenómenos el lazo común es que se esperaba encontrar conflictos en la manera en que los mensajes se calificaban. El interés de Bateson por la naturaleza del juego lo lleva a escribir es en “A Theory of Play and Fantasy” (1955a), que puede considerarse la primera publicación donde comienza a jerarquizar la comunicación en niveles de manera formal. En este ensayo, escrito y presentado a inicios de 1954 en México, divide a la comunicación verbal en tres niveles de abstracción: denotativo, metalingüístico y metacomunicativo. En el nivel denotativo el objeto es el tema sobre el que recae la comunicación; el nivel metalingüístico es más abstracto que el denotativo y el tema del discurso es el lenguaje; por último, en el nivel metacomunicativo se comunica el tipo de relación que hay entre los hablantes. Los tres niveles están presentes en toda interacción, pero los dos últimos están generalmente implícitos. Bateson relata su asistencia al zoológico Fleishhacker para observar si los animales pueden distinguir que los signos que emiten son señales, ahí advierte que evolutivamente la capacidad de los animales de identificar a las señales como señales les permite comunicarse a varios niveles y responder de distintas formas no estereotipadas ni automáticas, dando la posibilidad de complejizar la comunicación al falsificar, negar, amplificar y corregir las señales. 122 Si los animales pudieran emitir mensajes metacomunicativos habría una indicación de que los animales reconocen a los signos como señales. Al ver un par de monos jugando, Bateson se percató de que el juego involucraba acciones que denotarían un combate en otro contexto, de modo que para que se diera el juego debía existir entre los monos el reconocimiento de que hay niveles en la comunicación, y de ese modo una acción como un mordisco pudiera ser enmarcada por el metamensaje: “Esto es un juego” para que se produjera efectivamente el juego y no un combate. Pero en la frase “Esto es un juego” opera una paradoja del tipo Russell, esto es una oración negativa que contiene implícitamente una oración negativa al nivel metacomunicativo, ya que la acción del mordisco denota dos cosas a la vez: el juego y una pelea; por lo que está en dos niveles de abstracción al mismo tiempo y así entra en conflicto consigo misma. Bateson además nota que la distinción trazada por Korzybski de que “el mapa no es el territorio”, es decir, que el mensaje no es el objeto que denota, necesita de la metacomunicación para poder establecerse. Lo cual implica que el nivel denotativo del lenguaje sólo es posible después del desarrollo de reglas metalingüísticas; sin embargo, en el juego las acciones denotan acciones del mensaje de no-juego. Enseguida enlista diferentes contextos donde tiene que haber necesariamente mensajes metacomunicativos para que las señales puedan ser falsificadas como en la amenaza, la conducta histriónica, los rituales, el arte y la fantasía. Bateson piensa sobre el juego lo siguiente: “the evolution of play may have been an important step in the evolution of communication.” (1955a, p. 186), lo cual quiere decir que el juego ha contribuido a la evolución de la comunicación porque en él existe una diferenciación primitiva entre el mapa y el territorio, pues el juego permite identificar y falsificar las señales y así aumentar la complejidad de los mensajes metacomunicativos. Sin embargo, el contexto establecido por el mensaje “este es un juego” es parecido al marco de una paradoja, por lo que es auto contradictorio, ya que si es verdadero debe ser falso, y si es falso debe ser verdadero. Para explicar cómo es que se pueden establecer metamensajes Bateson recurre a la diferencia en el proceso primario y el secundario, el “proceso primario45”, o también llamado pensamiento inconsciente, no permite realizar discriminaciones finas entre particularidades y totalidades pues no puede hacer metaenunciados, como ocurre en los sueños, la discriminación entre la totalidad y la parte es hecha por el proceso secundario o el “self”. El marco paradójico del juego no puede ser resultado sólo del proceso primario, pues permite cierta discriminación 123 entre las señales metacomunicativas; la distinción entre los que es juego y lo que es no-juego, o fantasía y no-fantasía, es posible gracias al proceso secundario. Por ello, concluye Bateson, en el marco del juego interviene una combinación entre ambos procesos simultáneamente; y es por medio de esta combinación que se puede distinguir en el juego de manera primitiva entre mapa y territorio, dice: “In primary process, map and territory are equated; in secondary process, they can be discriminated. In play, they are both equated and discriminated.” (Bateson, 1955a, p. 191). En el juego participar ambos procesos simultáneamente por lo cual genera un marco paradójico por tratarse de categorías con tipos lógicos diferentes y con distintos niveles de abstracción. Hasta ahora ha aparecido la palabra marco sin ser definida, un marco es de naturaleza psicológica y se encarga de limitar un conjunto de mensajes y con ello delimitar una clase, por lo cual los marcos actúan de manera incluyente con algunos mensajes y excluyentes con otros. El marco psicológico funciona así como una premisa que ordena y organiza la percepción del observador, para atender lo que está dentro del marco e ignorar lo que queda fuera de él; los mensajes dentro del marco son miembros de la clase que comporten una premisa, por lo cual requieren un pensamiento o percepción diferente a los mensajes que están fuera del marco. Al clasificar y delimitar una clase de mensajes el marco es un mensaje de tipo metacomunicativo, al respecto Bateson afirma: “Every meta-communicative or metalinguistic message defines, either explicitly or implicitly, the set of messages about which it communicates, i.e., every metacommunicative message is or de-fines a psychological frame.” (1555a, p. 194), para Bateson todo metamensaje define un marco psicológico y con ello el conjunto al que pertenece el mensaje que emite, lo cual le indica a quien recibe el mensaje en qué conjunto colocarlo para entenderlo correctamente. En términos de la Gestalt el marco psicológico funciona como el fondo bajo el cual la figura, es decir, el mensaje, tiene que ser percibido. Y en términos de la teoría de los tipos lógicos, el marco delimita un tipo lógico, o clase al que pertenece el mensaje, es decir, el miembro, por lo cual el marco funciona como un metamensaje que da instrucciones al receptor para colocar el mensaje en la clase o tipo lógico al que pertenece como miembro. El marco psicológico del mensaje “esto es un juego” es pues paradójico ya que hay dos niveles de tipos lógicos simultáneamente en él, el nivel del proceso primario y el nivel del proceso secundario, y provoca que cada mensaje dentro del juego, como un mordisco, deba ser 124 clasificado en ambos niveles contradictorios, lo que genera conflictos en la interpretación del mensaje. Por ultimo Bateson analiza a las enfermedades metales por medio de estas marco teórico y pregunta: “Is there any indication that certain forms of psycho-pathology are specifically characterized by abnormalities in the patient's handling of frames and paradoxes?”(1955a, p. 196), sospecha que la psicopatología sea producto de la dificultad del enfermo para tratar con los marcos conflictivos generados por las paradojas en la comunicación. Para responder señala que la “ensalada de palabras” de los esquizofrénicos parece ser precisamente una confusión constante entre los niveles de comunicación, lo que los lleva a tratar sus metáforas46 y fantasías como mensajes denotativos literales, por lo cual comienza a suponer que los esquizofrénicos carecen del marco metacomunicativo para clasificar sus mensajes. Con respecto a la psicoterapia Bateson establece una serie de paralelismos con el juego, pues sospecha que las técnicas de la terapia pueden involucrar el uso marcos y de paradojas para provocar el cambio. Cree además que la función de la terapia es lograr que el paciente cambie sus hábitos metacomunicacionales: “Before therapy, the patient thinks and operates in terms of a certain set of rules for the making and understanding of messages. After successful therapy; he operates in terms of a different set of such rules.” (1955a, p. 196). Las reglas de las que hablas son las que se generan por la asignación de tipos lógicos a los mensajes, si el paciente cambia esas reglas de asignación tal vez logre reconocer que sus metáforas son eso, metáforas. Es muy importe señalar desde ahora que Bateson nunca sugirió eliminar las paradojas en la abstracción, pues pensaba lo siguiente: “would be bad natural history to expect the mental processes and communicative habits of mammals to conform to the logician's ideal” (1955a, p. 186). Los tipos lógicos como herramienta teórica le permiten a Bateson estudiar los fenómenos comunicacionales pero no con el fin de eliminar las paradojas en la comunicación, pues eso supondría eliminar el juego y por lo tanto la evolución y complejidad de los procesos comunicativos, por esta razón sostenía el antropólogo: “without these paradoxes the evolution of communication would be at an end. Life would then be an endless interchange of stylized messages, a game with rigid rules, unrelieved by change or humor.” (1955a, p. 221), las paradojas permiten cambiar las reglas de la comunicación, la asignación de los mensajes a distintos tipos lógicos, y la creación de marcos psicológicos alternativos. Si se suprimen las paradojas de la abstracción se elimínala la posibilidad de realizar cualquier actividad creativa 125 como la fantasía, la poesía, el ritual, el humor, la creatividad y el cambio terapéutico. Como bien noto Keeney (1991), para Bateson los tipos lógicos eran una herramienta descriptiva, más no prescriptiva, para el análisis de la comunicación. La violación a la distinción entre clases y miembros es necesaria e inevitable en el proceso comunicativo para su evolución. Otro discípulo de Bateson más tarde agregara lo siguiente sobre la función evolutiva del juego: “Play has evolutionary value because it makes organisms flexible, better able to learn, better able to combine things in new ways so that we, humans and animals, are more ready to adapt to changing circumstances” (Nachmanovitch, 2009, p. 18) El juego en la naturaleza habilita la generación de variedad y multiplicidad en las especies, lo cual evita que el sistema se extinga completamente en caso de haber un cambio drástico en el medio ambiente. Tanto en la naturaleza como en la cultura la falta de flexibilidad de los organismos los dirige a la parálisis, y la homogeneidad lleva siempre a la extinción de los individuos de la especie o de una cultura. Si un hombre o un grupo se orientan bajo premisas rígidas llegarán a tener una crisis por no poder responder adaptativamente a los conflictos que tenga con su ambiente por medo de respuestas creativas derivadas del juego y de las paradojas en la abstracción. Mientras el equipo Bateson empezaba construir este sistema conceptual, en enero de 1954 Don deAvila Jackson es invitado por Bateson a integrarse a su equipo tras escucharlo dar una conferencia organizada por Frieda Fromm-Reichmann en el Hospital de Veteranos de Palo Alto sobre homeostasis familiar (Wittezaele y García, 1994). Jackson fue un médico especializado en psiquiatra, y entrenado después en Chestnut Lodge en Rockville, Maryland, y en la Washington School of Psychiatry entre 1947 y 1951, fue en Chestnut Lodge donde fue influenciado por las ideas innovadoras de Harry Stack Sullivan y Frieda Fromm-Reichman, quienes enfatizaban los aspectos interaccionales de los problemas psiquiátricos. Después se mudó a California ser el jefe del Palo Alto Medical Clinic, y además supervisar a los psiquiatras residentes del Hospital de Veteranos, en Menlo Park (Govener, 2006; Ray, 2004). Una de las principales características profesionales de Jackson fue su postura no patologizante de las enfermedades mentales, como lo deja claro en un ensayo de 1967, Jackson (2010) critica la tendencia de los investigadores en salud mental de investigar exclusivamente a las personas etiquetadas como enfermas, pues descuidan estudiar a los sanos. Eso hace al entrevistar a alguien los psiquiatras siempre busquen lo que está mal en esa persona. Además 126 cuestiona lo que llama el “mito de la normalidad”, pues considera que lo normal es aquel conjunto de comportamientos que son comunes y tradicionales por convención social, lo cual depende del límite del marco de referencia asumido por la experiencia de una comunidad; mientras que cualquier comportamiento o actitud inusual es etiquetado como raro, extravagante o loco. Jackson advierte que la tendencia a categorizar entre normal y anormal a las personas debido a esta clasificación sanitaria tiene influencia en el diseño de políticas públicas y ha servido para atentar contra la libertad y bienestar varios de grupos, como cuando se decide encerrar y aislar a los enfermos mentales en los hospitales. Jackson también cuestiona el determinismo biológico y familiar de las principales teorías explicativas de las enfermedades mentales de su tiempo, al advertir que las teorías genéticas tratan los rasgos psicológicos como entidades físicas, y que las teorías que afirman que todos los enfermos mentales provienen de familias problemáticas no son del todo correctas ya que hay contraejemplos de personas sanas y creativas que han crecido en un ambiente familiar conflictivo. Por todas estas razones concluye lo siguiente: I strongly believe psychologists and psychiatrists should stop asking, “What is normality?” It seems to me that for purposes of scientific theory formulation, and also for practical clinical purposes, a different and more fruitful approach can be taken. One that would incorporate the views that human beings possess a variety of potentialities that the achievement of certain potentialities may entail certain limitations, and that achievement and limitation vary with conditions (Jackson, 2010, pp. 77-78). Subraya que en lugar de normativizar lo que es normal, es preferible, científica y clínicamente, ver a las personas de una manera más amplia y asumir que sus limitaciones y capacidades están restringidas por varios factores. Por eso considera que es mejor evaluar a una persona en varios aspectos de su vida y en diferentes contextos, para evitar etiquetar apresuradamente a alguien como enfermo. Además muestra la importancia de considerar la cultura y grupo al que pertenece una persona para evaluarla. Es por demás notable que Jackson considere las diferencias comportamentales entre las personas como síntoma de las distintas formas en que se pueden adaptar a su medio y contribuir a así a la condición humana y no como síntomas producto de enfermedades mentales. Por todo lo anterior Jackson hace una invitación 127 para dejar de ver a ciertos grupos como los superiores por ser “normales”, y más bien considerar que el que otros grupos sean diferentes, capaces y creativos para resolver sus problemas es una muestra de la gran capacidad adaptativa del hombre. A partir de 1951 Jackson comenzó a ver a sus pacientes y a los padres de estos juntos en una misma sesión al ver lo favorable de los resultados desde que atendió a una paciente junto con su madre. Watzlawick (1988) señala que mientras la psiquiatría de la época, al ver que un paciente recaía al regresar a su contexto familiar lo mantenía lejos de ella teniéndolo internado, Jackson organizaba las sesiones clínicas del paciente junto con su familia, rompiendo así la regla psicoanalítica que el terapeuta debía evitar el contacto con la familia del paciente para no comprometer la transferencia. Además él en sus sesiones terapéuticas solía preferir obtener la información sobre el presente de su paciente en lugar del pasado, y que estuviera relacionada con los vínculos que este tenía con los demás, por lo que su enfoque es claramente interaccional y contextual. Por todo lo anterior era reconocido por sus colegas como un clínico brillante e intuitivo en sus diagnósticos e intervenciones, las cuales provocaban rápidos cambios en las familias, y sin duda se le puede considerar un pionero en la terapia familiar y en la terapia breve. El contenido de la conferencia que dio en Palo Alto donde Bateson lo conoció fue publicado después en un artículo hasta 1957. En él Jackson toma la noción biológica de la homeostasis que propuso Walter Cannon, basado a su vez en el trabajo de Claude Bernard, como metáfora para proponer el término “homeostasis familiar”, con el cual pretende explicar la constancia interna de la dinámica familiar, entendiendo a la familia como un sistema cerrado donde el feedback ayuda a corregir el sistema, afirma: “in terms of communication theory; that is, depicting family interaction as a closed information system in which variations in output or behavior are fed back in order to correct the system's response” (1957, p. 80). Es importante advertir que Jackson comienza a modelar a la familia a partir de la teoría de la comunicación, en la que los miembros de la familia constituyen un sistema comunicacional cerrado que se comunica por medio de la información trasmitida por sus conductas. La familia incluye a todas aquellas personas que son importantes para el paciente, y conforman un sistema cerrado que funciona como una totalidad en el cual la conducta de cada uno de los miembros influye en los demás y sirve como feedback para corregir y mantener a la familia como una unidad homeostática. 128 En el mismo artículo Jackson (1957) insiste en que los psiquiatras pongan atención a las pautas interacciónales de las familias que tienen pacientes con problemas psiquiátricos, para después construir categorías nosológicas basadas en las relaciones interpersonales de los pacientes con su familia; en lugar de apelar a las tradicionales explicaciones psicoanalíticas de la enfermedad mental. Es notable en este ensayo que Jackson se esfuerce en construir nuevos conceptos etiológicos de las enfermedades mentales que superen las categorías intrapsíquicas características del psicoanálisis, y proponga otras categorías fundamentadas desde una perspectiva interaccional. Advierte especialmente la importancia de la estructura de la relación entre el niño y la madre, y a considerar la influencia de esta última en las desviaciones de la personalidad del niño. Jackson había observado que una madre es “esquizofrenógena” cuando se comporta de manera fría y rechaza sistemáticamente a su hijo disimuladamente; mientras el padre se mantiene a distancia, por lo cual los síntomas del niño serían una respuesta a su sistema familiar y ayudarían a preservar su homeostasis. En su experiencia clínica Jackson se percató que había una serie de reglas en la familia que mantenían la homeostasis de esta, haciendo que funcionara como un sistema autorregulado De modo que cuando el paciente de la familia cambia su comportamiento sintomático, otro miembro de la familia toma su lugar, o el mismo paciente regresa al síntoma después de un tiempo, por lo tanto el síntoma cumple una función para mantener el equilibro de la familia. De lo cual se sigue que tanto la familia influye al enfermo, como el enfermo y su sintomatología cumplen una función en la familia para mantener su homeostasis. Por ello creía que la familia es el contexto del síntoma (Govener, 2006). Por todo lo anterior Jackson (1957) invita a los psiquiatras a pensar cuales son los posibles cambios en los miembros de la familia si el paciente cambia por las intervenciones terapéuticas, y que si los psiquiatras siguen esta nueva perspectiva interaccional se tiene la ventaja de ayudar al paciente a manejar mejor sus relaciones familiares y poder tener datos para desarrollar una mejor nosología psiquiátrica. Al escuchar a Jackson en la conferencia, Bateson advirtió que su idea sobre la homeostasis familiar era acorde al enfoque interaccional de la comunicación que él y su equipo desarrollaban. Además fue invitado a unirse al proyecto como consultor por su experiencia con el tratamiento de pacientes esquizofrénicos (Bodin, 1981). Con la entrada de Jackson se comenzó a considerar a la familia como un sistema comunicacional, más que como un agregado de 129 individuos, lo que llevo al equipo Bateson a estudiar a la familia como un grupo en interacción, entender los síntomas del esquizofrénico en la matriz comunicacional de la familia, y a desarrollar una serie de categorías que permitieran la descripción de las relaciones entre los miembros. Estas nociones permitieron empezar a introducir el pensamiento cibernético en la psiquiatría Govener (2006). Otro ámbito en donde la influencia de Jackson fue decisiva fue en la orientación clínica de los objetivos del proyecto de investigación, pues insistía a Bateson en que los miembros del equipo realizaran psicoterapia para entender lo que pasaba en las perturbaciones de la comunicación del esquizofrénico, él solía decir: “One thing I would say is that somebody should be doing therapy in order to provide the kind of experience you can only get in therapy”47 (Jackson citado en Govener, 2006, p. 38). Jackson supervisaba a los demás miembros – incluyendo a Bateson48-, quienes dieron terapia individual y familiar en el Hospital de Veteranos. Por ello el equipo empezó a discutir ideas relacionadas con la terapia familiar en sus juntas, por ejemplo, la de provocar un cambio en el paciente a través de una nueva experiencia; o la de realizar cambios conductuales a través del lenguaje. Se preocupaban además por la manera en como el terapeuta respondía al paciente y este a su vez contestaba a las intervenciones del terapeuta. Como consecuencia de atender las interacciones del paciente con el terapeuta, los miembros del equipo se comenzaron a preguntar por la manera en que ellos respondían a los pacientes. Esta actitud activa del terapeuta en la terapia es de inicio muy diferente a la pasiva escucha de la escuela psicoanalítica, y muestra el inicio del enfoque interaccional en la terapia. Con la entrada de Jackson al equipo Bateson y después de un par de años de trabajo desarrollando una serie de categorías interaccionales usando como principio organizador el conflicto entre los niveles de la comunicación, pero sin ninguna publicación hecha formalmente, Bateson le escribe a Norbert Wiener una carta en abril de 1954 para pedirle ayuda para conseguir fondos que financien su investigación, en ella dice: Type confusion leads to paradox when both message and metamessage contain negatives. On this principle we can image the generation of paradox in the deuteron-learning system when an organism experiences punishment following some failure and learns that it must not learn that punishment follows failure. This would be approximately the picture of a man who 130 having been punished for failure later is punished for showing his expectation of punished after failure, e.g., punished for cringing. (Bateson citado en Haley, 1976, p. 66) Aquí Bateson comienza combinar la confusión de mensajes de diferentes niveles con su teoría del aprendizaje, y especula sobre lo que pasaría si se produce una paradoja en el contexto del deuteroaprendizaje, en el cual el mensaje y el metamensaje que componen al contexto de aprendizaje sean negativos, pues responden a una lógica de castigo; de tal modo que el proto aprendizaje se aprenda a ser castigado por algo, y en el deuteroaprendizaje aprenda a que no debe ser castigado, es decir, que entre en conflicto con aprendizaje del primer nivel. Para ejemplificar un contexto de aprendizaje con tales características, Bateson piensa en el caso de que alguien sea castigado por fallar y, al mismo tiempo, sea castigado por esperar ser castigado. A pesar de esta hipótesis la fundación Rockefeller decide no renovar el subsidio. Así que Bateson elabora un nuevo proyecto que se propone estudiar específicamente la comunicación en los pacientes esquizofrénicos. Recibe apoyo de la fundación Macy vía Fremont-Smith para continuar la investigación hasta 1959 bajo los siguientes lineamientos: The proposed research will focus upon an entirely different aspects of schizophrenic communication. (…) The research, starting from these two generalizations, will study the schizophrenic’s use of that particular category of nonverbal and implicit signals which indicate whether a given utterance is literal or metaphoric, jocular or serious, sincere or histrionic, etc. This class of signals we call ‘reality qualifiers’ (Haley, 1976, p. 65) Este es un extracto tomado del documento para aplicar para la subvención en el cual se hacen evidentes algunas premisas para investigar la comunicación del esquizofrénico. En primer lugar asumen que no sólo lo verbal es comunicativo, sino también lo no verbal, porque consideran que la comunicación está estructurada en varios niveles; de ese modo consideraban que los movimientos “enmarcaban” un mensaje, y a su vez los gestos se “enmarcaban” por la entonación de la voz. De modo que cada mensaje es calificado por otro de diferente tipo, dentro de una jerarquía ordenada de los canales de la comunicación. Cada nivel podía ser identificado por medio del canal donde era emitido un mensaje. Al notar que el paciente esquizofrénico tiene 131 dificultades para distinguir entre “realidad” y “fantasía”, y la dificultad para usar señales no verbales, sospecharon que había un conflicto entre los niveles de los mensajes, de modo que el equipo se proponía estudiar los mensajes de los esquizofrénicos para ver si podían usar mensajes que distinguieran entre lo literal y lo metafórico, es decir, se proponían investigar los metamensajes de la comunicación esquizofrénica, los cuales son producto del proceso secundario, por eso denominan a esos mensajes “calificadores de la realidad”, pues son los que permiten asignar cada mensaje a la clase que le corresponde y así identificarlos como una broma, una mentira, una metáfora, etc. En el mismo documento agregan: It is suggested that the base for later psychosis may be laid in infancy by the experience of dealing with a mother who both punishes the child for certain actions and punishes the child for learning that punishment will follow those certain actions, i. e., she generates paradox in the child by combining negative learning with negative deutero-learning (Haley, 1976, p. 67). La hipótesis de la etiología de la esquizofrenia que comienzan a esbozar es que para que el paciente perdiera la capacidad de utilizar los “calificadores de realidad”, es decir, de usar adecuadamente los metamensajes, tuvo que estar a expuesto desde niño a una experiencia de aprendizaje donde la madre, al castigar al hijo por realizar ciertas acciones, y castigarlo por esperar ser castigado pone al hijo en una paradoja donde los dos niveles de aprendizaje negativos están comprometidos creado un contexto de castigo. Bateson, al introducir la presencia de una paradoja en el deuteroaprendizaje, en el aprendizaje que se da en el sistema familiar, específicamente en la relación entre madre e hijo, comienza a ofrecer una descripción operacional del trauma que lleva al niño a deuteroaprender a no distinguir correctamente los metamensajes y con ello a desarrollar progresivamente una psicosis, ya que pierde la capacidad de asignar a cada mensaje la clase a la que corresponde para interpretarlo, lo cual podría explicar la dificultad del enfermo de identificar los mensajes metacomunciativos de los demás. Esta hipótesis se fue desarrollando en los años siguientes, y progresivamente se abandonó el término paradoja para caracterizar esta secuencia interaccional traumática, para usar el de “vinculo” (bind). Como recordara años después Bateson, la idea de doble vínculo vino de una conversación de él con Wiener: 132 Telephone exchange could be called “schizophrenic” in a formal sense if it mistook numbers mentioned in the conversation between subscribers for those numbers which are the names of subscribers. The double-bind idea was born out of the question “how would one teach a telephone exchange to make this error? (Bateson citado en Heims, 1977, p. 151) Por medio de un experimento mental, Bateson piensa en la manera en que un teléfono aprendiera a confundir los números que se dicen en una conversación con los de los operadores, a esa confusión entre niveles se le puede caracterizar esquizofrenia, como cuando al pedir comida en un restaurante se devorara el menú y no el platillo, y de este modo nació la idea formal del doble vínculo. En esta parte de la historia hay que tener presente que el interés de Bateson estaba en desarrollar una teoría que explicara los principios de la comunicación, no en los problemas de la psiquiatría, ni menos aún en el desarrollo de la terapia, pero la necesidad de obtener recursos lo llevo junto con su equipo a estudiar con mayor detalle a los pacientes esquizofrénicos. El estudio de estos casos extremos de confusión en los niveles en la comunicación le permitió tener un punto de comparación con las demás actividades humanas donde la comunicación no tiene perturbaciones tan fuertes, pero que aun así involucran la confusión entre los niveles de los mensajes. De ese modo Bateson, siguiendo la enseñanza de su padre de atesorar las excepciones en la actividad científica, usaba esta población excepcional para estudiar las paradojas en la comunicación en general. En este sentido Haley pensaba lo siguiente: “The disturbance is so great in the family of the schizophrenic, it makes a better model to talk about the family than any other kind of pathology” (citado en Govener, p. 35). Las familias con un miembro esquizofrénico permitían estudiar a las familias con menos problemas y también investigar otros padecimientos mentales. Precisamente fue Haley el que se señaló al equipo la dificultad para los esquizofrénicos para identificar o responder a niveles de comunicación, y que su dificultad para metacomunicarse podía explicar los síntomas de la esquizofrenia como resultado de la incapacidad de discriminar entre los tipos lógicos; permitiendo con esa idea el surgimiento de una línea de investigación que se ocupara de comprender los disturbios en la comunicación en los esquizofrénicos (Lipset, 1991). Por lo que de 1954 a 1956 se enfocaron en desarrollar una teoría sobre la etiología de la esquizofrenia desde un enfoque comunicacional y apoyados en la 133 estructuración jerárquica de los mensajes, lo que dio como resultado la hipótesis del doble vinculo. Pero antes de exponer en que consiste dicha hipótesis, es indispensable mencionar la participación de un importante interlocutor que tuvo el equipo Bateson para su planteamiento, y que dio un giro significativo a los objetivos del proyecto: Milton H. Erickson. Al finales de 1954, exactamente el 29 de noviembre, después de que Haley asistiera a un seminario de Erickson, Bateson le escribe al médico para comentar las posibles relaciones entre el fenómeno hipnótico y la esquizofrenia. Además le hacía saber que el proyecto de investigación que él dirigía se enfocaría en la comunicación esquizofrénica y que le gustaría tener un encuentro con Erickson para tenerlo como consultor del proyecto (Zeig y Geary, 2000). El 24 de mayo de 1955 Bateson le escribe de nuevo a Erickson una extensa carta donde busca que Erickson le ayude a contestar algunas dudas sobre la hipnosis, por lo que sugiere que dos de sus colaboradores lo visiten a Phoenix para consultarlo: Haley y Weakland, y así puedan discutir las similitudes entre el trance hipnótico y los síntomas esquizofrénicos, ya que en ambos casos hay fenómenos como la catalepsia, las alucinaciones y la confusión de las oraciones metafóricas con las literales. Bateson sospecha que si las manifestaciones son parecidas en ambos fenómenos, entonces las causas formales también lo serían, por lo que descubrir más sobre la inducción al trance hipnótico permitiría saber más sobre la etiología de la esquizofrenia. Es entonces cuando introduce las primeras ideas sobre la hipótesis del doble vínculo, tal condición es producto de la interacción familiar en la que un niño crece siendo rechazado continuamente por su madre, y cuya estructura comienza a plantearse de la manera siguiente: We believe it is a matter of messages of multiple meaning with a primary meaning contradicted by a secondary meaning in the same message. Given such a message, the receiver is faced with a problem of discriminating between two contradictory levels of message. If the receiver must discriminate, when it is a matter of life and death importance, the problem becomes so extreme that a breakdown is possible. Given an entire childhood faced with such crisis, we hypothesize that a person will develop an elaborate system of defenses as a way of dealing with messages and that these defenses and ways are the symptoms of what is called schizophrenia. (Bateson citado en Zeig y Geary, 2000, p. 56) 134 Bateson empieza a usar la categoría de doble vinculo para describir una pauta comunicacional en la que una persona, sujeta sistemáticamente a una situación donde se encuentre ante un mensaje que tenga dos niveles contradictorios, y que tenga la dificultad de escoger entre ambos niveles de significado, y además deba necesariamente discriminar pues es importante para su supervivencia, lo llevara a una crisis que le haga desarrollar comportamientos para tratar con ese tipo de mensajes conflictivos y que son muy parecidos formalmente a los síntomas de la esquizofrenia. De este modo se comienza a describir a la esquizofrenia como un trastorno de la comunicación en el que se aprende la dificultad para discriminar entre los niveles de un mismo mensaje, y cuyos síntomas son una respuesta coherente a su contexto de aprendizaje familiar. Bateson continúa su exposición señalando la habilidad que tiene Erickson de trabajar con varios niveles de mensajes en su comunicación para inducir al trance a alguien, creando así un “doble vínculo terapéutico” al paciente. Como cuando le ordena a un sujeto que se resiste a la hipnosis mantenerse despierto, pues si el paciente desobedece esta indicación cae en trance, y si obedece, obedece en un nivel más abstracto a los mandatos de Erickson. El paciente no tiene manera de escapar a las sugestiones de Erickson pues hay una contradicción entre dos niveles del mensaje. Situaciones así, supone Bateson, son en las que un niño pre-esquizofrénico crece y lo imposibilitan para aprender a discriminar entre los niveles de la comunicación, pues los gestos o el tono de voz al enmarcar un mensaje verbal contradictorio, llevan al niño a renunciar a la capacidad de discriminar entre niveles para mantener la relación con su madre. Bateson incita a Erickson a preguntarse sobre estas similitudes formales entre sus procedimientos y la comunicación esquizofrénica. Por lo que hace explicito su interés en discutir la naturaleza de la relación entre el hipnotista y el sujeto a hipnotizar, y la relación entre la madre y el niño pre-esquizofrénico; además quiere comparar la inducción al trance y la etiología de la esquizofrenia y otros temas, por lo que espera conversar con Erickson y que acepte a sus colaboradores. Erickson se muestra interesado en discutir las dudas de Bateson y decide reunirse con Haley y Weakland. A partir de 1955 Haley y Weakland comienzan a visitar semanalmente a Erickson para investigar la comunicación hipnótica como parte del proyecto de Bateson sobre los niveles de comunicación hasta 1960 (Govener, 2006). Ambos comenzaron a notar que en las intervenciones 135 de Erickson utilizaban la paradoja y el doble vinculo terapéutico, por lo que se esforzaron por explicar las sesiones de Erickson en términos de los niveles en la comunicación. Cabe decir que aunque Erickson no participo directamente en las discusiones del equipo, el grupo si debatió las ideas y las técnicas de él observadas y reportadas por Haley y Weakland, por lo que su influencia en la formulación de la hipótesis del doble vínculo es indiscutible49. Por otro lado es curioso que el mismo Erikson se reusara a justificar teóricamente su trabajo o a explicarlo, y que incluso en ocasiones no contestara abiertamente las preguntas de Haley y Weakland sobre los vínculos entre la hipnosis y la esquizofrenia. Es muy importante advertir que para el estudio de los disturbios en la comunicación de los pacientes esquizofrénicos Bateson utilizo su formación como antropólogo, pues intenta establecer la estructura formal del trauma que produce la esquizofrenia, en base a la descripción de los contextos de aprendizaje que lo producen, apoyado en la definición de la comunicación en términos de múltiples niveles. Al notar de su trato con pacientes que cuando están en un contexto de aprendizaje en el que se reclasifican sistemáticamente sus mensajes en otra clase, el paciente entonces se acostumbra a que sus mensajes sean malinterpretados, y donde además se encuentra prohibido preguntar por medio de la metacomunicación que clase de mensaje es para lograr una adecuada discriminación, se pierde la habilidad para usar metamensajes. Bajo ese contexto de aprendizaje los esquizofrénicos adquieren la dificultad de identificar los metamensajes que reciben, por lo que tienen problemas al clasificar mensaje y en consecuencia no pueden asignarles una clase para interpretarlos. Por lo que la esquizofrenia es producto de una confusión metacomunicativa ya los es una dificultad para manejar metamensajes (Bateson, 1955b). Con todos estos elementos teóricos, Jackson anima el equipo a realizar una publicación con los resultados en 1956, y aunque Bateson prefiere esperar los demás apoyan a Jackson, por lo que publican el célebre “Toward a Theory of Schizophrenia” (Bateson, Jackson, Haley, Weakland, 1956). (Hacia una Teoría de la Esquizofrenia) en la revista Behavioral Science, donde se inaugura históricamente el salto de la explicación intrapsiquica a la interaccional de los síntomas psiquiátricos (Vargas, 2007). En este artículo donde se sintetizan las discusiones del equipo en la hipótesis del “doble vinculo”, entendida como la descripción formal de las experiencias comunicativas de un niño que pueden ser determinantes en el desarrollo de los síntomas característicos de la esquizofrenia. A continuación se analiza con detenimiento su propuesta. 136 Desde el comienzo del artículo reconocen que la hipótesis que presentan está basada en el análisis de la comunicación por medio de la teoría de los tipos lógicos, además de la observación, tratamiento y grabación de pacientes esquizofrénicos; por lo que es una teoría comunicacional de la etiología de la esquizofrenia. Como ya se explicó, la teoría de los tipos lógicos establece que una clase no puede ser miembro de sí misma, ni que un miembro puede ser la clase por estar en niveles de abstracción diferentes, o diferentes tipos lógicos. Pero en la comunicación humana la discontinuidad entre clases y miembros se rompe de manera continua, por ejemplo, en el humor, el juego, la fantasía, la falsificación de las señales identificadoras, la poesía, la metáfora, los sacramentos y la ficción. En todos estos casos hay múltiples tipos lógicos que permiten enmarcar un mensaje por medios no verbales. El aprendizaje también se puede dividir en niveles, como lo propone Bateson en su teoría, en proto-aprendizaje y deuteroaprendizaje. Agregan que los niveles de aprendizaje están relacionados con la identificación de la tipificación lógica de las señales, dicen: “These are two inseparable sets of phenomena-inseparable because the ability to handle the multiple types of signals is itself a learned skill and there before a function of the multiple levels of learning” (Bateson, et al. 1956, p. 252). Esto significa que la capacidad de discriminar entre diferentes niveles de mensajes es aprendida, y dado que evolutivamente el hombre puede distinguir cuando una señal es una señal, el aprendizaje también debe estar estructurado en niveles. La función del ego es la que se encarga de discriminar los modos comunicacionales de otras personas y de una persona con ella misma. Sin embargo, cuando alguien tiene debilitada esa capacidad de discriminar el tipo de mensajes que los demás le envían, o que el mismo emite o piensa, como el paciente esquizofrénico, debido a que sus contextos de aprendizaje así lo han enseñado, entonces emplea un lenguaje metafórico de manera permanente sin considerar que los mensajes que emite son metáforas. Los autores continúan señalando que si esta dificultad de discriminar los modos comunicacionales de los mensajes es producto del contexto de aprendizaje del esquizofrénico en la familia, entonces se debe describir la secuencia comunicacional que produzcan ese contexto de aprendizaje común y sistemático en la vida del paciente, de tal modo que adquiera el hábito de comunicarse de manera esquizofrénica, es decir, caracterizado por ser abundante en metáforas. A esta secuencia interaccional le llaman doble vínculo, la tiene las siguientes características: 1) debe estar compuesta por dos o más personas: una la “víctima” y otra la que 137 impone el doble vinculo, sospechan que es la madre la que principalmente lo hace, pero sin excluir la posibilidad de que sea otro miembro significativo para la victima; 2) la experiencia debe ser continua y habitual en la vida del paciente de tal modo que se convierta en una expectativa; 3) un primer mandato negativo, por ejemplo: “Si no haces esto te castigare”, de modo que el contexto de aprendizaje sea de evitación del castigo; 4) al mismo tiempo se da un mandato secundario a nivel más abstracto de forma no verbal, pero que entra en conflicto con el primer mensaje y que incluye también amenazas implícitas para la supervivencia de la víctima, el mensaje dice algo como: “No me veas como alguien que te castiga”. O también puede darse el caso de que dos personas, como los padres, emitan mensajes contradictorios en donde uno niega a un nivel más abstracto el mandato del otro; 5) por último se emite un tercer mandato negativo que prohíbe a la víctima escapar de la situación; 6) cuando es aprendida esta secuencia comunicacional por la victima ya no es necesario que después estén presentes todos los elementos anteriores, basta con la existencia de una parte del patrón para que se precipite la respuesta acostumbrada de la víctima de ira y miedo, ya que el paciente aprende a organizar el universo de acuerdo a estas pauta. Ante esta secuencia interaccional se espera que la capacidad de la víctima para discriminar entre Tipos Lógicos se quiebre cada vez que esté en un contexto parecido al del doble vínculo. Dado que es necesario para la víctima discriminar adecuadamente los mensajes que recibe de sus relaciones importantes para poder responder correctamente; al no poder discriminar y además ser incapaz de metacomunicarse provoca que el esquizofrénico, al no saber cómo interpretar un mensaje, por una parte no discrimine entre lo literal y lo metafórico, y por otra parte se comunique generalmente por medio de metáforas ya que tiene prohibido comunicarse efectivamente sobre los mensajes que recibe. De ese modo el paciente aprende a responder a todas las personas como si estuviera en el contexto del doble vínculo. La metáfora le permite a la víctima comunicarse con los demás, pero evitando una confrontación directa. En consecuencia: “The pathology enters when the victim himself either does not know that his responses are metaphorical or cannot say so.” (Bateson, et al. 1956, p. 255) Al derrumbarse capacidad metacomunicativa, él paciente no puede saber qué tipo de mensajes recibe ni saber que significan, por lo que debe responder de manera defensiva ante muchas posibilidades. En consecuencia, la víctima es como un sistema que ha perdido su 138 regulador, y que hace las distorsiones cada vez mayores, y sus metáforas se vuelvan más fantásticas y elaboradas. Enseguida postulan que las secuencias comunicacionales del doble vínculo se deben de presentar en la interacción familiar, así que describen las características de las interacciones entre madre e hijo que llevan a este último a desarrollar síntomas característicos de la esquizofrenia. En estas familias la madre debe sentir ansiedad cuando su hijo se le acerca por lo que ella se retrae, y al mismo tiempo el deseo de ocultar su hostilidad por medio de un comportamiento amoroso simulado, para que el niño se comporte con ella de manera cariñosa y sea vista de ese modo como una madre amorosa. Por lo que la madre, para manejar su ansiedad, emite los mensajes de hostilidad cuando el niño se acerca a ella, y cariño simulado para ocultar su retraimiento; ambos mensajes en diferentes órdenes de abstracción. Ante esa situación, si el niño discrimina correctamente los mensajes de la madre se dará cuenta que esta no lo quiere, y será castigado, por lo que debe aprender a no discriminar correctamente los mensajes de los demás. El niño tiene entonces que aprender a no discriminar ni interpretar correctamente la comunicación de la madre si quiere mantener la relación con ella; pero si él acepta la definición de los mensajes de la madre y se acerca a ella recibiendo su amor simulado, ella enseguida se retrae porque la cercanía de él le produce ansiedad, por lo que también es castigado el niño: “The child is punished for discriminating accurately what she is expressing, and he is punished for discriminating inaccurately—he is caught in a double bind” (Bateson, et al. 1956, p. 258). El niño no debe pues de discriminar correctamente los tipos lógicos en los mensajes de amor simulado, y los reales de hostilidad de su madre, sin embargo si él se acerca y acepta el amor simulado, ella se retrae, pero si él se retrae y da con ello el mensaje de discriminar correctamente los mensajes de rechazo, ella se acerca. En ambos casos el niño no tiene opción, es castigado por demostrar amor y también es castigad si no lo hace, por lo que debe sistemáticamente distorsionar su propia percepción de las señales metacomunicativas que recibe. El niño para escapar de esta secuencia podría acercase a su padre para obtener ayuda, pero si lo ayuda tendría que reconocer la conducta engañosa de su esposa, por lo que se mantiene por lo general al margen para proteger su propia relación con su esposa; o también puede ayudar a la madre a crear el doble vínculo. Otra opción sería que el niño comentara la situación contradictoria, pero de hacerlo la madre lo tomaría como una acusación de no ser genuinamente 139 amorosa, y lo castigaría. La madre por ello le prohíbe al hijo usar la metacomunicación, de modo que él ya no pueda corregir su percepción de los mensajes. Y dado que la metacomunicación es esencial para una buena relación, pues permite discriminar lo que la gente dice, el niño al crecer en un contexto de aprendizaje donde no desarrolla su habilidad metacomunicativa, no puede distinguir lo que le dicen ni expresarse correctamente. De esta forma ejemplifican la secuencia del doble vínculo en la interacción familiar, en la que hay dos mensajes de diferente nivel en contradicción, y donde se tiene prohibido escapar de la situación. En resumen, la madre esquizofrenógena no tolera la cercanía pero tampoco tolera ser vista como alguien que no tolera la cercanía, el doble vínculo le permite protegerse a sí misma de darse cuenta de sus propios sentimientos, y dado que no puede sentir amor genuino hacia su hijo crea situaciones donde ella podía mostrar cariño y cuidado hacia este para que no fuera acusada de no ser amorosa, pero sin ser genuinamente cariño. Además, al ayudar a su hijo constantemente se olvida de sus propias carencias y controla su ansiedad. El hijo entonces tenía que seguir esta pauta interaccional si quería mantener la relación con su madre, aunque esto significara renunciar a sus propias necesidades y a su crecimiento al mantenerse dependiente de la madre. Pero cuando el hijo mostrara afecto hacia su madre, ésta al no poder recibirlo, creaba contextos donde el niño al mostrar cariño fuera castigado y donde no hacerlo también tuviera una sanción: “The impossible dilemma thus becomes: ‘If I am to keep my tie to mother, I must not show her that I love her, but if I do not show her that I love her, then I will lose her.’" (Bateson, et al. 1956, p. 259) Para el paciente esquizofrénico siempre existe la posibilidad de ser castigado por discriminar correcta o incorrectamente los mensajes en su contexto familiar; además de estar prohibido metacomunicarse porque eso podría en riesgo la relación con su madre. Una forma de lidiar el doble vínculo es desarrollar síntomas característicos de la esquizofrenia como una respuesta coherente a su contexto de aprendizaje de descalificación sucesiva, como la comunicación metafórica. El lenguaje metafórico tiene la así la función de protegerlo de los demás, ya que si habla de manera ambigua no hay manera de acusarlo por lo que dice y puede evitar pelear con la familia. Como Haley lo señala: …if (a patient) uses a metaphor, you can see in that statement something about his relationship to his mother as a double bind... the fact that he uses a metaphor is the second part of what he was trying to say.. .it’s a way of 140 saying something without saying it directly, so there can be no accusations (citado en Govener, 2006, p. 47) La comunicación del esquizofrénico, por más extraña que parezca, habla sobre las relaciones que tiene el paciente con los demás y es una forma deficiente de metacomunicarse. Y dado que la relación con su madre es el modelo de las relaciones con los demás, en situaciones que contengan a algún elemento de la secuencia interaccional del doble vinculo, el paciente va a comunicarse de la misma forma. Hablar de manera metafórica le permite crear distancia con los otros, pues al mismo tiempo que no puede ser entendido, evita ser malentendido, y elimina cualquier posibilidad de que pueda ser cuestionado. Es pues una forma coherente de lidiar con el doble vínculo que tiene con sus familiares50. De este modo el doble vínculo es importante para la seguridad de la madre y ayuda mantener la homeostasis familiar, como lo pensaba Jackson: “the idea that there is a connection between the double-bind and the family groups in which it happens, and this family homeostasis business” (citado en Govener, p. 73). El doble vínculo tiene la función de mantener a estabilidad de la familia frente al cambio, y la sintomatología del paciente es la que permite mantener en la homeostasis de su sistema familiar funcionando como un mecanismo corrector. Para los autores los principios que explican a la esquizofrenia bajo este enfoque están presentes en otros fenómenos comunicacionales como en el juego, el humor, el ritual, y la ficción; en la poesía, por ejemplo, las metáforas están rotuladas, mientras que en la comunicación del esquizofrénico las metáforas que carecen de rotulo. En el caso de la hipnosis sospechan que también se presentan dobles vínculos, ya que las alucinaciones pueden ser respuestas a mandatos contradictorios por medio del desplazamiento de tipos lógicos; pero que también pueden ser terapéuticos, por lo que creen que entender y usar el doble vínculo puede llevar a realizar innovaciones en las técnicas terapéuticas y hacer así que el paciente responda de manera diferente. De hecho, después de hablar con Alan Watts, estudioso de las tradiciones espirituales de oriente, Bateson advirtió que el koan podía funcionar de manera terapéutica. Con la hipótesis del doble vínculo se inaugura la explicación de la etiología de la esquizofrenia de manera interaccional. La psicopatología deja de ser interna al sujeto y la atención se pone en la comunicación familiar del paciente esquizofrénico. Lo cual resulta 141 significativo, pues las demás explicaciones, sobre todo las psicoanalíticas, suponen que la naturaleza de la patología es intrapsiquica. Por lo tanto entender la enfermedad en términos comunicacionales y a los síntomas como respuesta coherente a las relaciones familiares del paciente suponía un gran cambio teórico en los estudios sobre la esquizofrenia. Y significa pasar la unidad de análisis del individuo al sistema de interacciones (Vargas, 2004 y 2007). En relación a la presente investigación resulta de sumo interés una cita de este artículo: But metaphor is an indispensable tool of thought and expression—a characteristic of all human communication, even of that of the scientist. The conceptual models of cybernetics and the energy theories of psycho-analysis are, after all, only labeled metaphors. (Bateson, et al, 1956, p. 253) Las implicaciones de esta cita sugieren que en primer lugar los autores piensan que la metáfora es un elemento ineludible y necesario de las actividades cognoscitivas y comunicativas del hombre, incluida la ciencia.51 La segunda parte de la cita hace referencia a la presencia de metáforas en la ciencia, y a la relación entre metáforas y modelos y, aunque no explicitan la naturaleza de esta relación, sí afirman que los modelos conceptuales derivados de la cibernética y del psicoanálisis son sólo metáforas rotuladas (labeled)52. Ya se había señalado la crítica de Bateson a la metáfora de la energía que configura al sistema conceptual del psicoanálisis53. Sin embargo, con ello también reconocen que su modelo explicativo de la etiología de la esquizofrenia, al tener como base los conceptos de la cibernética, también usa como principios explicativos metáforas rotuladas. Lo cual es coherente con la propuesta de nuestra investigación, la cual se detallara en la sección 4.3. Después de su publicación, el impacto de la hipótesis del doble vínculo fue amplio e inmediato en los círculos psiquiátricos, ya que fue sumamente discutida y criticada por varios años, pues aunque inauguraba un nuevo enfoque para explicar la etiología de la esquizofrenia, eso no significaba que estuviera libre de errores, de hecho la manera en que se presentaba daba a entender que el comportamiento de los miembros de la familia se debía a sus motivaciones individuales y que la madre coaccionaba a la “víctima” (hijo) de manera unilateral. También hubo muchos malentendidos por parte de los especialistas sobre la propuesta y se le cuestionaba que no tuviera soporte experimental. Por lo que los autores debieron hacer precisiones en los años siguientes como parte del proyecto de la comunicación esquizofrénica y buscar soporte de 142 datos empíricos por medio del análisis de entrevistas grabadas con pacientes esquizofrénicos y sus familias, y videos de la interacción entre madres y niños pre-esquizofrénicos para poder ver secuencias comunicacionales del doble vínculo. Al mismo tiempo que se publicaba el doble vínculo, en 1956, Bateson se integraba, invitado por el antropólogo americano Ray Birdwhistell, en otra investigación multidisciplinaria llamada “The Natural History of a Interview” (La Historia Natural de una Entrevista), la cual consistió en un grupo de investigadores que se reunió de 1955 a 1965 en el Center for Advanced Study in the Behavioral Sciences de la Universidad de Stanford para estudiar la comunicación tal como se da y sin la menor intervención de teoría en la recolección de los datos. El proyecto fue organizado por Frieda Fromm-Riechman y tuvo como investigadores al lingüista Norman McQuown y al psiquiatra Henry Brosin. Bateson aporto un filme conocido como “Doris” en el que él entrevista a una paciente en tratamiento psiquiátrico. El grupo analizo, describió y transcribió detalladamente esa conversación, así como el movimiento de sus cuerpos y sus inflexiones de voz (Leeds-Hurwitz, 1988; Winkin, 1982). En este proyecto Bateson tuvo la oportunidad de realizar el estudio natural de la entrevista54 y de definir las premisas teóricas que conformaron su marco de referencia para el estudio de la comunicación en ese proyecto, y en sus propias investigaciones, entre las cuales enlista el psicoanálisis, la Gestalt, y su teoría del aprendizaje, a las que les aplica la estructura jerárquica de los Tipos Lógicos; además del enfoque interaccional de la comunicación de Sullivan y G. H. Mead y la observación naturalista55 (Bateson, 1971b). La mayor crítica al doble vínculo fue que supone que la madre tiene motivos, como la ansiedad, para provocar tal situación, lo cual representa reminiscencias de una explicación intrapsiquica de la etiología de la esquizofrenia. Por ello, se procedió a refinar el concepto del doble vínculo con categorías que hicieran énfasis en su naturaleza comunicacional y a describir las características del sistema interaccional familiar en donde se produce tal situación basado en modelos conceptuales: “cybernetics, information theory, and the theory of games provided us with entirely new and much rigorous models for thinking about social and interpersonal process” (Bateson, 1959, p. 111). Es importante advertir que Bateson piensa que estos modelos proveen de un mejor lenguaje para describir los procesos interaccionales. Por lo cual comienza a modelar a la familia como un sistema cibernético para entender la dinámica que crea y mantiene los contextos de aprendizaje del doble vínculo. 143 Fiel a su aproximación antropológica, Bateson (1959) busca describir la historia natural de las interacciones características de las familias con un miembro esquizofrénico, usando como modelo conceptual los sistemas auto-correctivos que buscan un estado estable. La familia es vista como un todo que busca un estado estable, la cual por medio de mecanismos correctores mantiene la homeostasis familiar56. El equipó Bateson había observado que cuando un paciente mejora otros miembros de la familia empujan al paciente a regresar a su condición sintomática, u otro miembro de la familia comienza a mostrar síntomas psiquiátricos; por lo cual Bateson supone que hay variables fijas o premisas que mantienen constante a la familia dentro de cierto rango restringido de interacción. En ese sentido, el paciente se sacrifica para mantener la homeostasis familiar, más cuando él deja ese rol otro miembro de la familia asume el lugar. Si se define a la esquizofrenia producto de distorsiones en la comunicación, en la familia todos comparten como hábito o premisa la comunicación distorsionada; cada comportamiento y función entre los miembros encaja dentro de la subcultura familiar formando un sistema autorregulado, para garantizar mantener la homeostasis. Por ello resulta imposible señalar a un miembro como el causante de la patología familiar, ni es posible identificar lo desviado en ninguno de los miembros del sistema familiar desviado, ya que son las premisas que comparten las que gobiernan la interacción entre ellos y las que indican la diferenciación entre sus roles. Al observar que estas familias tienen un margen de cambio muy limitado, Bateson (1959) piensa que es necesaria una teoría de la homeostasis familiar que permita explicar la interacción entre los miembros de la familia esquizofrénica. Bajo este esquema, la descripción del sistema familiar patogénico es el siguiente: mientras el paciente esquizofrénico actúa de acuerdo al contexto de aprendizaje en el que ha sido entrenado, en parte determinado por su propio comportamiento; los miembros de la familia actúan de tal modo que refuerzan la percepción del paciente, comportándose de acuerdo al tipo de contexto que perciben y que contribuyen a construir con sus acciones previas. De este modo todos los miembros de la familia actúan de acuerdo al contexto que perciben y mantienen por su mismo comportamiento (Bateson, 1959). El doble vínculo se vuelve mutuo y reciproco por ser la regla que define la realicen entre la familia, de tal modo que ninguno de los participantes puede emitir un mensaje metacomunicativo sin distorsión (Bateson, 1960). El contexto formal que percibe el paciente es uno en donde recibe mensajes incongruentes por parte de los padres, se les prohíbe comentar dichas incongruencias y además 144 se le prohíbe escapar del contexto. Las particularidades del comportamiento del esquizofrénico están pues determinadas en parte por el sistema comunicacional familiar, él lo pone en contextos de aprendizaje donde aprende a comunicarse de manera esquizofrénica. La hipótesis del doble vínculo tiene el fin de describir formalmente los hábitos comunicacionales del paciente esquizofrénico y las secuencias de la experiencia que han llevado al paciente a desarrollar tales secuencias distorsionadas en la comunicación. De acuerdo a esta hipótesis la repetida experiencia del castigo por indicar el acertadamente el contexto de su mensaje, sumado a la descalificación de los mensajes paciente enmarcados de manera diferente a su intención, puede llevarlo a actuar de tal modo que se comporte como si esperara ser castigado y a que sus mensajes van a ser tergiversados (Bateson, 1960). Bajo esta secuencia interaccional el self del paciente sólo puede ser destruido. Para protegerse de esta situación el paciente envía mensajes que no puedan ser malinterpretados ni que lo identifiquen, eliminando u omitiendo la información metacomuncacional del mensaje como la fecha, el lugar, el tiempo, quien lo envía y para quien, como cuando elimina los pronombres personales, y la clase de relación que tiene con la otra persona; o también puede omitir mencionar que el código que utiliza es metafórico. De esa manera define la clase de mensajes que configuran la relación entre él y otra persona con el mensaje: no hay relación entre nosotros (Bateson, 1959; 1960). Bateson (1959) advierte que el paciente además de defenderse puede atacar al responder a los mensajes del padre, generalmente pasivo, como si fueran de una clase diferente, o buscar imponerle las prohibiciones de características del doble vínculo: de comentar la incongruencia de los mensajes y escapar del campo. El esquizofrénico aprende a esperar que su universo de experiencia este organizado bajo la misma pauta formal, y actúa como si este estuviera presente de manera permanente, lo que hace que por un lado contribuya a mantener el contexto traumático, y que por otro lado en contextos ajenos a la familia, el esquizofrénico envíe esta mensajes distorsionados y sea entonces clasificado como “loco”. Bajo esta estructura relacional la naturaleza patológica de la familia es resultado de su organización e interacción. La patología no se explica entonces a nivel individual, sino a nivel familiar. Pero Bateson se sigue preguntando por la manera en que mantiene la homeostasis en un sistema con tal dinámica, dice: 145 What we need in order to construct a generalized theory of the family (within which the pathogenic family will be a special case) is a mapping of the homeostatic mechanism which determines family organization (…). What ‘symptoms’ in individual behavior or subgroup characteristics serve to evoke the corrective process? (Bateson, 1959, p. 123) Parecido a su propuesta de inicial de una teoría general de la comunicación que explicara las distorsiones comunicativas, Bateson plantea la posibilidad de la construcción de un modelo general de la familia que describa los mecanismos homeostáticos, donde las familias patógenas sean un caso particular. Además sospecha que los síntomas sirven como mecanismo homeostático para regular el sistema familiar. Para responder al porque en las familias que tienen un miembro esquizofrénico se repite el doble vínculo Bateson plantea la necesidad de un modelo conceptual que describa ese patrón. Toma como modelo la teoría de juegos de von Neumann, en este modelo los jugadores ideales tienen que formar coaliciones para garantizar la máxima ganancia, pero cuando son más de tres jugadores las combinaciones posibles para hacer coaliciones hacen que sea imposible hacer colaboraciones estables. Del mismo modo en la familia esquizofrénica dos miembros no pueden formar una coalición estable, pues eso supondría entrar en conflicto abierto con otro miembro (Bateson, 1958c; 1960). Y dado que en estas familias generalmente los padres tienen un conflicto no declarado que incrementa los síntomas del paciente, se torna imposible generar coaliciones estables. Más cuando el conflicto parental se manifiesta, los síntomas disminuyen. De igual modo en el contexto psiquiátrico, cuando entre el medico u la enfermera hay un conflicto encubierto los síntomas del paciente aumentan57 (Bateson, 1959). El intento de usa la teoría de juegos como modelo fue comenzar desarrollar un lenguaje descriptico en términos de ser vista como un sistema, en lugar del individuo, para poder explicar la dinámica familiar (Bateson, 1960)58. Ante un sistema familiar donde no se puede formar coaliciones, hay un miembro con graves perturbaciones en la comunicación, y el self de los miembros está siendo continuamente negado, Bateson (1961) se pregunta cómo es posible que tenga estabilidad. Al observar a las familias nota que siguen siendo familia a pesar de la infelicidad de sus miembros, son estables con respecto a la oración descriptiva: “Esta familia contiene un miembro esquizofrénico”, de tal 146 modo que siempre haya alguien que cumpla el papel del paciente; que la familia como unidad trata de mantener una apariencia de estabilidad externa; y que las relaciones entre los miembros se mantienen por mucho tiempo incambiables a pesar de los procesos de crecimiento y maduración. Lo que contribuye a situaciones como la sobreprotección y el doble vínculo. Para describir este estado estable, Bateson propone dos niveles y ordenes de estabilidad jerarquizados en tipos lógicos: feedback y calibración59. Bateson sostiene que la estabilidad de la familia se logra por una combinación de ambos niveles de corrección: We must expect that the ongoing truth of any given descriptive statement about a system will be maintained by a hierarchy of mechanisms some of them feedback, some of them calibration. Let me recall again the fact that in human behavior there is a tendency for feedback mechanisms to be replaced gradually by the calibrational mechanisms of habit (Bateson, 1961, p. 120). Para el antropólogo la calibración es de un tipo lógico más alto que la retroalimentación, ya que es la que establece los hábitos de una persona en el sistema. Por ello los hábitos comunicacionales del paciente esquizofrénico están calibrados de tal modo en que siempre distorsiona su comunicación, aun cuando está fuera del sistema familiar, y su respuesta se es calificada como inadecuada. La familia como totalidad esta calibrada para evitar disrupciones externas, de ese modo mantiene su estabilidad ante su comunidad, y asegura la cercanía e interdependencia entre sus miembros. Por medio de la calibración se establecen las reglas familiares que organizan la interacción familiar. Lo cual explica que, aunque el sistema familiar es patógeno, se mantiene estable. La mayor corrección a la hipótesis del doble vínculo fue dejar de ver al individuo que tiene los síntomas como el esquizofrénico y pasar a pensar a la familia como un sistema homeostático en la que la comunicación esquizofrénica es la regla. Al final del proyecto los miembros del equipo decidieron escribir un artículo sobre el doble vínculo firmado por los cuatro, en el que aclaran a la comunidad clínica que el enfoque de la hipótesis es comunicacional y señalan que es resultado de estudiar la comunicación en términos de los niveles que establecen los tipos lógicos. Agregan lo siguiente: “In schizophrenia the double bind is a necessary but no sufficient condition in explaining etiology and, conversely, is an inevitable byproduct of schizophrenic communication” (Bateson, Jackson, Haley & Weakland, 1963, p. 42), lo cual 147 significa que aunque alguien esté en un doble vinculo no es una condición suficiente para que desarrolle síntomas característicos de la esquizofrenia, ya que hay otros factores que tienen influencia en este proceso. Por último aciertan afirmando que el doble vínculo no es una condición que se imponga de manera lineal y unilateral, como lo daba a entender su primer presentación, sino que todos los involucrados están atrapados en el sistema de comunicación distorsionado debido al intercambio de definiciones de la relación conflictivas entre los miembros de la familia, por lo que no cabe hablar de víctima o de vinculador (binder): “Ya no es el doble vinculo en el seno del sistema familiar sino es el sistema familiar en el seno de la doble coacción” como lo dice de inmejorable forma Winkin (1982, p. 43). En un artículo posterior Bateson (1971g) reconoció que al reificar la hipótesis del doble vínculo se le trato como una cosa que podría ser contada, lo cual es un error pues es una secuencia comunicacional que no está sujeta a medición. Él agrega lo que sea tal vez el aspecto más olvidado del doble vínculo: que puede ser un factor formal para el desarrollo de la creatividad. Desde un enfoque evolutivo Bateson sostiene que hay dos tipos de cambios adaptativos regulados por circuitos de retroalimentación: cambios de primer orden que resuelven problemas por ensayo y error y que son resultado del aprendizaje simple; y cambios de segundo orden que integran clases de problemas en un conjunto, y que son resueltos por un conjunto más pequeño de premisas, las cuales conforman hábitos de solución de problemas, que permiten una mayor economía al proceso adaptativo, pero que al ser más abstractos no son generalmente examinados. Estos hábitos son producto del deuteroaprendizaje. Bajo ese contexto, si bien el doble vínculo es una experiencia que contribuye a desarrollar los síntomas de la esquizofrenia, también exige a los individuos a desarrollar adaptaciones creativas, en sus palabras: “Double bind theory asserts that there is an experiential component in the determination or etiology of schizophrenic symptoms and related behavioral patterns, such as humor, art, poetry, etc.” (1971g, p. 277). Para hablar de este conjunto de actividades acuña el término de síndrome transcontextual, el cual genera los hábitos que describen los mensajes que definen las relaciones, el doble vínculo contribuiría a la formación de los síndromes transcontextuales que si bien pueden llevar a una situación de dolor por que las reglas aprendidas son equivocadas, también puede llevar a superar los contextos de aprendizaje y promover el proceso creativo como en la poesía y otras formas elevadas del arte. 148 A consecuencia de la publicación, discusión y revisión del doble vínculo las líneas de investigación del equipo Bateson se ampliaron con el fin de conseguir evidencia sobre esta condición, y estudiar la organización familiar, la terapia, y la esquizofrenia como resultado de los conflictos en los niveles de la comunicación. En relación a la familia se desarrollaron proyectos con el fin de describir la estructura relacional de las familias y así poder distinguir a aquellas familias con un miembro esquizofrénico de otras, e identificar el tipo de sistema familiar en donde la esquizofrenia es una forma de adaptación (Haley, 1976). Además como producto del acercamiento y formación durante varios años de Haley y Weakland al lado de Erickson, publican un artículo juntos donde realizan la descripción de los procedimientos de Erickson en términos del lenguaje jerárquicamente organizado en niveles de comunicación (Erickson, Haley, & Weakland, 1959), en este artículo analizan la transcripción de la inducción al estado hipnótico que realiza Erickson a una persona por medio de los tipos lógicos y el doble vínculo. Por lo que se comienza a considerar el uso del doble vínculo de manera terapéutica60. Partiendo de la idea de que hay una similitud formal entre la estructura de la inducción al trance y la manera en que una madre lleva a su hijo a tener disturbios en la comunicación el equipo Bateson comienza a investigar los parecidos entre la psicoterapia y la psicopatología. Lo que marca el inicio del análisis de la terapia desde un enfoque comunicacional. Por ello desde 1958 empiezan a tratar familias completas, lo que se dio un fuerte perfil clínico a las líneas de investigación (Haley, 1976). Debido al desarrollo de estas investigaciones, en 1959 reciben fondos para estudiar la esquizofrenia por el National Insitute for Mental Health (NIMH); y después la Foundations Fund for Research in Psychiatry subsidia una investigación sobre comunicación y doble vinculo en familias normales y anormales; el último subsidio que reciben es para estudiar la terapia con familias esquizofrénicas. Por lo que el equipo comienza la observación de la interacción entre familias y pacientes en sesiones terapéuticas (Weakland, 1960). El estudio de las familias requirió filmar las secuencias de su interacción, el comportamiento del esquizofrénico en su contexto familiar y las entrevistas que se les hacían para documentar los resultados. Lo que representa un avance metodológico en el estudio de la familia y las enfermedades mentales en la psiquiatría. Incluso en esta época era consultado Ray Birdwhistell, padre de la kinésica, para que ayudara en el análisis del movimiento corporal. 149 Sin embargo el doble vínculo no se prestaba para el estudio experimental por la gran cantidad de variables involucradas en el estudio de la comunicación, ya que no es posible contar dobles vínculos por los niveles de comunicación involucrados en la interacción entre las personas61. Ni tampoco progresaban los intentos de clasificación de las familias por razones similares. Además el enfoque de Bateson siempre fue naturalista debido a su formación antropológica, por lo que prefería las observaciones naturalistas con la menor cantidad de manipulación y teoría que comprometiera la fidelidad de los datos. A partir de los cambios en los objetivos de la investigación del equipo Bateson orientados a la investigación clínica, Bateson comienza a distanciarse del grupo pues su principal propósito sigue siendo el desarrollo de una teoría general de la comunicación. En 1960 Bateson regresa a su interés por la comunicación animal y con el financiamiento de la National Science Fundation estudia las señales analógicas en los pulpos, instalando pulpos en el Hospital de Veteranos y en su casa. Es ayudado por Lois Cammack, con quien se casa en 1961, después de divorciarse de Betty en 1958. Progresivamente va dejando a un lado el proyecto de la comunicación en personas con esquizofrenia para dedicarse a estudiar la comunicación en mamíferos. El proyecto termina de manera definitiva en 1962. Durante los diez años de duración del proyecto se publicaron en total 73 artículos, solo dos firmados por todos los miembros del equipo (Wittezaele y García, 1994). En 1961 les otorgan a Bateson y a Jackson el Frieda Fromm-Reichmann Award por parte de la “American Academy of Psychoanalysis”, por sus investigaciones sobre la etiología y terapia de la esquizofrenia (Lipset, 1991). La relevancia de las investigaciones desarrolladas por el equipo Bateson es que son los primeros en modelar al lenguaje por medio de la teoría de los tipos lógicos; en inaugurar el estudio de la etiología de las enfermedades mentales desde un enfoque comunicacional; en describir la esquizofrenia como disturbios en la comunicación producidos por la confusión de los niveles de los mensajes; en describir el contexto de aprendizaje formal por el cual se desarrollan los síntomas característicos de la esquizofrenia; en examinar el proceso terapéutico en términos comunicacionales y paradójicos; en modelar a la familia como sistema cibernético y homeostático, y, en suma, en empezar a desarrollar un lenguaje interaccional para la explicación de la etiología de las enfermedades mentales y del proceso terapéutico. Bateson asimilo la tradición cibernética y adopto sus categorías como metáforas para el estudio de la comunicación. Todas estas investigaciones serán recuperadas, sistematizadas y 150 enriquecidas por los miembros del Mental Research Institute para desarrollar el enfoque comunicacional, interaccional y pragmático del comportamiento. 3.5 Etólogo Al termino del su proyecto sobre las paradojas en la comunicación, Bateson se desplaza nuevamente de campo disciplinario, pero continua estudiando la comunicación usando como premisas los conceptos de la cibernética y de la teoría de la información, aunque ahora de los animales a partir de 1963. Por ello, en la primavera de ese año la nueva familia Bateson se muda al “Communication Research Institute”, en las Islas Vírgenes, donde trabaja como etólogo junto con John Lilly para estudiar los hábitos comunicativos de los delfines por un año. En ese mismo año le dan el “Career Development Award”, otorgado por el “National Institute of Mental Health”. Después, de 1964 a 1971 vive en Hawái para trabajar en él “Sea Life Park” donde investiga, junto con Karen Pryor, la comunicación de los delfines y cetáceos (Lipset, 1991). Mediante esos proyectos Bateson busca explicar el de desarrollo adaptativo y evolutivo de la comunicación, principalmente de los mamíferos, para ello replantea su teoría del aprendizaje sobre principios comunicacionales. Caracteriza al aprendizaje como un fenómeno comunicacional por medio del concepto de redundancia, el cual Shannon presento en la séptima conferencia Macy, y Bateson define de la siguiente manera: “The message material is said to contain redundancy if, when the sequence is received with some items missing, the receiver is able to guess at the missing items with better than random success.” (1968a, p. 421). Un mensaje desencadenado por una secuencia de eventos tiene redundancia cuando el observador puede adivinar el contenido extraviado o faltante del mensaje con un éxito mayor que el debido al azar, por medio de la parte del mensaje que recibe. Para ser más preciso Bateson agrega: We may say that what is on one side of the slash contains information or has meaning about what is on the other side. Or, in engineer's language, the aggregate contains "redundancy." Or, again, from the point of view of a cybernetic observer, the information available on one side of the slash will restrain (i.e., reduce the probability of) wrong guessing. (1971d, p. 140). Para entender este concepto imagínese una secuencia dividida o cortada por una barra, para el observador el lado perceptible de la barra A tiene información o significado sobre el lado 151 de la barra B, de modo que la secuencia total tiene redundancia, pues permite al observador adivinar la información del lado B por medio de la información de A, con un éxito mayor al obtenido al azar. La redundancia funciona porque la información (en el sentido de Wiener) del lado A restringe necesariamente la posible información del lado B. Lo que dice A en una conversación impone restricciones a las respuestas de B: por ello cada pregunta contiene a su propia respuesta. Para Bateson (1968a) la redundancia es sinónimo de “significado”, pues si el receptor puede adivinar las partes faltantes del mensaje a partir de las partes que recibe, las partes que recibe tienen un significado que remite al significado de las partes faltantes. De ese modo el observador puede realizar predicciones sobre el resto de la secuencia a partir de los mensajes que recibe. Para poner un ejemplo, al observar la parte superior del cuerpo de una persona se puede adivinar que hay una parte inferior; y por medio de ruidos en la cocina, se puede adivinar que hay personas dentro de ella. Piénsese en la función de autocompletar de cualquier navegador de internet, que por medio de redundancia va adivinando la palabra u oración mientras se la escribe. Por lo anterior Bateson sostiene lo siguiente: “The essence and raison d'etre of communication is the creation of redundancy, meaning, pattern, predictability, information, and/or the reduction of the random by "restraint." (1971d, p. 141). Hay que notar que utiliza como sinónimos los términos de redundancia, significado, información y pauta, porque todos hacen referencia a la reducción del azar por medio de restricciones a través del intercambio de mensajes entre un organismo y su ambiente, y con otro organismo. Cada mensaje intercambiado contribuye a la creación de redundancia, la cual garantiza la regularidad necesaria para que un organismo se adapte a su ambiente. Bajo este esquema Bateson (1970b) define el aprendizaje como la recepción de información por parte de un organismo. Y dado que cada comportamiento, es decir, toda señal observable de un organismo a otro es comunicación, cada mensaje entonces crea redundancia; además sostiene que la redundancia se puede generar por medio de dos tipos de comunicaciones o códigos: el analógico y el digital (Bateson, 1966). En la codificación analógica las magnitudes de la comunicación corresponden con las magnitudes del sujeto del discurso, i.e., la magnitud de un gesto, la intensidad de la voz, la tensión del musculo corresponden, directa o inversamente proporcional, a las magnitudes de la relación, el cual es el tema del discurso. Las señales kinésicas y paralingüísticas que componen a la comunicación analógica son generalmente 152 inconscientes, y sirven principalmente para afirmar algo sobre la naturaleza de la relación entre un organismo y otro; como el establecimiento de los patrones de amor, dependencia, odio, etc, en la relación. Mientras la codificación digital está compuesta de signos convencionales organizados a partir de reglas llamadas algoritmos. Los signos son los nombres que asignan a una cosa, por lo que tienen una relación arbitraria con la clase que representan. Por ello, el lenguaje verbal es casi exclusivamente digital y sirve para hablar sobre cosas e indagar sobre las contingencias de la relación entre dos personas. Para Bateson (1968a) los mamíferos no humanos se limitan a crear redundancia por medio del intercambio de mensajes en código icónico o analógico, por lo que toda su comunicación habla sobre la relación que tiene un organismo con su medio ambiente, o con otros miembros de su especie. La codificación analógica es la base comunicacional de los mamíferos y por ello su discurso trata exclusivamente sobre las reglas, pautas y contingencias de la relación entre ellos. Mientras que en los humanos la comunicación evoluciono y permitió el desarrollo del código digital a la par que el analógico; lo cual le da la posibilidad de hablar sobre objetos particulares por medio del lenguaje verbal. Debido a esto cualquier mensaje que emita una persona, además de hablar sobre un objeto o persona por medio del código digital, habla también sobre la relación entre esa persona y la otra por medio de las señales kinésicas y paralingüísticas características de la codificación analógica. Para el antropólogo, a pesar de la novedad evolutiva que supone la comunicación digital, la creación de redundancias en las relaciones entre las personas es principalmente por medio de la comunicación analógica; ya que la comunicación kinésica se complejizo, y la paralingüística evoluciono paralelamente al lenguaje verbal, lo cual confirma la estructura jerárquica de la comunicación en niveles62. En resumen, el aprendizaje en el hombre es el resultado del aumento de redundancia por medio de intercambio de señales de codificación analógica y la digital. Al definir el aprendizaje como un fenómeno comunicacional, Bateson pasa a modelar el aprendizaje por medio de la teoría de los tipos lógicos para jerarquizarlo en niveles63. Al terminar estas investigaciones Bateson se instala en California en 1972 para desempeñarse como profesor en la Universidad de Santa Cruz; en el mismo año publica su Steps to an ecology of mind, en el que da a conocer su propuesta de una epistemología cibernética, la cual revisaremos a continuación (Lipset, 1991). 153 3.6 Pasos hacia una Epistemología Cibernética The road of excess leads to the palace of wisdom. William Blake El Sol no rebasará sus medidas. Pues si no, las Erinias, defensoras de la Justicia, darán con él. Heráclito En esta última sección del tercer capítulo se expone la propuesta de Bateson de una epistemología cibernética, la cual desarrollo en la última década de su vida para sintetizar el enfoque cibernético junto con el pensamiento ecológico. Se presenta con el fin de analizar el desarrollo de la tradición cibernética que siguió Bateson, pues su propuesta epistemológica lo llevo a dar el salto de la cibernética de primer orden a la cibernética de segundo orden, y a proponer un nuevo marco epistemológico para las ciencias de la conducta. Y, aunque no influyo en las premisas del modelo clínico del BTC, si lo hizo en la justificación teórica de otros modelos terapéuticos. En primer lugar se amplían las razones de Bateson para estar en desacuerdo con la metáfora energética del psicoanálisis y la epistemología materialista basada en el dualismo cartesiano entre la mente y el cuerpo como fundamentos epistemológicos de las ciencias de la conducta. Después se describen los elementos formales con que Bateson caracteriza al proceso mental como un circuito cibernético; y en seguida se examinan los corolarios éticos de su propuesta. Para finalizar se discute su la herencia teórica de Bateson en las explicaciones de la psicología. Recapitulemos. Desde sus primeros trabajos etnográficos en Nueva Guinea, Bateson se sentía insatisfecho con las teorías antropológicas por su falta de rigurosidad científica, lo que lo llevo a buscar conceptos de otras ciencias para proponer nuevas explicaciones. Con la esperanza de encontrar herramientas conceptuales, asiste a las conferencias Macy, donde Wiener y McCulloch, especialmente este último, criticaban a la metáfora energética en que se basa el psicoanálisis como fundamento de las para las ciencias humanas, pues pensaban que dudosamente era científica. Bateson continúa esa crítica diciendo lo siguiente: 154 The nineteenth-century scientists (notably Freud) who tried to establish a bridge between behavioral data and the fundamentals of physical and chemical science were, surely, correct in insisting upon the need for such a bridge but, I believe, wrong in choosing "energy" as the foundation for that bridge (Bateson, 1971i, p. 8). Bateson rechaza la epistemología basada en la metáfora energética desde el comienzo de su trabajo en el análisis de la comunicación en el contexto psiquiátrico, y aunque celebraba el esfuerzo de Freud para relacionar las ciencias físicas con las humanas, lamentaba que el concepto que sirvió como puente fuera la energía, ya que se prestaba para producir equívocos teóricos como pensar que el comportamiento de los hombres es movida por impactos y regulado por las leyes de la conservación y transmisión de la energía; y a proponer entidades explicativas implausibles como la energía psíquica. Al respecto, el antropólogo agrega: … that we must change our whole way of thinking about mental and communicational process. The ordinary analogies of energy theory which people borrow from the hard sciences to provide a conceptual frame upon which they try to build theories about psychology and behavior—that entire Procrustean structure—is non-sense. It is in error. (Bateson, 1970a, p. 459) Bateson sostiene que las teorías psicológicas basadas en la metáfora energética están equivocadas, y que son peligrosas para explicar el proceso mental y los fenómenos comunicacionales, por lo que resultaba necesario replantear los modelos teóricos de la psicología desde otras premisas. En sus investigaciones sobre la comunicación, Bateson decide utilizar la noción de información como el principio organizador que permitiera restablecer el puente entre los fundamentos de la ciencia y las ciencias de la conducta, y que sirviera para explicar el comportamiento entendido ahora como un fenómeno comunicacional. Junto con ello, la teoría de los tipos lógicos le posibilita jerarquizar la comunicación en niveles, y estudiar las consecuencias que tiene estar sometido a contextos comunicacionales de deuteroaprendizaje donde se confunden sistemáticamente los tipos lógicos, lo que lo llevo, junto con su equipo, a proponer la hipótesis del doble vínculo como un factor formal de la etiología de la esquizofrenia. Sin embargo, años después, para Bateson el doble vínculo representó la forma de llegar a una nueva 155 epistemología, dice: “Double-bind theory has been and is part of this general epistemology” (Bateson, 1978, p. 191). Pues pensaba que el doble vínculo, más allá de ser una teoría comunicacional sobre las enfermedades mentales, era parte de una matriz de ideas más amplia, de la cual el doble vínculo fue deducido, la cual proporcionaba la posibilidad de explicar los procesos mentales y así ofrecer una respuesta al problema epistemólogo de las ciencias de la conducta, desde las Meditaciones Metafísicas de Descartes, del dualismo mente-cuerpo. Para el antropólogo la premisa de la división entre la mente y el cuerpo producía dos clases de explicaciones: materialistas simples, o sobrenaturales; ambas equivocadas. Como bien lo resume el mismo Bateson: I regard the conventional views of mind, matter, thought, and materialism, the natural and the supernatural, as totally unacceptable. I repudiate contemporary materialism as strongly as I repudiate the fashionable hankering after the supernatural. However, the dilemma between materialism and the supernatural becomes less cogent when you discover that neither of these two modes, materialism and supernaturalism, is epistemologically valid (Bateson & Bateson, 1988, p. 61). Bateson critica la separación entre mente y cuerpo como premisa porque obliga a escoger entre una posición materialista que, o bien pretende cuantificar la mente, o que simplemente se niega a explicarla; o una explicación sobrenatural, donde la mente es trascendente al cuerpo. Para él, ambas teorías eran epistemológicamente incorrectas y peligrosas al separar ambos fenómenos, y con ello dejar sin explicación al proceso mental. La epistemología moderna históricamente ha oscilado entre privilegiar una de estas dos posiciones aparentemente excluyentes e irreconciliables, pero que están basadas en la premisa de que la mente y la materia son dos sustancias diferentes para conocer el mundo; la res cogitans y la res extensa para usar la terminología de Descartes. Y dado que el materialismo fue la postura dominante en los últimos siglos, la mente dejo de explicarse más allá de los círculos de los teólogos y los filósofos. Por ello, Bateson emprende la empresa teórica de replantear la explicación de la mente, como premisa epistemológica de las ciencias de la conducta, sobre las categorías de la teoría de la información y la cibernética. Vale la pena aclarar que para Bateson (1971f) la epistemología es en el sistema de supuestos sobre cómo se obtiene la información, sobre la naturaleza del 156 conocimiento y del universo, y sobre como conocemos. Las cuales constituyen el fundamento sobre la relación entre el hombre y la naturaleza. De tal modo que ese conjunto de principios sobre cómo se cree que es el mundo definen el modo en que se le percibe y se actúa dentro de él, por lo que las premisas epistemológicas implícitas gobiernan la relación entre el hombre y su ambiente; y las reglas bajo las cuales el individuo construye su experiencia (Bateson, 1971a). De modo que al revisar la división entre la mente y el cuerpo, y ofrecer una explicación cibernética de la mente, a partir de finales de la década de los sesenta hasta su deceso, Bateson intenta proponer una nueva epistemología para las ciencias de la conducta. Para ello, Bateson (1970a) comienza a distinguir entre dos mundos de explicación del proceso mental: el de la forma y el de la sustancia. Las explicaciones de la sustancia intentan responder de que esta hecho el mundo, y son iniciadas por los filósofos presocráticos que propusieron materiales como el agua o el fuego como la materia fundamental del cosmos; mientras que las explicaciones de la forma y la pauta fueron iniciadas por Pitágoras, y continuadas por los Gnósticos y los alquimistas. Sin embargo, Bateson (1968c) sostiene que a partir de Lamarck la mente se deja sin explicar y las teorías materialistas simplemente no la toman en cuenta dentro de sus teorías, como no lo hacen los conductistas en la psicología. Pero con el descubrimiento de la cibernética y la teoría de la información Bateson (1970a) tiene una base formal para pensar sobre la mente, por lo que propone un sistema explicativo donde caracteriza a la mente como un sistema cibernético Bajo ese contexto, al preparar una conferencia en honor a Korzybski en 1969, Bateson repensó el conocido aforismo del lingüista que dice que “el mapa no es el territorio” y entonces se preguntó lo siguiente: “What gets from the territory onto the map?” (Bateson, 1970a, p. 458). Es decir, que de los acontecimientos externos se marca en nuestras explicaciones del mundo. Su explicación de la mente se desencadena por esa pregunta e intenta responderla definiendo los cinco elementos formales mínimos que componen al proceso mental64. 1. El primer elemento que identifica Bateson (1978) es que la “mente” y el “proceso mental” ocurren en sistemas que están compuestos por agregados de partes, y son el resultado de la organización e interacción entre estas partes. Con ello pretende eliminar la posibilidad de atribuir mente a elementos aislados o particulares, y así evitar todo tipo de fundamentalismo materialista, o fisicalismo, para usar un término de la filosofía de la mente, que identifique a la 157 mente como la propiedad de uno o más elementos del universo; y más bien esperar encontrar el proceso mental como resultado de una clase particular de organización, independientemente del material en el que se corporice dicha organización. Por lo que nos advierte que su explicación de la mente está basada sobre el mundo de la forma y la pauta, y no en el de la sustancia. 2. En segundo lugar, el proceso mental no se desencadena por impactos, sino por diferencias. Para responder a lo que pasa del mapa al territorio Bateson contesta: “what gets from the territory to the map-i.e., from the outside world to the brain-is news of difference. If there is no difference in the territory, there will be nothing to say on the map which will remain blank.” (Bateson, 1978, p. 200). Es decir, si el territorio permaneciera uniforme, no se marcaria nada en el mapa, son las noticias de las diferencias las que quedan trazadas en el mapa. Una diferencia, según Bateson (1970a), no es no es una cosa ni un evento, al no tener dimensiones físicas el cero, al ser diferente del uno, puede ser una diferencia, lo cual es imposible en el mundo de la sustancia. La diferencia tampoco se encuentra entre las cosas, en el espacio entre ellas, ni en el tiempo. Piénsese en la diferencia de peso entre dos objetos A y B, como lo establece la ley Weber-Fechner, la diferencia no está en el peso del objeto A ni en el de B, ni en un espacio entre ellos: la diferencia es una razón entre ambas cosas al compararlas. La diferencia es una abstracción. Ahora bien, Bateson (1970a; 1971f) sigue a Kant en advertir que el acto primario del juicio es la selección de un hecho, de los potenciales hechos potenciales en un pedazo de tiza o del universo, y que se convierten en hechos efectivos. Del mismo modo que el noúmeno Kantiano, el territorio es incognoscible pues las diferencias potenciales son infinitas, por lo tanto no todas las diferencias potenciales del territorio pasan al mapa, por lo que es imposible pasar la cosa-en-sí (Ding an sich) a las explicaciones del mapa, ya que siempre hay una selección por medio de los órganos de los sentidos de las diferencias potenciales que se convierten en información efectiva. Debido a ello, Bateson define a la información de la siguiente manera: “A ‘bit’ of information is definable as a difference which makes a difference. Such a difference, as it travels and undergoes successive transformation in a circuit, is an elementary idea” (1971a, p. 321), las diferencias del territorio que se hacen diferencias en el mapa son información, esta viaja a través de los sentidos, donde es trasmitida y transformada a través de circuitos cerrados para convertirse en ideas. Las ideas son la unidad mínima que compone al proceso mental y son el 158 dato primario de la experiencia (Bateson, 1978). Las diferencias, en resumen, son abstracciones que vinculan al mapa con el territorio, y al sujeto con el mundo; que al recorrer los circuitos de trasmisión del circuito se vuelven inmanentes a la totalidad del sistema mental. Hay que advertir que si bien con elemento (1) se sostiene que las cosas no tienen ideas, con el (2) que las ideas no son cosas. Por lo que los átomos no tienen ideas (Bateson, 1976); y las neuronas no trabajan por medio de impulsos, sino con noticias de una diferencia (Bateson, 1971a). A partir de este elemento, al explicar el proceso mental como un fenómeno comunicacional, el antropólogo intentaba cambiar la premisa epistemológica del dualismo cartesiano mente-cuerpo de las ciencias de la conducta de una manera original, al evitar el materialismo reduccionista y las respuestas sobrenaturales. Y en lugar de partir de la división entre la mente y el cuerpo, parte del supuesto de que hay dos clases de mundos explicativos desde los cuales se puede explicar el proceso mental. Siguiendo a Jung, Bateson (1970a; 1971f) distingue entre dos clases de lenguajes explicativos: el del pleroma y el de la creatura. En el mundo del pleroma las causas son causadas por impactos y fuerzas por el intercambio de energía; este es el mundo explicativo de las ciencias duras. Mientras el mundo de la creatura se caracteriza porque en él los sucesos son desencadenados por diferencias, distinciones y clases; para Bateson el mundo de entendimiento de la creatura es el mundo de la comunicación, de la organización y del patrón. Y dado que la explicación del mundo mental no es reductible ni derivable de factores físicos, es decir, no corresponde al lenguaje del pleroma, sino más es bien es comunicacional, el lenguaje formal para la explicación de la mente y de las ideas es el mundo de la creatura. Dado que la trasmisión de diferencias desencadenan el proceso mental, y que siempre hay una selección de estas, la cosa-en-sí nunca entra al mundo comunicacional (Bateson, 1973). Por lo que el mapa sólo muestra una representación del objeto, y la mente está compuesta por mapas. La imagen que tiene el hombre del mundo es producto de las diferencias efectivas seleccionadas por él, es decir, información, pero no es una copia de la realidad. Por ello, el conocimiento del hombre sobre el mundo no es pues la mera contemplación pasiva de las cosas, sino que exige su participación por medio de la percepción selectiva e integradora de las diferencias trazadas por él. En este sentido, la epistemología que está proponiendo Bateson no es realista ingenua, sino 159 que afirma que el todo el conocimiento que tienen los hombres está compuesto de representaciones o percepciones de mapas de la realidad. 3. El tercer elemento que establece Bateson (1971f; 1978) es que para responder a las diferencias trasmitidas, el sistema mental debe obtener energía de su propio metabolismo, es decir, en el proceso mental la energía con que responde un organismo a las diferencias tiene que venir en parte de su propia reserva de energía. Si bien la diferencias desencadenan gasto de energía, no transmiten energía (Bateson, 1973). Con este elemento Bateson quiere descartar de su teoría de la mente al mundo explicativo del pleroma en el que los sistemas sólo trabajan a partir de la trasmisión de energía y que se mueven por impactos, y con ello distanciarse de las explicaciones de la conducta basadas en la física del siglo XIX, y en general de las explicaciones de las ciencias duras. El hecho de que los procesos mentales puedan responder con su propia reserva de energía, e incluso haya casos donde la energía gastada es inversamente proporcional a la energía recibida, como cuando un organismo busca alimento, insiste en el hecho que los procesos mentales no responden a impactos, y que las personas no se desplazan por ninguna clase de energía psíquica, sino más bien que las respuestas desencadenadas por las diferencias trasmitidas a lo largo de un circuito cerrado para responder son debidas a las propias reservas de energía y patrones de información dentro del sistema mental. 4. Enseguida Bateson (1971f) modela a los sistemas mentales como circuitos cibernéticos, estos pueden ser regenerativos e irse hacia la fuga, o ser auto-correctivos por medio del ensayo y del error. En este último caso donde los circuitos que actúan por ensayo y error, el proceso mental es capaz de aprendizaje. 5. El último elemento del sistema mental es que tiene que estar jerarquizado en tipos lógicos. Dado que el elemento mínimo que desencadena el proceso mental es la diferencia que hace una diferencia, es decir, una idea o información (2), cada diferencia forma una clase, por lo que se le puede aplicar la teoría de los tipos lógicos, y con ello conformar clases de diferencias, y clasificarlas en niveles para conformar Gestalten; de tal modo que cada subunidad Gestalt sea parte de una unidad más vasta. Por ello siempre está el riego de que el proceso mental cometa errores de selección en la clasificación de los mensajes (Bateson, 1978). La confusión de clases en los niveles de aprendizaje (4), puede dar lugar a disturbios en el proceso mental, como el doble vínculo, o promover la creatividad (Bateson, 1976). 160 A partir de estos elementos formales, para Bateson (1971f) todo sistema que cumpla con las condiciones necesarias que establece (1-5), independientemente del lugar y de la materia que los corporice, tiene propiedades mentales inmanentes al sistema. Ya sea un bosque o una sociedad, o cualquier otro agregado de organismos que cumpla con la estructura necesaria. Sin embargo, Bateson (1971f) advierte que la premisa que divide a la mente y el cuerpo trajo algunos problemas en la epistemología de las ciencias de la conducta, y dado que el proceso mental que él describe es capaz de aprendizaje, cuando la Mente asimila una serie de premisas equivocadas se vuelve patológica. Ya que cuando el error se vuelve inmanente al sistema mental, la Mente gobernada por una epistemología incorrecta es también capaz de error, y de insania. Además, al ser esta clase de premisas inconscientes, son difíciles notar y cambiar. Motivo por el cual Bateson decide reexaminar a la luz del sistema explicativo de la mente que propone los tópicos del self, el control, la unidad de supervivencia, y la consciencia y la adaptación, para corregir sus patologías. a) Self. ¿Dónde se encuentra entonces mi mente? Para explicar una unidad mental particular Bateson (1970a; 1973) afirma que se debe considerar el tipo de fenómeno que se pretenda explicar. Descrito de esa manera, para Bateson (1971a; 1971f; 1978) la unidad mental no termina en la piel, sino que incluye a todas las vías externas al cuerpo por donde se trasmiten las trasformaciones de las diferencias dentro del circuito cerrado (2). Por lo cual, ante la pregunta sobre sí las computadoras tiene mente y piensan, la respuesta es que lo que piensa es el circuito auto-correctivo total (4) compuesto por la computadora, más el hombre, más el ambiente. De análogo modo, lo que muestra características mentales inmanentes y piensa no es el cerebro en aislamiento, sino el circuito auto-correctivo total que opera por ensayo y error compuesto por el cerebro más el cuerpo más el ambiente. Para usar un ejemplo clásico de Bateson (1971a; 1973): en la actividad donde un hombre corta con un hacha un árbol. El sistema auto-correctivo que actúa por ensayo y error (4), incluye al hombre, al hacha, y al árbol; en este sistema se trasmiten diferencias inmanentes a lo largo de todo el circuito entre los componentes del mismo (2). Por lo que lo que muestra características de una mente inmanente no es uno de los componentes del circuito, sino el sistema total auto- correctivo. Insistimos: la mente no se termina en los límites de la piel, pues las diferencias y la información, es decir, las ideas son inmanentes a todo el circuito. 161 De igual modo, los límites del self dentro del circuito total son inexistentes. Describir la mente invocando al self es consecuencia de trazar una línea arbitraria en el circuito total que reifica una parte del mismo, por lo cual el self es una entidad ficticia que no debe utilizarse para explicar el comportamiento (Bateson, 1971a). b) Control. ¿Qué pasa entonces cuando se corta arbitrariamente el circuito mental auto- correctivo y se traza una frontera entre el self y las demás vías de transmisión de diferencias? Cuando se corta una parte del circuito y se separa el cuerpo de la mente, además de crear la entidad ficticia llamada self (a), se regresa a la premisa que sostiene que la mente controla al cuerpo, y que el ambiente está separado de la persona, por lo cual se empieza a luchar contra el ambiente y las demás especies. Para Bateson (1971f) la división mente-cuerpo es la premisa que faculta cualquier teoría de control. Por lo cual, Bateson examino el control como un problema epistemológico, derivado de la posición entre la mente y el cuerpo. En una conferencia no publicada dice: One of the major anti-human fallacies of the scientific community, perhaps especially the engineering community, is the premise that it is possible to have total control over an interactive system of which oneself is a part. Now this is a major pathology in family life, in marriage relations, in organization in general and so forth (…) but the ideas of fallacies of control in general are one of the major sources of social trouble and individual trouble. (Bateson citado en Harries-Jones, 1995, p. 7) De acuerdo a Bateson, el control de una parte del circuito sobre todo el circuito es una falacia teórica que tiene graves consecuencias a nivel pragmático en todos los ámbitos de la vida del hombre. Bateson (1971a) señala que ninguna parte del circuito puede tener control unilateral sobre las restantes. Adviértase, por ejemplo, en el funcionamiento de un sistema auto-correctivo (4) como lo es un motor de vapor con regulador (governator). El regulador recibe la trasformación de una diferencia entre el estado actual y el estado ideal de la velocidad, y después trasforma esa diferencia en un mensaje aferente. Las diferencias que envía se transmiten a lo largo del circuito y se trasforman (2) hasta regresar a su lugar de origen por medio del feedback negativo. De tal modo que el comportamiento del regulador está a su vez regulado parcialmente por su previo comportamiento y por las otras partes del sistema; mientras que la homeostasis del 162 sistema depende las trasformaciones de la diferencia a lo largo del circuito y el tiempo de recorrido de las diferencias a través de las vías de trasmisión; factores en los que el regulador no tiene ningún control. Con lo anterior se ejemplifica que las características mentales son inmanentes al circuito como totalidad, y no localizables en una parte del mismo; y que en ningún sistema con características mentales la parte puede tener control unilateral sobre la totalidad del circuito; ya que estos funcionan por medio de la causalidad circular, donde el control siempre es limitado. Aun con lo anterior, Bateson (1971f) reconocía que el control y el poder son mitos que auto-validan y refuerzan culturalmente, por lo que continúan regulando las relaciones entre el hombre y el ambiente, y la sociedad65. c) Unidad de supervivencia. Pero, ¿Que sucede cuando además de separar el self del circuito total, se quiere controlar al resto del sistema para garantizar la propia supervivencia? Desde la teoría evolutiva de Darwin se identifica como unidad de supervivencia por medio de la selección natural a un conjunto de individuos específico, ya sea un individuo, una familia, o una especie; cada uno de los cuales lucha por su supervivencia contra los demás o contra el ambiente. Sin embargo, Bateson (1970a) observa que las unidades evolutivas compuestas por organismos homogéneos es poca apta para sobrevivir; por lo que estas están más bien integradas por organismos heterogéneos para garantizar la variabilidad genética, y así la especie pueda ser flexible frente al cambio ambiental. Por lo que el sistema evolutivo actúa como un circuito cibernético auto-correctivo por medio del ensayo y error para mantener la homeostasis (4). Bateson (1971f) advierte que cuando se selecciona la unidad de supervivencia de ese modo es peligroso, porque lo que interesa es la unidad propia (a), y las acciones adaptativas de estas unidades, al buscar el control por medio en de una lucha en contra otras especies y contra el ambiente (b), pueden llevar a la destrucción del ambiente y de ellos mismos: “If the organism ends up destroying its environment, it has in fact destroyed itself.” (Bateson, 1970a, p. 457). Por lo cual Bateson (1970a; 1971f) sugiere corregir la unidad de supervivencia para que no sea un organismo, una familia, o toda la sociedad; no es un cambio de cantidad, sino de cualidad: pasar de la premisa de la lucha a la premisa de la pertenencia; por lo que la unidad de supervivencia que propone es el organismo flexible-en-el-ambiente. La unidad evolutiva queda conformada de la siguiente manera: E {S [F (I)]} 163 Donde I es organismo individual, F es familia, S es sociedad, y E es ecosistema. De tal modo que la unidad evolutiva funciona así: el organismo individual-en-la-familia; la familia-en- la-sociedad; y la sociedad-en-el-ecosistema. Ahora bien, recordemos que la definición de mente sostiene que es un circuito cibernético que actúa por ensayo y error (4), en el que se trasmiten y transforman las diferencias a lo largo de los circuitos (2); pero que además, las diferencias conforman clases o unidades Gestalt, las cuales están organizadas en jerarquías, de modo que cada unidad Gestalt es parte de una unidad superior. Lo cual quiere decir que la Mente está organizada en una jerarquía de subsistemas, o sub-mentes, y cada una de ellas forma parte de la Mente más amplia (5) (Bateson, 1970a). Bateson piensa que esta imagen de la Mente es idéntica a la unidad de evolución que propone. Dice: If, now, we correct the Darwinian unit of survival to include the environment and the interaction between organism and environment, a very strange and surprising identity emerges: the unit of evolutionary survival turns out to be identical with the unit of mind. (Bateson, 1971fp. 489) Bateson afirma que al haber isomorfia entre la estructura de la Mente organizada en jerarquías y la estructura de la unidad evolutiva, ambas son idénticas, de lo que se sigue que la Mente es inmanente al sistema evolutivo más amplio, o ecosistema. A partir de la identidad entre la unidad evolutiva y mental se desprenden algunas consideraciones éticas. Dado que cada paso en la jerarquía de la estructura evolutiva debe considerarse como un subsistema o mente individual, en lugar de una parte cercenada, el significado de supervivencia cambia, ya que no se limita a la supervivencia de un organismo o de un conjunto de ellos, ya que la transmisión de diferencias a través de los circuitos no se termina en los límites de la piel (2), sino consiste en la supervivencia del sistema de ideas inmanentes que recorren el circuito, las cuales se van a seguir trasmitiendo y trasformando a lo largo de los circuitos hacia otras partes de la jerarquía evolutiva y sub-mentes (Bateson, 1970a). Por lo que la ecología es redefinida como el estudio de la interacción y supervivencia de las ideas inmanentes en la totalidad de la estructura evolutiva. Es la ecología de ideas la que sobrevive (Bateson, 1971f). 164 Hay que notar que cuando la teología de una religión parte de la división mente-cuerpo, la idea de Dios queda necesariamente fuera o externa a las personas; la mente individual es localizada a una parte del cuerpo, self, (a); y el ambiente es visto como pura materia, por lo que se le puede explotar sin consideraciones, pues lo que importa es la supervivencia propia y la de la tribu a la que se pertenece, en consecuencia, se pasa a luchar contra la naturaleza y las otras especies (b). Es por estas razones que al inicio del análisis de este punto afirmábamos que cuando un organismo destruye a su ambiente, también se destruye a sí mismo; pues si un organismo contribuye a la degradación de la Mente a la cual pertenece, por actuar bajo premisas nocivas, eventualmente el sistema de ideas, al incorporar estas premisas y distribuirlas a lo largo de los circuitos que componen a la ecología (2), se volverá insano y terminara por afectar a todo el sistema cibernético (4), incluyendo a los organismos que participaron en su corrupción y degradación (Bateson, 1971f). Por ello citaba a San Pablo: “God is not mocked" (Bateson, 1970h, 509). Ya que cualquier disturbio en una parte del sistema ecológico se distribuye a lo largo del circuito, y afectara, por efectos de la causalidad circular, a la parte del sistema que inicio la fuga. Para corregir este visón Bateson afirma: The cybernetic epistemology which I have offered you would suggest a new approach. The individual mind is immanent but not only in the body. It is immanent also in pathways and messages outside the body; and there is a larger Mind of which the individual mind is only a sub-system. The larger Mind is comparable to God and is perhaps what some people mean by ‘God,‘ but it is still immanent in the total interconnected social system and planetary ecology (1970a, p. 468) Bateson intenta corregir esa imagen replanteando la relación entre el hombre y la naturaleza a partir de la epistemología cibernética, por lo que al igualar la Mente inmanente más amplia con Dios, es decir, con el sistema biológico más amplio, la mente individual sería una parte de la Mente inmanente al sistema evolutivo total. Sin embargo, hay que advertir que la idea de Dios no es la del motor inmóvil Aristotélico, sino que al ser la Mente-Dios la totalidad del proceso evolutivo, es capaz de mostrar características mentales como aprendizaje, cambio y 165 creatividad (4, 5). A partir de este marco, Bateson (1970a) invita a tener mayor humildad, reducir la amplitud del self y la consciencia, y gusto por participar en la conformación de la totalidad. d) Conciencia y adaptación. ¿Qué pasa entonces cuando se decide ignorar la naturaleza cibernética de la mente, la sociedad y la naturaleza en el proceso adaptativo del hombre? Bateson (1968c; 1971b) sostiene que el funcionamiento de la sub-mente o mente individual que tiene cada individuo (c) también está sometida a una organización jerárquica en niveles: la consciente y la inconsciente. Pues sólo una cantidad de información, es decir, de diferencias que hacen una diferencia, del total de diferencias que recorren los circuitos que componen al sub-sistema mental (2, 4), es reportada a la pantalla de la consciencia por la selección sistemática que se hace de ellas; de tal modo que sólo se muestra una parte de la totalidad de la mente individual. Esto es debido a que una parte de la mente no puede reportar la totalidad de ella misma, pues para ello sería necesario integrar otro sistema de circuitos que reporte sobre la parte que reporta ese circuito, lo que requeriría de otro circuito extra para realizar tal tarea. Cada aumento de circuitos lleva a una disminución de la consciencia total. Por lo que la consciencia siempre es limitada por la necesidad de economía en el proceso mental. Debido a ello, gran parte de la información tiene que ser necesariamente inconsciente para el correcto funcionamiento de la mente, como el proceso de formación de la percepción de la perspectiva (Bateson, 1970a; 1971f); las reglas de definición y pautas de relación deuteroaprendidas (Bateson, 1973); y en general los hábitos mentales. La información que es reportada a la consciencia y que constituye los datos de la percepción es seleccionada de la totalidad de la información de la mente por medio de la atención selectiva orientada por propósitos (1968b; 1968c). Sin embargo, acorde a la definición de mente que se ha propuesto, la trasmisión y trasformación de las noticias de las diferencias a lo largo del circuito auto-correctivo no se termina en los límites de la consciencia, sino que se extienden hasta la parte inconsciente (Bateson, 1971a; 1973). Pero, dado la función de la información que tiene la consciencia es la adaptación, cuando la mente individual percibe exclusivamente en términos de la información seleccionada por el propósito consciente, aunado a la tecnología, entonces las acciones adaptativas pueden desequilibrar a los diferentes niveles de la Mente descritos (c): el individuo, la sociedad, y el ecosistema. Los cuales son sistemas cibernéticos auto-correctivos que buscan la homeostasis (4) (Bateson, 1968b; 1968c; 1971f). 166 Bateson advierte que debido a la orientación teleológica el hombre ha perdido de vista la estructura sistémica total de la naturaleza y de la mente; al actuar en base al propósito ha introducido escaladas hacia el desequilibrio, comprometido la homeostasis de estos sistemas. Al habituarse a una distorsión sistemática de la naturaleza sistémica del mundo por los propósitos, se le impone una estructura lineal al mundo que no puede tener, y más bien hace forzar a la naturaleza a que se comporte de este modo, modificando gravemente el sistema ecológico total, que puede tener otro tipo de organización más cercano a un sistema cibernético homeostático (Bateson, 1968b; 1968c). Cuando se conoce desde una epistemología dualista y lineal, como lo hace la ciencia tradicional, se obliga a la naturaleza a dar una respuesta en términos de esa epistemología, no en la epistemología inmanente en la naturaleza, es decir, cibernética y con una causalidad circular (Bateson, 1978). Por ello, el pensamiento Occidental, que está habituado a ver partes de la totalidad en términos causales, genera explicaciones atomistas, que llevan a maximizar alguna de las variables y, en consecuencia, al desajuste de los sistemas naturales (Bateson, 2004). Como afirmaba de inmejorable manera Goya: el sueño de la razón produce monstruos. Por ello, cuando se decide ignorar la naturaleza sistémica del mundo y se privilegia el “progreso” de una parte del sistema como lo es un organismo o la maximización de una variable, derivadas de una visión exclusivamente teleológica, se introducirán distorsiones en los distintos niveles de la Mente, como las premisas que se han enlistado anteriormente: la cosificación de una parte de la mente: self (a), la búsqueda del control total del sistema (b); y ver a la unidad evolutiva en contra de la naturaleza (c); las cuales se propagaran a lo largo de las vías de trasmisión de diferencias, precipitaran curvas exponenciales dentro del circuito e inevitablemente se terminara por afectar al sistema entero y, eventualmente, al mismo organismo que origino el descontrol. Introduciendo así la patología en la Mente, es decir, la perdida de equilibro (Bateson, 1968c) Por lo anterior, cuando el hombre quiere tratar a la naturaleza exclusivamente en términos de la causalidad lineal y busca maximizar sus ganancias bajo una lógica del beneficio constante, ve a la vida como un saqueo perpetuo y crea una sociedad de la hyrbris. La cual, inevitablemente, llevara a la distorsión del sistema entero, junto con el hombre, o a una mayor sabiduría; pues como afirmaba William Blake en un conocido aforismo: “The road of excess leads to the palace of wisdom.”. Esa es la dirección en la que apuntaba Bateson, a la sabiduría: 167 “I use ‘wisdom’ as a word for recognition of and guidance by a knowledge of the total systemic creature.” (Bateson, 1968c, p. 442). La sabiduría es reconocer la naturaleza cibernética de la mente, del individuo, de la sociedad y de la naturaleza. Es, también, el reconocimiento de las pautas más abarcadoras de la totalidad de la ecología. La anterior comprometería a un organismo individual a ser flexible en sus pautas de interacción en su ambiente; a evitar modos de participación rígidos que lleven a la fuga al maximizar una de las variables de la Mente total en la que participa66; y a privilegiar una ética de lo óptimo sobre una ética de lo máximo. ¿Cómo se puede promover la sabiduría? Para corregir la visión teleológica de la consciencia, Bateson identifica una serie de actividades creativas que la corrigen, en las cuales la mente individual funciona como totalidad, donde la consciencia tiene un papel limitado, y logra una integración psíquica con la parte inconsciente, como el contacto con los animales y la naturaleza, el amor, la poesía, las humanidades, la música, la religión, y el arte67 (Bateson, 1968b; 1968c; 1970a). Bateson, al igual que otros científicos del siglo XX como Jacob Bronowski y Albert Einstein, se da cuenta del peligro que representa una sociedad en la que el desarrollo tecnológico supero a la evolución ética de sus miembros; por medio de su epistemología intenta corregir las premisas patógenas de la sociedad, y así invita a pasar de la soberbia, la homogeneidad y la rigidez, a la humildad epistémica, la diversidad, la flexibilidad, la sabiduría y la belleza. Con el modelo de la mente como un circuito cibernético, Bateson responde al desafío que significa conocer desde un mundo dividido, en donde el cuerpo y la mente son dos sustancias diferentes. Bajo este marco referencial reúne a ambas partes en un solo proceso: hacer del territorio de la naturaleza el mapa del espíritu. Mary Bateson dice al respecto: “El rechazo de la posición cartesiana lo oriento a un enfoque monista de la realidad y, cada vez más, a representar el espíritu y la naturaleza como un todo unido e inseparable” (1988 p. 26). Por estas razones, Bateson se acercó a un monismo filosófico en el que no hay mente sin materia, pues esta es inmanente a la estructura cibernética de la ecología total: psysis y psyche se integran en el mundo explicativo de la comunicación. Aunque Bateson, no está demás insistir en ello, nunca estuvo interesado en desarrollar una teoría terapéutica, al grado de declarar: “No me hace muy feliz que me atribuyan la afirmación que nunca hice de que ‘el doble vinculo es una teoría de la terapia’. No creo que lo 168 sea ni que lo haya sido” (Bateson citado en Berger, 1993, p. 94); ya que por un lado creía que el doble vínculo era parte de una teoría más amplia, y por otro, asociaba los métodos terapéuticos tradicionales con la idea de control; llego a sugerir a los terapeutas lo siguiente: “First, to achieve clarity in ourselves; and then to look for every sign of clarity in others and to implement them and reinforce them in whatever is sane in them.” (Bateson, 1971f, p. 493). Con esto quiere decir que es necesario que el terapeuta examine su propia epistemología, es decir, las premisas que gobiernan su práctica clínica, antes de intentar realizarla, pues seguramente sus hábitos epistemológicos estarán llenos de los errores y patologías que hemos presentado en este apartado como la metáfora energética, la división mente-cuerpo, el ver al inconsciente como una parte oscura, la noción de poder, el reduccionismo explicativo, y que al ser autovalidentes, llevan a una forma unidireccional de hacer terapia, a creer que el inconsciente está lleno de recuerdos reprimidos que hay que liberar, y en consecuencia querer hacer consiente todo el proceso mental, a describir las relaciones como una lucha por el poder, etc. Sí el terapeuta puede cambiar sus premisas por una epistemología cibernética estará en condiciones de modificar la relación terapéutica que establece con sus pacientes para ayudarlos de una mejor manera. En esta dirección, Braford Keeney, heredero intelectual de Bateson, se esforzó por vincular la epistemología cibernética con la terapia familiar. En su Aesthetics of Change (Estética del Cambio), él distingue entre la epistemología tradicional o lineal y la epistemología cibernética o recursiva en el escenario de la terapia. De la epistemología lineal progresiva dice que es el, “modelo medico clásico de psicopatología: es atomista, reduccionista y anticontextual, y se atiene a una lógica analítica que se ocupa de elementos aislados” (Keeney, 1991, p. 28), esta epistemología sostiene que es el individuo el que tiene “dentro” de sí la patología, y de algún modo hay que sacarla por medio de la farmacología u otros métodos más invasivos. Por otro lado, la epistemología cibernética se enfoca en describir relaciones y sistemas desde un enfoque contextual. Keeney dice que el nombre de “epistemología cibernética” de este paradigma le permite acercase a la tradición de pensamiento iniciada por McCulloch y Wiener, y continuada por Bateson, von Foerster, Maturana y Varela. El objetivo de la epistemología cibernética es tener un lenguaje formal para la descripción del proceso de cambio y la terapia, teniendo presente que el terapeuta está dentro de la observación, descripción y explicación de la misma68. Durante la última década de su vida Bateson se dedica a detallar los criterios del proceso mental. En 1978 se muda al Instituto Easalen y le diagnostican cáncer de pulmón, por lo que 169 manda a traer a su hija Mary Bateson de Theran para que lo ayude a terminar un nuevo libro, “Mind and Nature”, publicado en 1979. Enseguida comienza a escribir “Where Angels Fear to Tread”, pero no lo logra terminar, aunque si lo hace su hija Mary. Bateson muere el 4 de julio de 1980 en el centro de la comunidad zen en San Francisco (Bateson, 1988; Lipset, 1991). Después del recorrido por la vida intelectual de Bateson se evalúan sus aportaciones. El método científico de Bateson (1971i) consistió en pensar los “datos” desde los fundamentos de la ciencia y de la filosofía, es decir deductivamente; por lo que consideraba que la explicación científica estriba en cartografiar los datos sobre los fundamentos. Por esa razón crítica que la mayoría de los conceptos de la psicología y de las ciencias sociales, al seguir la metodología inductiva, se encuentran desconectados de la red de fundamentos, y sólo son un conjunto desarticulado de principios dormitivos69, a lo mucho heurísticos. Y, aunque Freud intento establecer un puente entre los fundamentos de la ciencia de su época y sus datos clínicos, se equivocó en escoger energía; por lo que Bateson emprendió la tarea de revisar los fundamentos de la ciencia a partir de los cuales replantear nuevas explicaciones e hipótesis de las ciencias de la conducta. Para ello distinguió entre los problemas de la materia y de la energía, y los problemas del orden, la información y el patrón, es decir, entre forma y sustancia. Las leyes de la energía y la materia corresponden a la sustancia, pero la mente, las ideas, la comunicación, la organización, la diferenciación, la clasificación y la pauta son problemas de la forma. Las disciplinas que aumentaron el conocimiento sobre el orden y la forma fueron la cibernética, la teoría de la información, y la teoría de los sistemas por lo que sus investigaciones en antropología, comunicación, aprendizaje, etología, y epistemología se pueden entender como el intento de restablecer el puente entre estos conocimientos fundamentales y los datos de la conducta, con el fin de crear una nueva ciencia que estudie la naturaleza del orden y la pauta en las ciencias biológicas y de la conducta. Al hacer esta distinción, Bateson busca utilizar un lenguaje explicativo que le provea a las ciencias de la conducta independencia de los métodos y criterios de evaluación del lenguaje de las ciencias físicas; de tal modo que le permita hacer la lectura de varias tradiciones en la psicología, enraizadas en la epistemología dualista, como el conductismo, y el psicoanálisis, desde el lenguaje interaccional, y así entender al estudio del comportamiento, el carácter y la psicopatología como fenómenos comunicacionales. 170 Podemos identificar un proceso formal y sistemático en la apropiación de las categorías de la cibernética en la trayectoria intelectual de Bateson desde su participación en las conferencias Macy. A partir de su estudio de la comunicación entre psiquiatras, en cada investigación que Bateson realizó cambio las premisas de su objeto de estudio por las categorías de la cibernética. En primer lugar usaba como principio explicativo la noción de información, tomada de la teoría de la información, para definir el aprendizaje, el comportamiento, la esquizofrenia, y la mente, como procesos comunicacionales. Después, por medio de la teoría de los tipos lógicos de Whitehead y Russell, modelaba los fenómenos comunicacionales estructurándolos en una jerarquía de niveles, y describía los efectos paradójicos que resultaban al confundir los niveles en la comunicación. Enseguida, caracterizaba como circuitos cibernéticos a los sistemas comunicacionales en donde se trasmitía la información, desde organismos individuales o miembros de clases, como animales o personas; agregados de organismos o clases, como las familias y las especies; y las clases de clases, como la sociedad o el ecosistema. Todos estos sistemas cibernéticos podían caracterizarse por irse hacia la fuga o ser auto- correctivos por medio del ensayo y el error. Bateson, fue, como describe Wordsworth a Coleridge, “esa rara clase de espíritu que no puede contemplar ninguna cosa sin tomar conciencia de su relación con las demás” (Schenk, 1983, p. 58). Su capacidad para ver las relaciones formales en distintas investigaciones lo llevo a plantear su epistemología cibernética, con la cual ofrece un nuevo marco teórico para las ciencias de la conducta, y una reforma al entendimiento sobre el proceso mental y evolutivo al reconciliar mente y cuerpo, espíritu y naturaleza, y pensamiento y sentimiento en un mismo proceso. El valor de su obra para la psiquiatría y la psicología radica en que permitió superar las lecturas energéticas de la ciencia de su época e ir más allá de las premisas que la sostienen, al replantear viejos problemas sobre nuevas premisas teóricas por medio de los conceptos de la antropología, la cibernética y la teoría de la información. Bateson es una rara avis en la psicología, al heredar una explicación más sofisticada del proceso mental y del comportamiento desde el mundo explicativo de la comunicación. A continuación se describe el primer modelo clínico donde Bateson influyo por medio de sus investigaciones sobre la comunicación, al sentar las premisas del enfoque comunicacional e interaccional del comportamiento humano: el modelo de terapia breve del BTC. 171 Capítulo 4. Modelo Teórico del BTC: De la Metáfora de la Energía a la Metáfora de la Información He who would do good to another must do it in Minute Particulars. General Good is the plea of the scoundrel, hypocrite, and flatterer; For Art and Science cannot exist but in minutely organized Particulars. William Blake Llegados a esta parte de la investigación nos disponemos a ejemplificar como las metáforas, al cumplir ciertas funciones dentro del escenario de la investigación científica, explicadas en el primer capítulo, ayudan a la introducción de conceptos plausibles en una disciplina científica y a la construcción de modelos teóricos. Por ello, a partir del análisis filosófico de la metáfora se propuso un modelo de desarrollo científico que dé cuenta del cambio teórico en una teoría que, aunado al análisis histórico de los conceptos, desplegado en el segundo y tercer capítulo, sirva para realizar la reconstrucción conceptual del sistema categórico de un modelo de la psicología clínica70. O, dicho de otra manera: después de haber expuesto las funciones que la metáfora tiene en la ciencia, y de describir el origen de los conceptos de la cibernética y la teoría de la información que fueron usados por Gregory Bateson y su equipo para estudiar la comunicación, estamos en condiciones de explicar cómo fueron usados dichos conceptos en forma de metáforas por los miembros del BTC para construir el marco conceptual que justifica su modelo clínico. El modelo del BTC representa la primera aplicación de las nociones de la cibernética en el contexto terapéutico, y marca el inicio de la familia de terapias sistémicas; como lo dice Pakman: Las relaciones tempranas entre cibernética y terapia familiar consistieron en el surgimiento de modelos terapéuticos, que fueron llamados interaccionales, que consistían en aplicaciones de las nociones cibernéticas (…) al campo de las interacciones humanas y de la solución de problemas (2006, p. 26) Los modelos terapéuticos sistémicos tienen en común el uso de las herramientas conceptuales de la cibernética para la explicación de los problemas humanos desde un enfoque comunicacional e interaccional71. El primer heredero teórico de estos conceptos fue el modelo de 172 terapia breve del BTC, que, por medio de las investigaciones de Bateson y su equipo, incorporaron el uso de dichas categorías para el desarrollo del enfoque interaccional. Para ejemplificar la influencia de Bateson en el los miembros del Mental Research Institute para la justificación teórica de su modelo clínico, en este último capítulo se expone en primer lugar el origen histórico del MRI, y su desarrollo hasta la fundación del proyecto llamado Brief Therapy Center, del cual se mencionan sus miembros fundadores y sus principales publicaciones. En la segunda parte se explicita la influencia de Milton H. Erickson en los objetivos y metodología de cambio del BTC. Para al final reconstruir la propuesta teórica de formación, mantenimiento y resolución de problemas clínicos resaltando la configuración metafórica de las premisas y categorías que estructuran el modelo del BTC, a partir del metamodelo de desarrollo científico presentado en el primer capítulo. 4.1 Orígenes del MRI y del BTC De regreso al proyecto sobre la comunicación de Bateson, después del gran revuelo que causo en el circuito psiquiátrico la hipótesis del doble vínculo, el equipo fue orientándose cada vez más hacia el estudio de la comunicación esquizofrénica. Si bien el doble vínculo es el concepto clínico más reconocido del proyecto Bateson, y es el que les permite conseguir más fondos para investigar la comunicación, también es el que inicia la disgregación entre sus miembros por tener diferentes intereses, ya que Jackson veía en el lenguaje interaccional que desarrollaba el equipo, una posibilidad genuina de abordar novedosamente los problemas psiquiátricos, por lo cual decide crear un centro de investigación en 1958. Rápidamente reúne recursos de fondos privados, y el 19 de marzo de 1959 inaugura el Mental Reseach Institute72 como una división del Palo Alto Medical Research Institute (PAMRF) para estudiar a la esquizofrenia y a las familias. Inicialmente invita a Virginia Satir, trabajadora social, y al psiquiatra Jules Riskin para integrarse al instituto, ambos familiarizados e interesados en el artículo sobre el doble vínculo (Bodin, 1981; Wittezaele y García, 1994). El periodo entre 1959 y 1963 está marcado por el desarrollo de los estudios del MRI y, simultánea e independientemente la continuación de la investigación sobre las familias esquizofrénicas por Bateson y su grupo. Ambos proyectos coexisten por 4 años, aunque no comparten investigaciones. Jackson se ocupa de la dirección del MRI y sigue siendo asesor en el grupo de Bateson (Haley, 1976; Vargas, 2007). 173 Esta es la razón por la que Watzlawick haya sostenido en más de una oportunidad que no existe el “Grupo de Palo Alto”, sino es del grupo de investigación de Bateson del que después los miembros del MRI hicieron una síntesis, junto con las ideas clínicas de Jackson y las técnicas hipnóticas de Milton Erickson para la creación de un modelo terapéutico (Watzlawick, 1988; Wilder, 1978). Misma opinión tienen Wittezaele y García, para quienes: “las investigaciones sobre la comunicación unen a Bateson y al MRI. Veremos que, si el primero sentó las bases del enfoque interaccional en los años cincuenta, Paul Watzlawick y sus colegas lo sistematizaron y enriquecieron en las décadas siguientes” (1994, p. 96). Por lo cual, aunque ambos grupos desarrollaron sus proyectos de manera autónoma, los primeros miembros del MRI fueron fuertemente influidos por la base teórica desarrollada por Bateson y su equipo, e incluso algunos de los antiguos colegas de Bateson con el tiempo pasaron a formar parte del MRI, y pese a que Bateson no perteneciera a este grupo si participaba como consultor en sus reuniones. En 1960 se integra Paul Watzlawick73 a la platilla de trabajo de Jackson, él estudia de manera entusiasta todo lo que escribió Bateson. Además aprende las técnicas clínicas de Erickson por medio de su trato con Haley y Weakland, y también se familiariza con las intervenciones de Jackson. Durante el desarrollo de su trabajo teórico formaliza y hace operativas dichas técnicas para el tratamiento terapéutico. También en 1960 Satir recibe fondos privados de la Hill Foundation of Minneapolis para iniciar un programa de entrenamiento familiar. Después, en 1962 el NIMH financia su proyecto para desarrollar el primer programa de entrenamiento en terapia familiar. Ella se interesa por mostrar que es lo que hace en terapia, por lo cual graba sus sesiones en audio y video, y usa un espejo unidireccional durante las mismas como método pedagógico74 (Bodin, 1981). En 1962 Haley quiere hacer un medio donde publicar sobre terapia familiar, por lo que funda la primera revista especializada en el tema junto con el Family Institute of New York. La nombra “Family Process”. En el comité editorial reúne a los investigadores y terapeutas familiares más importantes de la época, incluido Bateson, y se encarga de ser el editor en jefe. En el mismo año, al terminar el proyecto sobre la comunicación y la partida de Bateson a las Islas Vírgenes, Haley pasó inmediatamente al MRI continuando su investigación sobre el desarrollo de una clasificación de las familiar. Mientras Weakland se va a Hong Kong, regresa y después de un tiempo va con Jackson para continuar sus investigaciones sobre el análisis de películas chinas bajo el auspicio del MRI (Bodin, 1981; Wittezaele y García, 1994). 174 De 1963 a 1968 inicia un periodo de crecimiento y producción en el MRI ya que va desarrollando una serie de proyectos dirigidos a formar terapeutas familiares, encabezado por Satir; y continuar las investigaciones sobre la comunicación, las familias, las enfermedades mentales, y los métodos eficaces de terapia (Wittezaele y García, 1994). Es por ello que Ray (2004) sostiene que el MRI se convirtió en el primer instituto en investigar a la familia desde el enfoque interaccional y de enseñar terapia familiar. A principios de esa época, “Jay Haley público en 1963 la primera síntesis de la explicación batesoniana y la práctica de Erickson” (Vargas, 2004, p. 17) en su libro Strategies of Psychotherapy, con el cual inicia el enfoque estratégico en la terapia, fuertemente influenciado por Erickson, quien principalmente buscaba formas eficaces de provocar el cambio, y es donde aparece por primera vez el término “terapia breve” (brief therapy) (Haley, 1963, p. 41). En él, Haley busca describir las técnicas de Erickson tomando a partir de los conceptos explicativos del proyecto Bateson, por lo que representa uno de los primeros esfuerzos por describir el proceso terapéutico por medio del lenguaje formal desarrollado por Bateson. Este primer intento para vincular teoría y práctica será una importante influencia en las investigaciones del MRI y, por supuesto, es un trabajo pionero en la terapia estratégica que Haley desarrolla años después. En 1964 Watzlawick, que había estudiado las investigaciones sobre la comunicación de Bateson, publica An anthology of human communication; Bateson le escribe el prólogo. Al año siguiente, un visitante asiduo desde 1963 al MRI y amigo de Weakland y Watzlawick les propone un nuevo proyecto de investigación clínica cuyo objetivo sea estudiar las innovadoras técnicas terapéuticas de Jackson y Erickson, y de ese modo poder utilizarlas eficientemente para provocar el cambio rápido en la terapia por medio de intervenciones eficaces. Este es el psiquiatra Richard Fisch y al proyecto lo llamó “The Brief Therapy Center” (Centro de terapia breve) (BTC). Jackson consigue los fondos para financiarlo y Haley los apoya. Fisch será su primer director, y además de Weakland y Watzlawick, se integra un joven psicólogo llamado Arthur Bodin (Vargas, 2007). El BTC inicia formalmente en enero de 1967; el equipo inaugura una dinámica que modelara la práctica futura del MRI: en el cuarto de tratamiento uno de los terapeutas se reúne con la familia en una parte de la cámara, al tiempo que otros terapeutas observan en un cuarto la sesión a través del espejo sin azogue, pudiendo estos últimos participar en la sesión interviniendo con sugerencias por medio de un teléfono con intercomunicador, o bien el terapeuta tiene la 175 posibilidad de pedir asistencia a sus compañeros saliendo de la sala principal y preguntándoles. Todas las sesiones son grabadas en cinta magnetofónica y además fijan como máximo diez sesiones de una hora a la semana (Fisch, Weakland, & Segal, 1984) Después de cada sesión los terapeutas la sometían a discusión. A medida que atendían pacientes experimentaban con diferentes preguntas y métodos, y a través del ensayo y error se comenzaron a dar cuenta de intervenciones que facilitaban el cambio, como distinguir entre la persona con el síntoma identificado y la persona que puede realizar un cambio mínimo, llamando a esta última “solicitante”. La aportación más importante de este periodo es la identificación de que los intentos de solución son perjudiciales para un cambio y por ello deciden comenzar a prohibirlos (Wittezaele y García, 1994). Debido a esto, los intereses del MRI fueron pasando de buscar datos que demostraran la homeostasis familiar y la función del síntoma, a investigar y probar modos de provocar el cambio en el sistema familiar, en gran parte debido a la influencia de Erikson en el equipo, y en usar el conjunto de categorías desarrolladas por Bateson para analizar el proceso de cambio, por ello Vargas declara lo siguiente: “El trabajo del MRI se centró en hallar conceptos intermedios entre las grandes teorías de Bateson y la práctica terapéutica” (2007, p. 133). A partir de 1967 hay cambios importantes en el MRI, Satir se va a dirigir el Instituto Esalen, y Haley también parte para trabajar con Salvador Minuchin a Filadelfia a la Child Guidance Clinic (Winkin, 1982). Además, Jackson muere en enero de 1968 por una dificultad con su medicación a los 48 años (Ray, 2004). En 1967 Watzlawick, Beavin y Jackson publican Pragmatics of Human Communication, en el que se realizan una síntesis teoría del trabajo de Bateson y se presenta de manera más accesible y sistemática. Lo más importante de esa publicación es que logran vincular las teorías de Bateson con la práctica clínica y empiezan a desarrollar el enfoque pragmático de la comunicación. Después de años de experiencia clínica y con la necesidad de organizar y justificar su trabajo terapéutico, en 1974 los miembros del BTC, Watzlawick, Weakland y Fisch, publican dos obras importantes: el libro Change: Principles of Problem Formation and Problem Resolution y el artículo Brief Therapy: Focused Problem Resolution. En los que explican de manera detallada los principios, premisas y técnicas característicos del modelo del BTC para provocar el cambio terapéutico. 176 4.2 La Herencia de Milton H. Erickson Hasta ahora se ha mencionado sucintamente la presencia de Erickson en el trascurso de las investigaciones de Bateson sobre las paradojas en la comunicación; la relación del hipnoterapeuta con Haley y Weakland; y el estudio sistemático por parte de los fundadores del MRI de sus técnicas. Es importante por tanto reconocer la herencia de Milton Erickson en el modelo clínico de terapia breve del BTC, y, en general, de la familia de terapias sistémicas pues, “si Bateson es el padre teórico de la perspectiva interaccional-sistémica en psicología y psiquiatría, Erickson representa el maestro a quien hay que remitirse para las estrategias de aplicación clínica” (Nardone y Watzlawick, 1992, p. 56). Aunque hay que tener presente que Erickson no estuvo nunca particularmente interesado en explicar teóricamente su trabajo y mucho menos justificar sus procedimientos siguiendo una teoría clínica, ya que su prioridad fue siempre buscar maneras de provocar el cambio en el paciente; fueron las personas que lo conocieron y que estudiaron sus sesiones quienes propusieron la explicación de las técnicas de Erickson, utilizando distintos marcos teóricos y conceptos explicativos. Entre sus principales exegetas se encuentran Haley, Ernest Rossi, Stephen Gilligan, Richard Bandler, John Grinder, y Jeffrey Zeig (Zeig y Geary, 2000). Aunque excede los intereses teóricos de esta investigación una descripción detallada de los recursos de Erickson, es indispensable mencionar su aportación en las técnicas terapéuticas del MRI. Por ello a continuación se hará una breve mención de las características de la terapia de Erickson que los miembros del equipo Bateson reconocieron y discutieron bajo un enfoque interaccional, y que después serían examinadas y sistematizadas por los miembros del BTC. Dado que su principal interés fue siempre provocar el cambio al tener un objetivo concreto, y no el desarrollo de una teoría, Erickson se esforzaba siempre en sus sesiones por provocar un cambio mínimo; como lo advirtió Haley en una de las conversaciones del grupo: “Erickson argues that you solve involuntary behavior by asking them to do voluntary things they don’t want to do. Erickson believes his brief therapy will initiate changes that will continue” (citado en Govener, 2006, p. 121). Haley al percatarse de que hacer que los pacientes hicieran justamente aquello que era su comportamiento problema provocaba un cambio, empezó a hacer uso de esa técnica, de hecho él fue quien propuso usar la intervención paradójica con fines terapéuticos. 177 Para llevar a hacer que el paciente hiciera lo que Erickson prescribía usaba su notable capacidad comunicativa para persuadir al paciente. Weakland al respect comentó: “He says (Erickson) resistance is an offer to play; that means he takes the positive aspect of anything and uses it to build an interaction” (citado en Govener, 2006, p. 117). Lo cual significaba que cualquier cosa que llevara el paciente servía para hacer el tratamiento, incluso la “resistencia” del paciente. Como parte de esta habilidad comunicativa Erickson ponía mucha atención en la estructura de la comunicación sus pacientes prestando especial atención a los detalles no verbales de los mensajes de sus pacientes, para después hablar su propio lenguaje y usar su sistema de valores; y de ese modo influir eficientemente en el paciente. Esta habilidad le permitía manipular al paciente aunque este creyera que él estaba bajo el control de la relación. El que Erickson dejara al paciente pensar que él tenía el control la relación, pensaba Haley (1963), hacía que fuera Erickson el que tuviera en realidad tuviera el control. A pesar de lo negativo que pudiera sonar eso, Erickson tenía la creencia en el potencial de los pacientes y lo hacía con el fin de ayudarlos. Una característica importante de la terapia de Erickson era desestimar la importancia del insight, pues consideraba que este no era necesario para el cambio o que promoviera la solución de los problemas clínicos. Para Erickson el insight viene después del cambio conductual, no antes. El paciente al eliminar su problema podrá interpretar el cambio después de bajo un nuevo marco de referencia y de manera autónoma. Para Erickson el cambio significaba solucionar los síntomas del problema, sin creer que el síntoma pudiera regresar de alguna forma por cumplir una función o que reflejara un problema psicológico profundo75. Las relaciones entre el equipo de Bateson con Erickson fueron enriquecedoras en dos sentidos: primero porque el análisis de las técnicas de Erickson permitieron precisar el concepto del doble vínculo, y segundo, al usar las categorías del grupo para el estudio de las técnicas de Erickson permitieron describirlas de manera formal (Wittezaele &García, 1994). Haley después de la disolución del equipo se difundió intensamente el trabajo de Erickson. En suma, la búsqueda de un cambio mínimo, el principio de utilización, alentar el síntoma, la intervención paradójica, el uso del lenguaje del paciente, la confianza en los recursos del cliente, y la búsqueda del cambio conductual dejaron su impronta técnica y teórica en el modelo del BTC; caracterizado por ser abiertamente directivo, orientando a fijar una meta concreta para diseñar estrategias efectivas para provocar el cambio por medio de la paradoja. 178 4.3 Modelo de Terapia Breve del BTC del MRI Después del análisis viene la síntesis: en esta última parte de la presente investigación se pretende integrar sistemáticamente todo el recorrido teórico e histórico hecho a lo largo de la misma al presentar la manera en que los conceptos provenientes de las principales tradiciones intelectuales de las que abreva el modelo teórico del BTC: la cibernética, la teoría de la información y la teoría de los tipos lógicos, examinadas en el capítulo 2, e introducidos por Gregory Bateson y su equipo para el estudio de la comunicación, explicadas en el capítulo 3, son usados como metáforas para justificar teóricamente el modelo de terapia breve del BTC del MRI. Nosotros nos concentraremos en mostrar el modo en que los conceptos de información, mensaje, comando y reporte, codificación analógica y digital, redundancia, feedback, causalidad circular, homeostasis, calibración, además la teoría de los tipos lógicos y la paradoja sirvieron para estructurar el sistema conceptual del BTC. Tomando como marco de referencia el metamodelo construido sobre la metáfora y los modelos teoréticos en el capítulo 1. Para ello esta sección se divide tres sub-secciones. En la primera se presentan los modelos teóricos, entendidos como metáforas sostenidas, que componen al modelo del BTC con el fin de mostrar que las categorías que lo estructuran son producto de las analogías derivadas de los modelos teóricos. A partir de esos conceptos se explica el modelo comunicacional en que se basa el enfoque interaccional del comportamiento del modelo del BTC; y después se explica la descripción de la familia como un sistema interaccional con características cibernéticas. En base en esos dos elementos teóricos se muestra en la tercera sección como los miembros del BTC sostienen que se forman y mantienen los problemas humanos. Y al final se describen algunas de sus características intervenciones explicadas a partir de los conceptos que sostienen su propuesta. Es importante señalar desde el inicio que una diferencia importante con los modelos clínicos en psicología es que el grupo de BTC, heredero de Erickson, busca ante todo provocar el cambio, no confirmar hipótesis sobre la naturaleza humana, por lo que carecen de una teoría psicopatológica sobre las causas o motivaciones de los comportamientos anormales de las personas, y por ello no se comprometen con ninguna teoría de la enfermedad mental. El modelo más bien adopta un enfoque interaccional, no normativo y no patológico –patrimonio de Jackson76-, por lo que no buscan curar trastornos mentales, sino dar soluciones a las quejas de los pacientes por medio de intervenciones eficaces. 179 4.3.1 Modelos Teóricos que Configuran al BTC Como planteamos en la introducción, la investigación se iba a estructurar de tal manera en que permitiera formar una Gestalt, de modo que sobre el metamodelo de construcción de modelos científicos basado en las funciones que cumple la metáfora en la investigación científica, se cartografía como figura el sistema conceptual del modelo clínico del BTC, con el fin de configurar una nueva percepción y comprensión de este modelo terapéutico. Con tal fin en esta sección se exponen y discuten una serie de diagramas que representan el funcionamiento de los modelos teoréticos, que componen al sistema conceptual del BTC, y cuyos dominios modelo corresponden a las teorías que lo influyen. Los capítulos 2 y 3 sirvieron para reconocer el sistema de ideas asociadas y de implicaciones de cada modelo, así como su lógica de organización, lo que permite realizar la reconstrucción de las analogías de cada modelo, e identificar las entidades explicativas plausibles que conforman las categorías del modelo clínico de nuestro interés. El modelo del diagrama 4 tiene como dominio secundario a la teoría de la información y como dominio primario a la conducta, y sirve para realizar la redescripción metafórica del explanandum, es decir, la conducta. El diagrama 5 tiene como dominio modelo la cibernética y como dominio primario a las relaciones humanas, que permiten modelarlas en general y a la familia en particular, como sistemas interaccionales con características cibernéticas. El diagrama 6 tiene como dominio modelo a la teoría de los tipos lógicos y como dominio primario a los dominios modelo de los diagramas 4 y 5. Por último, en el diagrama 7 se sintetizan la relaciones entre los modelos para presentar y organizar las categorías que conforman al modelo del BTC. Antes de continuar es indispensable realizar una precisión conceptual sobre el dominio primario de la conducta: dado que el estudio de la conducta es comunicacional, o con mayor precisión, los efectos pragmáticos de la comunicación en la conducta, para los autores, “comunicación y conducta, se usan virtualmente como sinónimos” (Watzlawick, Beavin y Jackson, 1985, p. 24). Por ello aunque al explanandum P de este modelo se le llama conducta, puede entenderse como comunicación y conducta. A partir de las categorías de cada modelo se va describir el modelo comunicacional del MRI en que se basa el modelo interaccional del BTC, y explicar la formación, mantenimiento y resolución de los problemas humanos desde este modelo de terapia breve. 180 Figura 4. Modelo de la conducta basado en la metáfora de la información y en la Teoría de la Información En primer lugar se postula la metáfora de la información para la redescripción de la conducta. Por medio del diagrama de la figura 4 se observa que la metáfora de la información faculta la integración de nuevos conceptos por medio de su sistema de implicaciones para describir a la conducta. En la terminología de Black (1954), la información (X) funciona como marco para entender el foco, es decir, la conducta (P), por medio de su sistema de conceptos e implicaciones asociadas: información (X1), la información se trasmite por medio de mensajes (X2), cada mensaje tiene dos aspectos: el reporte y el comando (X3), la codificación de los mensajes es analógica y digital (X4), los cuales permiten establecer una serie de asociaciones analógicas uno-a-uno para el estudio de la conducta: la conducta trasmite información (X1’); la información se trasmite por medio de mensajes (X2’); cada mensaje de la conducta tiene dos aspectos: reporte y comando, renombrados por Watzlawick como contenido y relación (X3’); la codificación de los mensajes de la conducta es analógica y digital (X4’). Además, dado que se entiende a los modelos teóricos como metáforas sostenidas (Black, 1962; Hesse, 1966), a partir de la metáfora información se usa la teoría de la información de Shannon como dominio modelo para usar el concepto de redundancia (X5), el cual permite, además de introducir su predicado análogo en el explanandum: la conducta tiene redundancia (X5’), la postulación de una nueva entidad plausible: las reglas (X5’ (α)). Primary Subject/ Explanandum: Conducta P X1' X2' X3'[Contenido y relación] X4' X5' (Regla α) Secondary Subject/ dominio modelo: Información X: X1 Información X2 Mensaje X3 Reporte y comando X4 Codificación analógica y digital X5 Redundancia 181 Figura 5. Modelo de las relaciones humanas que tiene como dominio secundario a la cibernética En el diagrama de la figura 5 se expone el modelo que tiene como dominio modelo las propiedades que caracterizan al sistema cibernético, mientras en el dominio primario se compone de las relaciones humanas, el modelo funciona al usar el lenguaje con el que la cibernética (Y) caracteriza el funcionamiento de los sistemas: funcionan por medio del feedback positivo y negativo (Y1); operan por causalidad circular para trasmitir los mensajes a lo largo del sistema (Y2); tienden a la homeostasis (Y3); y pueden ser calibrados (Y4), para describir a las relaciones humanas en general (Q), y a las familiares en particular, por medio de analogías positivas: las relaciones son sistemas que funcionan por medio del feedback positivo y negativo (Z1’); las relaciones son sistemas operan por causalidad circular para trasmitir los mensajes que trasmite la conducta (X2’) a lo largo del sistema (Y2’); y las relaciones son sistemas pueden ser calibrados (Y4’). Además, por medio de la analogía neutra de que los sistemas tienden a la homeostasis, se postula la entidad explicativa plausible de que las relaciones en los sistemas familiares tienden a la homeostasis familiar (Y3’(β)). Como vimos con Black (1962), ambos modelos comparten una estructura isomorfica que permite la trasferencia de lenguaje analógico al dominio primario y permite realizar nuevas inferencias sobre éste último, inferencias que, según Hesse (1966), permiten hacer predicciones sobre el comportamiento de los sistemas interaccionales familiares. Dominio primario: Relaciones humanas Q: Y1' Y2' Y3'(Homeostasis familiar β) Y4' Dominio secundario o modelo: Sistema cibernético Y: Y1 Feedback positivo y negativo Y2 Causalidad Circular Y3 Homeostasis Y4 Calibración 182 Figura 6. Modelo de la conducta que usa como dominio secundario la teoría de los tipos lógicos Queremos recordar junto con Hesse que dos modelos del mismo referente se modifican mutuamente para mantener su efectividad (Hesse, 1966, p. 169). Lo cual es visible en la figura 5, ya que por un lado se plantea que la conducta entendida a través de la metáfora de la información, desplegada en la figura 4 (X(P)), esto es, como un fenómeno comunicacional, se modela por medio de la teoría de los tipos lógicos: (Z (X (P))). Y por otro lado también se modelan algunos de los componentes del modelo de las relaciones usando como dominio modelo a la cibernética: Y(Q), presentado en la figura 5, por medio de la teoría de los tipos lógicos: (Z (Y (Q))). De tal manera se trasladan algunos enunciados del dominio secundario a enunciados correspondientes al dominio primario de los modelos X y Y. De modo que el lenguaje del dominio modelo (Z): la jerarquización en niveles o tipos lógicos por medio de la división entre clase y miembro (Y1); y la paradoja matemática resultado de violar la división de Y1 y confundir entre clase y miembro (Y2), se utiliza para describir al explanandum P, entendido a través del modelo X, P(X), por medio de un sistema de analogías positivas y neutras de Y1: la jerarquización en niveles o tipos lógicos de comunicación por medio de la división entre metacomunicación (γ) (clase) y comunicación (miembro): Y1’(γ); la Dominio Primario: Conducta X(P); Relaciones humanas Y(Q) Z1' Metacomunicación (γ) y Comunicación Z1''(Metamensaje δ) y Mensaje (X2') Z1'''Relación y contenido(X3') Z1'''' Codificación analógica y digital (X4') Z1'''''Metarregla (ε) y regla (α) Z1'''''' Calibración (Y4') y Homeostasis (Y3'(β) Z2' (Paradoja pragmática ζ) Z2''(Paradoja terapéutica η) Dominio secundario o modelo: Teoria de los Tipos Lógicos Z: Z1 Jerarquización en niveles o tipos lógicos por medio de la división entre clase y miembro Z2 Paradoja matemática 183 jerarquización en niveles o tipos lógicos de mensajes por medio de la división entre la metamensaje (δ) y mensaje (X2’): Y1’’(δ (X2’); la jerarquización en niveles o tipos lógicos de los aspectos de los mensajes por medio de la división entre la relación y contenido: Y1’’’(X3´); la jerarquización en niveles o tipos lógicos de la codificación de los mensajes por medio de la división entre la codificación analógica y la digital: Y1’’’’(X4’); la jerarquización en niveles o tipos lógicos de las reglas por medio de la división entre la metarreglas (ε) y reglas (X5’(α)): Y1’’’’’(ε (X5’(α))). Y Y2: la paradoja comunicacional o pragmática resultado de violar la división de Y1’ y confundir entre metamensaje (δ) (clase) y mensaje (X2’) (miembro): Y2’ (ζ): y la paradoja terapéutica: Y2’’ (η). Por último, por medio de Z1 se plantea la jerarquización en niveles o tipos lógicos de cambio por medio de la división entre la calibración (Y4’) y la homeostasis (Y3’ (β)) del modelo Y(Q): Z1’’’’’’’(Y4’ (Y3’(β))). Más tarde llamados cambio 2 y cambio 1 respectivamente. La teoría de Russell cumple con la condición de ser una teoría más establecida y mejor organizada por la cual se puede conocer a las menos establecidas (Black, 1962; Hesse, 1966), y, como es visible, sus enunciados teóricos posibilitan el establecimiento de un rico conjunto de analogías positivas y neutras, estas últimas facultan la introducción de varias entidades explicativas plausibles que amplían el lenguaje teórico del modelo del BTC, y con ello su capacidad predictiva y explicativa. A partir de las analogías y entidades explicativas plausibles resultado de los modelos discutidos en los diagramas 4, 5 y 6, resumidos en la figura 7, se conforma el vocabulario teórico del diccionario que en conjunto constituye el sistema conceptual del BTC. Cada círculo del diagrama 7 representa a cada modelo teorético entendido como una metáfora sostenida, y cada letra o conjunto de letras (X, Y o Z) acompañadas del símbolo prima (‘) representa el anunciado analógico de cada modelo, mientras que cada letra griega representa una entidad explicativa plausible. Cabe aclarar que el objetivo de simbolizar los conceptos no tiene otra intención más que hacer evidente la configuración metafórica del modelo del BTC entendido a través del metamodelo de la metáfora. Esta presentación permite, además de sintetizar el análisis, identificar la tradición científica que tiene cada término; advertir que la interacción conceptual entre dos modelos permite configurar el significado de un mismo concepto; e identificar la participación de cada concepto en la reconstrucción del modelo comunicacional del MRI y del modelo clínico del BTC que se proponen en las siguientes secciones. 184 Figura 7. Modelos y analogías que componen al sistema conceptual del BTC Después de la explicación de cada modelo y del diccionario de términos resultado de estos, se expone la sintaxis del modelo, es decir, las reglas de relación en que se ordenan y combinan los conceptos del diccionario para la conformación del modelo comunicacional; y al mismo tiempo la extensión semántica de cada concepto postulado. Con el fin de describir como a partir de los elementos del modelo comunicacional se explica y justifica el enfoque interaccional de la conducta del BTC y sus patologías en los sistemas interaccionales. Hay que señalar desde ahora que varios de los términos no aparecen una sola vez en el modelo del BTC, pues algunos son frecuentemente usados como herramientas conceptuales en diferentes momentos de su propuesta explicativa. Información X X1' X2' X3' X4' X5' (α) Teoría de los tipos lógicos Z Z1' (γ) Z1'' (δ (X2')) Z1''' (X3') Z1'''' (X4') Z'''''(ε (X5'(α))) Z1''''''(Y4' (Y3'(β))) Z2' (ζ) Z2''(η) Cibernética Y Y1' Y2' Y3'(β) Y4' Z1’’; Z1’’’ Z1’’’’; Z’’’’’:Z2’; Z2’’ Z1’’’’’’ BTC 185 4.3.2 Modelo Comunicacional del MRI El enfoque interaccional de la conducta que caracteriza al modelo clínico del BTC descansa sobre el modelo comunicacional conocido como la teoría pragmática de la comunicación humana, por ello en esta sección se desarrolla este modelo que le da al modelo del BTC su carácter comunicacional, interaccional y pragmático77. La teoría pragmática de la comunicación humana78, expuesta en 1967 en Pragmatics of Human Communication por Watzlawick, Beavin y Jackson, está compuesta por los axiomas que componen a la comunicación, y por la descripción de los sistemas interaccionales como sistemas cibernéticos. En el modelo comunicacional es particularmente evidente la influencia teórica de Bateson en el modelo del BTC. Como veremos, si bien a Bateson y a su equipo les corresponde el mérito de haber trasladado el lenguaje lógico, ingenieril y cibernético para el estudio de la comunicación en los años cincuenta, a Watzlawick y compañía se les reconoce haber sistematizado, enriquecido y refinado el trabajo teórico de Bateson para describir la comunicación y sus perturbaciones en el escenario clínico en los años sesenta y setenta. Como recordaremos, el principal interés de Bateson estaba en desarrollar una teoría general de la comunicación, por lo que dio término a sus investigaciones sobre la comunicación en pacientes esquizofrénicos y sus familias en 1962, para continuar su teoría de la comunicación que tomara datos de la etiología animal (Véase capítulo 3.5). Después, los primeros miembros del MRI se dedicaron a desarrollar un modelo que se enfocara al estudio de la pragmática en la comunicación, y que diera cuenta de los aspectos clínicos de la comunicación. Por lo anterior, con el fin de hacer evidente la tradición cibernética que inauguro y desarrollo Bateson, se pondrá énfasis en las categorías que él traslado de las conferencias Macy, descritas en el capítulo 2, a las ciencias de la conducta para el estudio de la comunicación, explicadas en el capítulo 3, para realizar la descripción del modelo comunicacional del MRI. El objetivo general del modelo comunicacional es estudiar la pragmática de la comunicación humana, es decir, los efectos que tiene la comunicación sobre la conducta dentro del contexto de interacción donde tiene lugar. En primer lugar, siguiendo la crítica de Bateson a la metáfora energética de la teoría psicoanalítica79, rompen con la epistemología basada en la transformación y conservación de la energía, y adquieren la metáfora de la información como principio organizativo y explicativo. A partir del paso de la metáfora de la energía a la metáfora 186 de la información para la explicación de la conducta, comenzó la redescripción de los hechos del comportamiento como fenómenos comunicacionales. Por lo cual cada conducta observable entre los participantes comunica información, de modo que toda conducta, verbal o no verbal, normal o desviada, es comunicación, y como comunicación tiene efectos en la interacción entre el emisor y el receptor (Watzlawick, Beavin y Jackson, 1985). A partir de algunas de las analogías establecidas por medio de la metáfora de la información (X) presentadas en las figuras 4 y 6, Watzlawick, Beavin y Jackson (1985) postulan cinco propiedades formales de la comunicación conocidas como los axiomas de la comunicación, los cuales tienen su origen en el trabajo teórico de Bateson. El primer axioma dice que no se puede no comunicar. Dado que toda conducta es comunicación, se considera como un mensaje a toda unidad conducta frente a alguien más, ya sea verbal o no verbal, incluyendo la inactividad y los silencios. El mensaje es la unidad mínima de comunicación. Al intercambio de mensajes entre varias personas se le denomina interacción. Ahora bien, si toda conducta es un mensaje (X2’) que trasmite información (X1’), y por lo tanto es comunicación, no es posible no comportarse, es decir, no es posible no comunicarse con los demás: ¬(¬X2’)= X2’. Toda comunicación tiene efectos pragmáticos sobre los demás, quienes a su vez deben de responder con comunicación80. La metáfora de la información para el estudio de la conducta (X (P)), y su modelamiento por medio de la teoría de los tipos lógicos (Z (X (P))) permitió usar sus conceptos asociados, y así estructurar y organizar la comunicación en niveles. En ese sentido el segundo axioma dice que la comunicación tiene dos niveles: el de contenido y el de relación. Watzlawick utiliza las categorías introducidas por Bateson en el estudio de la comunicación, quien a su vez las toma del trabajo de McCulloch sobre neuronas, de comando y reporte (report, command) 81, y las renombra: mientras al reporte lo llama contenido, al comando lo denomina relación (X3’). El contenido se refiere a los datos e información que transmite un mensaje (X2’), y la relación son las instrucciones que dicen cómo entender dicho mensaje. El nivel de relación, al dar las instrucciones de cómo entender la información del nivel de contenido, es información sobre la información, es decir metainformación, pues es información de un tipo lógico más alto que la del nivel de contenido: (Z1’’’ (X3')). Otra forma de decirlo es que el nivel de relación al clasificar al contenido es un metamensaje: Z1’’(δ (X2’)), el cual, al ordenar como entender la información y con ello indicar la clasificación de la conducta, es decir, de la comunicación, 187 define la naturaleza de la relación entre los comunicantes (Jackson, 1965a; Haley, 1963). Por lo que, dado que cada conducta es comunicación, y que el nivel de la relación clasifica a esa comunicación, es una metacomunicación: Z1’(γ), esto es, comunicación que habla sobre la comunicación, la cual puede ser expresada tanto de manera verbal, con preguntas como: ¿A qué te refieres con esto?, o no verbal, con gestos o risas, que intentan aclarar la manera en cómo clasificar y entender un mensaje, y por implicación la definición de la relación. El origen del tercer axioma, heredado de Bateson82, dice, de acuerdo a Watzlawick, Beavin y Jackson (1985), que la interacción circular resultado del intercambio de mensajes entre dos personas es puntuada por cada uno; puntuar significa agrupar y ordenar la secuencia comunicativa de los mensajes intercambiados. A partir de su propia puntuación cada miembro define la naturaleza de la relación que tiene con el otro. De ese modo, aunque la secuencia de intercambio sea la misma, cada uno de los comunicantes organiza los mensajes de la interacción de manera independiente, generalmente viendo sus conductas como “respuestas” a los “estímulos” que le provee la otra persona. Por medio de su puntuación establecen reglas de intercambio de mensajes y, en consecuencia, definiciones de la relación. El cuarto axioma está basado en de un par de conceptos caracterizados por Bateson previamente, y afirma que hay dos tipos de comunicación en los seres humanos: la analógica y la digital83: (X4´). La comunicación analógica es aquella donde es parecida o similar la cosa y aquello que se utiliza para representarla. Se expresa en toda la comunicación no verbal por medio de los gestos, el tono de voz, la postura, etc., y sirve para definir la naturaleza de las relaciones que se establecen dos personas. Sin embargo carece de sintaxis, y de indicadores de tiempo y espacio, y negaciones. Indicadores que si tiene la comunicación digital expresada por medio de un código establecido arbitrariamente para denotar las cosas que representa, el cual es generalmente un nombre o una palabra que por convención semántica nombra aquello a lo que se refiere; lo que le da mayor capacidad para comunicar información acerca de los objetos y con ello expresar el contenido de un mensaje. Por lo cual Watzlawick, Beavin y Jackson dicen: “cabe suponer que el aspecto relativo al contenido se trasmite en forma digital, mientras que el aspecto relatico a la relación es de naturaleza predominantemente analógica” (1985, p. 65). Es por ello que si el nivel de relación clasifica al contenido: Z1''' (X3'), por isomorfia la comunicación analógica clasifica a la comunicación digital: Z1'''' (X4'). 188 Por último, el quinto axioma, producto de la labor antropológica de Bateson, clasifica a las interacciones en simétricas y complementarias84, sólo que se cambia el término de cismogénesis por el de interacciones, definidas como el intercambio de mensajes entre dos personas. En las interacciones simétricas ambas personas se comportan de igual manera, pero cada una intensifica cada vez más su respuesta, mientras en las complementarias las conductas de ambas personas se complementan por medio de la diferencia entre los patrones de relación. Una de las personas ocupa una posición primaria y la otra una posición secundaria, así en un intercambio comunicativo la conducta de A trasmite por el nivel relacional de la comunicación instrucciones de clasificación de los mensajes a B, como lo establece el axioma 2 (X3’), y con ello le ordena responder con conductas complementarias. De tal modo que los intercambios de conductas entre A y B se estimulan y complementan por la diferencia entre ellas, y las definiciones de la naturaleza de su relación encajan. Ambos tipos de secuencias de interacción contribuyen en el curso de las definiciones de la relación en los sistemas interaccionales. Los axiomas del modelo comunicacional, además de participar en las definiciones de la relación entre los comunicantes, posibilitan la descripción interaccional de la conducta, dado que el axioma uno sostiene que no es posible no comunicar, cuando dos personas están presentes entran en interacción al iniciar una secuencia de intercambio de mensajes, aun cuando no se comuniquen digitalmente, sino solo analógicamente (X4’), como lo señala el axioma cuatro. Lo cual permite introducir la descripción de las relaciones humanas como sistemas interaccionales. Como piensa Haley: “When one shits to the study of the two persons system, he is entering the field of communication and must describe the individual in terms which apply to the communicative behavior between two or more people” (1963, p. 5). Al caracterizar las relaciones entre las personas como sistemas desde el modelo comunicacional, se concibe que cada comportamiento intercambiado es un mensaje que propone definiciones de la relación entre los miembros del sistema. Al describir el intercambio de secuencias de mensajes entre dos personas y sus respuestas ante las conductas del otro posibilita caracterizar al sistema como interaccional. De ahí la definición que ofrecen Watzlawick, Beavin y Jackson: “los sistemas interaccionales serán dos o más comunicantes en el proceso, o en el nivel, de definir la naturaleza de su relación” (1985, p. 118). Los sistemas interaccionales se forman cuando un conjunto de personas interactúan al intercambiar mensajes, con la finalidad de definir la relación entre ellos por medio de los elementos formales de la comunicación establecidos previamente, 189 los cuales tienen efectos pragmáticos, y estructuran y organizan el proceso comunicativo en los sistemas interaccionales. En el primer encuentro entre dos personas, A y B, ambos establecen un sistema interaccional en el cual cualquier comportamiento tiene la misma probabilidad de producirse, de modo que comienzan a intercambiar mensajes (X2´) con el fin de definir la naturaleza de su relación. Cada mensaje trasmite información (X1’) con la cual se reduce la incertidumbre del sistema, e indica por medio la comunicación analógica (X4’) como clasificar cada mensaje. De tal modo que cada mensaje enviado por A, al reducir el azar de todas las conductas posibles restringe las posibilidades de respuesta de B; al mismo tiempo la comunicación de B en respuesta a la de A, restringe las conductas de A. Haley (1963) señala que durante ese intercambio de mensajes, cada una de las personas propone por medio del nivel relacional de la comunicación (X3’) una definición de la relación como simétrica o complementaria, la cual puede ser aceptada o negada por la otra hasta que ambos llegan a definirla mutuamente. De acuerdo a Watzlawick, Beavin y Jackson (1985), después de un tiempo de haberse establecido el sistema interaccional entre A y B, ciertas secuencias de mensajes se vuelven más repetitivas que otras, y con ello algunas órdenes de clasificación de la información se vuelven más frecuentes, en consecuencia algunas secuencias son más probables que las demás; de este modo se dice que el sistema interaccional muestra redundancia o constricción85. La redundancia pragmática (X5’) se refiere entonces a las configuraciones de las secuencias de los intercambios de mensajes que son más repetitivas entre los miembros del sistema interaccional, y por lo tanto más probables. A partir de las redundancias pragmáticas repetitivas en un sistema interaccional se establecen reglas (α) que gobiernan las secuencias de interacción entre los comunicantes, al regular la forma en cómo se clasifica la información por medio de reglas de conducta, y con ello las definiciones de la naturaleza de la relación. Bateson (1968a) señala que la redundancia permite adivinar con un grado mayor al azar las partes faltantes de una secuencia de mensajes a partir de la parte que recibe un observador, y con ello hacer predicciones, debido a las restricciones que impone cada mensaje. En este sentido la tarea de la pragmática de la comunicación es observar la comunicación para buscar las redundancias pragmáticas, por las cuales se infieren las reglas (α) que gobiernan el 190 funcionamiento del sistema, y explicitar dichas reglas por medio de enunciados metacomunicativos (γ) (Jackson, 1965a; Watzlawick, Beavin y Jackson, 1985). Los sistemas interaccionales son modelados por medio de las analogías resultantes del establecimiento de correspondencias uno-a-uno a través de las propiedades de los sistemas cibernéticos, explicadas en el capítulo 3 y descritas en el diagrama 5: el feedback, la causalidad circular, y la homeostasis. De modo que las relaciones entre personas, entendidas como sistemas internacionales, son descritas como sistemas cibernéticos (Y(Q)). Como se estableció en el primer axioma toda conducta es comunicación por que trasmite información (X1’), de modo que cada conducta es un mensaje (X2’), que tiene la finalidad de definir la relación por medio del nivel relacional de la comunicación (X3’). Cada mensaje de la secuencia comunicativa funciona como una entrada al sistema interaccional y lo recorre por medio del feedback por el que opera el sistema, ya sea positivo o negativo (Y1´). Ambos tipos de feedback actúan por medio de la causalidad circular (Y2’), la cual, en contraposición con la causalidad lineal, en las secuencias de interacción entre A y B, los mensajes de A afectan a B, y los de éste influyen a A, es por ello que Watzlawick, Beavin y Jackson sostienen que los sistemas interaccionales, “pueden entenderse como circuitos de retroalimentación, ya que la conducta de cada persona afecta a la de cada una de las otras, y es a su vez afectada por estas” (1985, p. 32). De ese modo por medio del feedback y la causalidad circular se puede dar una definición formal de los fenómenos interaccionales en los sistemas interpersonales. Mientras en el feedback positivo la información aumenta la desviación con base en la regla interaccional (α) que gobierna al sistema, lo cual lleva a la perdida de estabilidad de las relaciones en el sistema, y con ello a su desorganización. En el feedback negativo la información sirve para disminuir la desviación con respecto a la regla interaccional (α), lo cual permite mantener el estado estable del sistema. Por lo cual este tipo de feedback caracteriza a los sistemas auto-regulados que buscan la homeostasis (Y3’) del sistema interaccional; los cuales reaccionaran contra cualquier tipo de mensaje que desestabilice las reglas de relación y de conducta, por medio de mecanismos homeostáticos como las redundancias pragmáticas (X5’), y con ello se mantienen constantes las definiciones de relación entre los comunicantes. Los autores advierten que ambos tipos de retroalimentación se complementan en el intercambio de secuencias de mensajes durante una interacción en curso de definir su relación. 191 A partir de la caracterización dada de los sistemas interaccionales, se deduce el modelo de la interacción en el sistema familiar que utiliza como dominio modelo las propiedades de la cibernética, el cual provee la naturaleza sistémica e interaccional al modelo clínico del BTC, y afirma su pertinencia a la tradición cibernética. La familia es entendida como un sistema interaccional compuesto por los miembros de la misma, quienes intercambian comunicación con el fin de definir la naturaleza de su relación. Considerando que toda conducta es comunicación, en la familia la conducta de cada miembro es un mensaje (X2’) que transmite información (X1’), esta disminuye la incertidumbre y el azar de las conductas posibles del sistema interaccional, por lo cual como señalan Watzlawick, Beavin y Jackson: “en una secuencia comunicacional, todo intercambio de mensaje disminuye el número de movimientos siguientes posibles” (1985, p. 127-128). Por ejemplo, en un sistema compuesto por A, B y C, padre, madre e hijo respectivamente; si A emite el mensaje P a B, este responde con el mensaje Q a A, al mismo tiempo que los mensajes P y Q afectan a C, el cual puede responder con R, S o T. De modo que cada mensaje intercambiado impone a los demás miembros limitaciones sobre las posibles conductas siguientes, generando así el intercambio de secuencias de mensajes entre los miembros del sistema familiar. Hay que notar que cada mensaje impone limitaciones a la totalidad del sistema interaccional, y las relaciones entre los miembros, ya que además de las restricciones que de la información, cada mensaje es una entrada en el sistema interaccional que por medio del feedback (Y1’) y la causalidad circular (Y2’) se trasmite a lo largo del mismo, por lo cual afecta y modifica el comportamiento de todos los demás miembros, y a sus definiciones de relación. A partir del intercambio de secuencias de mensajes entre los miembros del sistema familiar, la comunicación analógica (X4’) califica como deben entenderse los mensajes a nivel relacional de la comunicación (X3’), y con ello propone como definir la naturaleza de la relación entre los miembros de la familia, la cual puede ser aceptada, rechazada o modificada por los otros miembros (Haley, 1963; Watzlawick, Beavin y Jackson, 1985). El intercambio de ciertas secuencias de mensajes en el desarrollo del sistema familiar a lo largo del tiempo, genera patrones comunicacionales característicos del sistema configurados por la redundancia pragmática (X5’). La redundancia pragmática de ciertos patrones de comunicación entre los miembros del sistema, hace que los intercambios de algunas secuencias de conducta, es decir, de mensajes se vuelvan más frecuentes que otras, lo que hace que unas 192 conductas sean repetitivas y otras queden fuera del intercambio, por lo cual la organización de la interacción en el sistema muestra restricción o redundancia. Debido a la redundancia de ciertos patrones interacciónales, las definiciones de relación propuestas por medio del nivel relacional de la comunicación (X3’) entre los miembros del sistema se estabilizan por medio de acuerdos no explícitos llamados reglas, en palabras de Jackson: “These relationship agreements, which are here called rules, prescribe and limit the individuals' behaviors over a wide variety of content areas, organizing their interaction into a reasonably stable system.” (1965a, p. 4). De ese modo Jackson, a partir de las redundancias pragmáticas que restringen la diversidad de comportamientos posibles, introdujo la entidad explicativa plausible de regla familiar (X5’(α)),para señalar la estabilización de las definiciones de relación como simétricas o complementarias en la familia, las cuales gobiernan las interacciones en el sistema familiar. Para volver a citar a Jackson, dice: “the family is a rule- governed system: that its members behave among themselves in an organized, repetitive manner and that this patterning of behaviors can be abstracted as a governing principle of family life.” (1965a, p. 3). Para él, el sistema familiar está gobernado por reglas de interacción que organizan los patrones de interacción, esto es, tanto el registro de las conductas comunicativas que restringen la relación entre los miembros de la familia, como las secuencias comunicacionales repetitivas que garantizan la constancia de la organización del sistema, a partir de la estabilización de la definición de la relación de los miembros (Jackson, 1959b). Para Jackson (1965a; 1965b) el concepto de reglas familiares permite consolidar el lenguaje interaccional para la descripción de las relaciones interpersonales y el estudio de los sistemas familiares desde el enfoque comunicacional. El observador, al observar las redundancias pragmáticas características de la interacción familiar, infiere las reglas familiares, las cuales le permiten entender a la familia como un todo en que la conducta de uno de los miembros restringe la de los demás, y además pasar de la atribución de características individuales de los miembros de la familia de manera esencialista a explicar dichas características como producto de la interacción en la relación. Las reglas familiares, agrega Jackson (1965a), son como las normas que regulan el comportamiento del termostato, ya que limitan la conducta de la familia dentro de un rango, y por implicación acuerdan la definición de la relación entre los miembros. Lo cual le da estabilidad al sistema interaccional, denominada por Jackson (1957) homeostasis familiar: Y3’ 193 (β); la cual es mantenida por medio de mecanismos homeostáticos, entendidos de la siguiente manera: “homeostatic mechanisms can be seen as behaviors which delimit the fluctuations of other behaviors along the particular range where the norm is relevant” (Jackson. 1965a, p. 6). Estos mecanismos son comportamientos que limitan los patrones interaccionales de la familia dentro de la regla cuando las definiciones de relación se han estabilizado, así funcionan como feedback negativo para mantener la homeostasis familiar y con ello permanecer dentro del rango de conductas permitidas y de las reglas que regulan al sistema. Atendido lo que precede para Watzlawick, Beavin y Jackson (1985) las familias son sistemas interaccionales estables gobernados reglas familiares, las cuales son producto de la estabilización de la definición de la relación mutua entre los miembros de la familia, derivadas de las redundancias pragmáticas. Las reglas que mantienen la conducta dentro de ciertos límites, regularizan la clasificación de los comportamientos en su relación y garantiza la homeostasis familiar. 4.3.3 Modelo de Terapia Breve del BTC Expect poison from the standing water William Blake Dip him in the river who loves water William Blake El modelo comunicacional desarrolló un lenguaje formal para la descripción de las relaciones familiares a partir de conceptos interaccionales, desde el cual el los miembros del BTC explican su modelo clínico. Por ello en esta sección, a partir del modelo comunicacional de la familia y del lenguaje interaccional para la descripción de los sistemas relacionales que se acaba de explicar en la sección anterior, se señalan los aspectos clínicos de la comunicación, al mostrar en primer lugar la manera en que el modelo clínico del BTC sostiene que se generan y mantienen los problemas, para enseguida justificar sus técnicas de intervención. Desde el modelo comunicacional del MRI se realiza la redescripción de los comportamientos desviados como fenómenos comunicacionales e interaccionales. Para Watzlawick, Beavin y Jackson (1985) la explicación de la etiología de la patología no puede aislarse del contexto comunicacional en donde se encuentra, sino que debe considerar el contexto interaccional del síntoma, el cual es generalmente la familia. En ese sentido para Jackson (1969a) 194 toda característica individual, incluida la patología es resultado de la relación de las personas que exhiben los síntomas con los demás, por lo cual para estudiarla es necesario observar la manera en que se configuran los patrones comunicacionales de la interacción familiar. Como se ha reiterado toda conducta es comunicación, lo que significa que toda conducta anormal y síntoma es un mensaje (X2’) que afecta a todos los miembros del sistema interaccional familiar, de modo que la explicación de la conducta desviada debe considerar los patrones de interacción entre los miembros la familia bajo la lógica de la causalidad circular (Y2’), y así dar cuenta de la manera en que los demás miembros reaccionan al mensaje del síntoma y como estas reacciones afectan a la conducta desviada, y la forma en que a partir de sus patrones comunicacionales se modifican las definiciones de relación entre ellos. De ese modo se deja de explicar el síntoma como una propiedad inherente al individuo que lo muestra, y se comienza a considerar como una característica del sistema interaccional, y en consecuencias a la patología como resultado de la interacciones en el sistema; como lo dice Watzlawick de manera inmejorable: “existen realmente relaciones perturbadas, pero no individuos perturbados, o dicho más exactamente, que los trastornos de comportamiento son una función de las relaciones humanas, pero no de psiques enfermas” (1988, p. 18). Por lo que la patología pasa de ser explicada como una propiedad esencial del individuo, a ser entendida como producto de las secuencias comunicacionales intercambiadas por los miembros del sistema, que terminan por producir síntomas derivados de trastornos en la comunicación durante su interacción. Lo cual implica que los demás miembros del sistema interaccional aunque no muestran síntomas evidentes, participan en el mantenimiento de los patrones de interacción que provocan el surgimiento de síntomas en otro de los miembros, llamado generalmente paciente, y que las conductas desviadas de éste último son respuestas coherentes a un contexto comunicacional patológico persistente en el sistema familiar. Acorde a estas ideas los miembros del BTC, Weakland, Fisch, Watzlawick, & Bodin (1974), explican el surgimiento comportamiento desviado en el sistema donde se presenta, el cual resultado de la interacción del paciente con el sistema familiar y social. Para ellos la etiología del síntoma es resultado de una disfunción mantenida por la pauta de comportamiento del paciente y de las personas que están a su alrededor. Por lo que su propuesta consiste en la descripción del contexto comunicacional formal bajo el cual se desarrollan los síntomas. 195 En primer lugar Watzlawick, Weakland, & Fisch, (1994) identifican la contingencia del contexto en el que los sistemas familiares entran en secuencias interaccionales que dan lugar al desarrollo de desviaciones en el comportamiento, para ello establecen la distinción entre dificultades y problemas. Las dificultades son aquellas situaciones ordinarias por las que pasa toda familia durante su desarrollo como la enfermedad, perdida del trabajo, separaciones, etc., y cuya solución no va más allá de la resignación o del sentido común Las dificultades se convierten en problemas cuando se les intenta resolver de manera equivocada, y ya que la dificultad sigue sin resolverse se vuelve a aplicar con mayor esfuerzo la solución ensayada, con lo cual se establece un patrón interaccional que propicia por un lado la intensificación de la dificultad original convirtiéndose en un problema, y por otro el desarrollo de síntomas en alguno de los miembros del sistema interaccional. Los problemas surgen al intentar solucionar una dificultad de manera deficiente y de ese modo se intensifican y agravan. Las formas en que una dificultad puede llegar a ser un problema se pueden dividir en el grupo de los “terribles simplificadores”, son quienes niegan que un problema lo sea, por lo que aplican soluciones simples, sin embargo al no aplicar el cambio necesario la dificultad original se agudiza y se convierte en un problema. Y el grupo que tiene el “síndrome de la utopía”, son personas quienes ven problemas donde no existen e intentan desesperadamente solucionar una dificultad por medio de soluciones precarias, la cual tiene la meta de eliminar todos los problemas, ya sea a nivel personal o a nivel social (Watzlawick, Weakland, & Fisch, 1994; Weakland et al. 1974). Bajo la contingencia del contexto comunicacional en que se presenta una dificultad, los miembros del sistema interaccional familiar intentan resolverla respondiendo por medio de una solución tan ineficaz como inadecuada, creando con ello una secuencia comunicacional que se repite hasta convertirse en una redundancia primatica en el sistema y en un patrón interaccional de la familia, el cual además de no resolver la dificultad, la agrava y la convierte en un problema. Como lo dicen Fisch, Weakland y Segal: “para que un problema exista y permanezca como tal, debe haber conductas problemáticas y que se llevan a cabo de forma repetida dentro del sistema de interacción social del paciente” (1894, p. 31). El sistema familiar integrado por los miembros A, B y C, padre, madre e hijo respectivamente, desarrolla sus interacciones dentro del contexto comunicacional de la dificultad P. De modo que para resolver P uno o más de los miembros, A y B, por ejemplo, intentan 196 resolverlo por medio de la conducta S. Dado que toda conducta es comunicación, S es un mensaje (X2’) que trasmite información (X1’), la cual al reducir la incertidumbre del sistema y recorrerlo por medio de la causalidad circular (Y2’), afecta y limita las posibles respuestas de C. De ese modo se establece la primera secuencia de mensajes, llamémosla M, que busca resolver P, compuesta por la conducta S y las siguientes conductas de C, digamos T. Sin embargo, la secuencia M desencadenada por la conducta S no es adecuada para resolver la dificultad P, por lo que no se resuelve; en consecuencia A y B repiten la conducta S con mayor intensidad esperando que así se resuelva P, lo cual vuelve a resultar ineficaz, pero obliga a C a responder con la misma conducta T que mantiene la secuencia M. Después de un tiempo de intentos de solución reiterados por la repetición de la secuencia M, se establece redundancia pragmática (X5’) en el sistema, de modo que otros tipos de intentos de solución quedan descartadas, organizando así patrones de interacción rígidos en el sistema familiar sin que P haya sido resulto, sino al contrario se agrave cada vez más. De esa manera la conducta S sirve como feedback positivo (Y1’) en el sistema interaccional para crear un círculo vicioso que mantiene y aumenta la intensidad de la dificultad P, convirtiéndola en un problema Q. Ya que la conducta S no resuelve P, al agravarse desencadena síntomas en alguno de los miembros del sistema que participan en la configuración de la secuencia M, y ésta al repetirse de manera estereotipada restringe las secuencias de intercambio a un patrón interaccional fijo que ayuda a mantener e intensificar a P. El síntoma se vuelve parte de la secuencia redundante y sirve como mecanismo homeostático, sin embargo, dado que el intento de solución S actúa como feedback positivo, el síntoma se vuelve más crónico progresivamente. Para ilustrar alguno la formación de estos círculos viciosos se presenta la patología interaccional que resulta de la diferencia en la puntuación de una misma secuencia de hechos entre dos personas. De acuerdo a Watzlawick, Beavin y Jackson (1985) aunque ambas personas comparten la misma secuencia, cada una la puntúa de manera distinta, pero al no advertir la circularidad del intercambio en el sistema interaccional que conforman, cada uno tiende a asumir que la conducta del otro es un “estimulo” al que ellos sólo responden, sin notar que su “respuesta” es un “estimulo” para el otro. Puntuaciones distintas dan lugar a discrepancias en las formas de organizar la realidad, y a desacuerdos sobre la naturaleza de la relación que tienen, y con ello a un conflicto interaccional que provoca hacer rígida la regla de definición de la relación, y a la imposibilidad de cambiarla, produciendo escaldas en las definiciones de la 197 relación simétricas y complementarias. En el primer caso intensificando las peleas características de los intercambios simétricos, y en el segundo complementando ambas puntuaciones para conformar un sistema patológico. En ambos tipos de escalada, cada uno de los mensajes del otro es puntuado de tal manera que confirme su definición de la relación. Para poner un ejemplo, Fisch, Weakland y Segal (1994) describen una relación de pareja compuesto por A y B, en la que A sospecha que B está haciendo algo incorrecto como beber excesivamente, serle infiel, ocultarle algo, etc., y por ello realiza acusaciones a B, éste se defiende, lo cual provoca que A confirme sus sospechas pues después de todo, ¿por qué B habría de defenderse si no es verdad?, por lo que acusa repetidamente a B, quien se limita a defenderse. El patrón interaccional mantenido por una mala solución reiterada, es conservado por la conducta de cada miembro, producto de la definición de la relación de acuerdo a la forma en como puntúa la secuencia de mensajes. Mientras al inicio A define la relación como complementaria donde ella ocupa la posición superior para poder acusar a B, B define la relación como simétrica para poder corregir la definición de A, a lo que ha responde con una definición de la relación simétrica. De manera que cada miembro puntúa las secuencias de intercambio, lo que a la vez que confirma su definición de la relación, mantiene el patrón interaccional que perpetua y agrava el conflicto. En consecuencia el sistema interaccional entra en una escalada simétrica en la que cada intercambio de acusaciones y defensas se vuelve más intenso, y provoca que la regla que gobierna la relación se vuelva rígida Un caso especial de las dificultades interaccionales derivadas de la puntuación, es la secuencia identificada por Watzlawick, Beavin y Jackson (1985) como profecía autocumplida, en las que una persona, A, al restringir las posibles respuestas de los demás ante su comportamiento, éstos actúan de manera complementaria apropiada para sus mensajes, con lo cual A confirma sus definiciones de relación, sin percatarse de su participación para crear la secuencia de interacción que le causa disgusto. Imaginemos a una persona que piense que todos son menos inteligentes que él y por eso lo odian, por lo que tendera a puntuar las secuencias de hechos de tal forma que encuentre errores en las acciones o argumentos de los demás, y a señalarlos de forma pedante, con lo cual confirma que todos los demás son torpes. Al actuar de manera sistemática de la misma forma, es decir, al hacer más de lo mismo, define sus relaciones como complementarias en donde él es el superior, mientras lo demás responden con indiferencia o molestia a su hostilidad, con lo que confirma que lo detestan por ser más inteligente. Aun 198 cuando eventualmente alguien le señale su patrón por medio de la metacomunicación, dicho metamensaje será una prueba más de su definición de relación pues será clasificado como un signo de envidia y rencor por parte de quien se lo dice. Hay una tercera forma de que el sistema interaccional llegue a un impasse comunicacional identificada por Watzlawick, Beavin y Jackson (1985) y es por medio de la paradoja pragmática. La cual es resultado de estudiar en el contexto comunicacional la paradoja producida al no respetar la división entre miembro y clase que establece la teoría de los tipos lógicos. La identificación de niveles en la comunicación entre mensaje (X2’) y metamensaje (δ), y su confusión en las secuencias comunicativas da lugar a paradojas comunicacionales o pragmáticas: Z2' (ζ). Dichas paradojas generan problemas en la comunicación y por tanto tienen efectos en la interacción. Las paradojas pragmáticas son evidentes en las secuencias de intercambio donde A pide a B algo que es por definición espontaneo, a dichas secuencias se les denomina instrucciones paradójicas, y se caracterizan por la imposibilidad de obedecer la instrucción y también de desobedecerla. Por ejemplo, en una relación donde el sujeto A le pida que sea espontaneo a B, todo lo que haga B está clasificado como respuesta al mandato de espontaneidad, y por lo tanto dejara de inmediato de ser espontaneo, por lo que al obedecer B en realidad desobedece a A. Sin embargo, si B decide no hacer nada espontaneo, aun así su inactividad, silencio o cualquier otra cosa que haga es una conducta, como lo establece el axioma uno de que no es posible no comunicarse, es espontaneo por lo que obedece. En suma, si obedece a ser espontaneo desobedece, y si desobedece obedece. En consecuencia B no puede salir del marco paradójico impuesto por el mandato de A haga lo que haga. Watzlawick, Weakland y Fisch ofrecen una definición de las instrucciones que exigen espontaneidad: Esta orden afirma, por lo tanto, que la obediencia a una orden emanada del exterior es un comportamiento inaceptable, ya que dicho comportamiento ha de estar libremente motivado desde el interior. Pero esta orden básica, que comprende a todas las órdenes (a la clase de todas ellas) es en sí misma una orden, es un miembro de la clase y se aplica a sí misma (1994, p. 91). 199 La instrucción de ser espontaneo es paradójica porque es una orden sobre todas las ordenes, al mismo que tiempo que es una orden, es decir, es miembro de clase que clasifica; por lo que la instrucción de ser espontaneo en un nivel dice algo acerca de la clase de las ordenes, y en otro nivel la instrucción está dentro de la clase de las ordenes al ser una orden, con lo cual se viola la división entre miembro que clase que establece la teoría de los tipos lógicos. En términos del modelo comunicacional, la orden paradójica es un metamensaje, y con ello una clase que indica como clasificar todos los mensajes, pero que al mismo tiempo es un metamensaje que pertenece a la clase de metamensajes, por lo que es miembro de la clase que clasifica y en consecuencia es autorreferencial. O dicho de otro modo: la instrucción de ser espontaneo es un metamensaje que establece un marco de clasificación de los metamensajes, por lo que es un marco para sí misma. De manera si M es metamensaje se tiene: M. M es un elemento de M si y solo si M no es elemento de M. Es decir, que cuando el metamensaje es un miembro de sí mismo, no es miembro de sí mismo, pero si no es miembro de sí mismo, el metamensaje es miembro de sí mismo, ad infinitum. O en términos de la instrucción paradójica, llamémosla I: I, I es un elemento de I si y solo si I no es un elemento de I, por lo cual cuando se quiere obedecer I y es miembro de si mima se le termina desobedeciendo, y cuando se quiere desobedecer I se le termina por obedecer. Para poner un ejemplo, en un sistema interaccional compuesto por A y B, ambos son una pareja, A da un mandato por medio del nivel relacional de la comunicación (X3’) del tipo paradójico a B, como que la ignore, llamemos a ese metamensaje Ig. El mandato Ig es una paradoja pragmática (ζ) ya que al mismo tiempo que es metamensaje (δ (X2’) que indica como clasificar todos los mensajes y a todos los metamensajes a nivel relacional de la comunicación (X3’) que se intercambian entre A y B; es también un metamensaje dentro de la clase de metamensajes, por lo cual es miembro y clase a la vez, y con ello es un metamensaje autorreferencial en el que se afirma que Ig es un miembro de la clase que define. De manera que la situación es la siguiente: . Es decir, Ig es un elemento de Ig si y solo si Ig no es un elemento de Ig. O, con mayor precisión: el metamensaje Ig es un elemento del metamensaje Ig si y solo si el metamensaje Ig no es un elemento del metamensaje Ig. Lo cual representa la paradoja de Russell al nivel comunicacional que resulta de hacer de la clase un miembro de sí misma; al ser una orden autorreflexiva cuando Ig es miembro de Ig no es miembro de Ig, y si ésta no es miembro de Ig entonces es miembro de Ig, ad infinitum. 200 Ante esta particular situación B puede intentar obedecer el mandato Ig de A haciendo toda una serie de conductas: P, Q, R, S, etc., pero al ignorar a A, en realidad B está obedeciendo Ig, por lo que no está ignorando a A, pero si no la ignora, B está desobedeciendo el mandato Ig, por lo que sí está ignorando a A, sin embargo, si B está ignorando a A, se encuentra obedeciendo Ig, de modo que no ignora a A; así de manera indefinida. Pero pensemos en que B es una pésima pareja y decide desobedecer el mandato Ig y no ignorar a A, por lo que no hace nada para cumplir haciendo las conductas T, V, W, etc., en ese caso su conducta para no cumplir Ig no deja de ser conducta debido al axioma uno de la comunicación: ¬(¬X2’)= X2’, de modo que la serie se repite: si B no ignora a A, la ignora porque desobedece el mandato Ig, pero si la ignora obedece Ig, por lo que no ignora a A. En resumen, cuando B obedece el mandato lo desobedece, más cuando lo desobedece lo desobedece, así de manera interminable. Como consecuencia B se ve imposibilitado para ignorar a A al obedecer Ig, y también tiene negada la posibilidad de desobedecer Ig para ignorar a A al obedecer, haga lo que haga no tiene elección, cancelando con ello la espontaneidad que exige la orden y en consecuencia anulando cualquier posibilidad de cumplirla. Ahora bien, dado que el mandato paradójico Ig está en el nivel relacional de la comunicación (X3’) produce problemas interaccionales al generar dificultades para definir la relación como simétrica o complementaria entre los miembros del sistema interaccional. De modo que cuando se produce una paradoja pragmática (ζ) como la descrita, A al dar el metamensaje Ig define su relación como alguien que desea ser ignorada por medio del nivel relacional, lo que exige de B una relación complementaria superior; pero como lo señalan Watzlawick, Beavin y Jackson (1985) dado que es A quien da la orden, la relación complementaria queda clasificada en marco de relación simétrica. De modo que todas las definiciones de relación que propone B por medio del nivel relacional de la comunicación quedan clasificadas por el metamensaje Ig, y aunque B acepte la definición de la relación de A, no puede cumplir el lugar complementario, pues sus metamensajes quedan clasificados por Ig: Ig (P, Q, R, S, n). Del mismo modo aunque niegue la definición de la relación por el metamensaje Ig, éste clasifica todas sus metamensajes: Ig (T, V, W, n). Lo que lleva a la imposibilidad la modificar la definición de la relación fuera del marco paradójico, quedando atrapados ambos miembros del sistema interaccional, Como resultado de la instrucción Ig todo lo que haga B está clasificado como paradójico, por lo B sólo puede responder con mensajes paradójicos, pues como lo señalan Watzlawick, 201 Beavin y Jackson: “Dado que el mensaje es paradójico, cualquier reacción frente a él dentro del marco establecido por el mismo debe ser paradójico” (1985, p. 181). Dado que el mensaje paradójico impone restricciones como cualquier otro mensaje a las respuestas de los miembros del sistema interaccional, y que clasifica a todo metamensaje como paradójico, B responde de esa manera a A, del mismo modo los mensajes de A quedan clasificados por la orden paradójica. Enseguida A y B inician una secuencia de intercambio en la que todos los metamensajes son paradójicos al quedar clasificados inmediatamente por la orden Ig, dicha secuencia es mantenida por la causalidad circular (Y2’) del sistema, en la que cada mensaje sirve como feedback positivo (Y1’) para mantener la comunicación paradójica y con ello crear un círculo vicioso que oscila cada vez más. Después de un tiempo la secuencia en la que todos los metamensajes son clasificados por la orden paradójica se convierte en un patrón interaccional autoperpetuante que limita las posibles respuestas de A y B, de modo que el sistema interaccional muestra redundancia pragmática paradójica (X5’). Cuando la definición de la relación se estabiliza entre ellos debido a la imposibilidad de modificar la definición de la relación, se establece una regla (α) de la relación que es paradójica, en la que los intercambios entre los miembros del sistema interaccional están restringidos a mensajes paradójicos, clasificados permanente por la orden paradójica, de modo que hagan lo que hagan los miembros del sistema interaccional contribuye a perpetuar la definición de la relación. Bajo este contexto comunicacional rígido del que no pueden escapar, los miembros del sistema interaccional hacen “más de lo mismo” al comunicarse, pues cada conducta funciona como feedback positivo para aumentar la desviación de la comunicación, sin la posibilidad de modificar la regla que gobierna su interacción quedando ambos atrapados por la ilusión de alternativas que establecen los mensajes paradójicos. Para ilustrar las relaciones patológicas en donde la comunicación paradójica es la regla Watzlawick, Beavin y Jackson (1985) retoman la comunicación esquizofrénica derivada de la experiencia del doble vínculo. En el doble vínculo el sistema interaccional está compuesto por dos o más personas significativas entre sí, A y B, madre y niño respectivamente, en la que A emite un mensaje en donde en un nivel afirma algo, y en otro nivel se afirma algo sobre el primer nivel, y ambas afirmaciones son incongruentes. Haley (1963) acierta al advertir que los niveles del mensaje involucrados son los que estructuran la comunicación (X3´), la paradoja surge cuando el nivel de contenido es calificado de manera incongruente por el nivel de relación, a través de la comunicación analógica y digital (X4’). Además, a B se le cancela la posibilidad de 202 escapar del mensaje paradójico por medio de una amenaza. Ante este marco todos los mensajes y metamensajes que B emita acerca la definición de la relación propuesta por A son clasificados por la paradoja, por lo que sus respuestas son también paradójicas. Al establecerse la secuencia de intercambio de mensajes paradójicos y la imposibilidad de salir del marco creado por el metamensaje paradójico, la secuencia se vuelve redundante (X5’) en el sistema interaccional y se convierte progresivamente en el patrón de interacción entre ambos miembros mantenida por la causalidad circular (Y2’) de la interacción. Por esta razón la comunicación paradójica se convierte en una expectativa para B, cuyos posteriores mensajes contribuyen a mantener el patrón de interacción paradójico y con ello a crear el doble vínculo para A. De ese modo cada mensaje (X2’) que intercambien A y B sirve como feedback positivo (Y1’), el cual, además de aumentar la distorsión de los mensajes paradójicos, hace imposible modificar la regla (α) de definición de la relación entre ellos. De esa manera se establece un círculo vicioso autoperpetuador, haciendo que el sistema interaccional se vuelva patológico. De este modo tanto la conducta característica de la esquizofrenia deja de ser explicada como producto de un trauma infantil que afecta la arquitectura psíquica del paciente, y pasa a ser entendida como una reacción coherente a las reglas del contexto comunicacional en el que está inmerso, mantenido por las respuestas de los otros miembros del sistema interaccional. Al generalizar la regla de relación paradójica a otros contextos comunicacionales, B, es decir, el paciente esquizofrénico, estructura su comunicación exclusivamente por mensajes paradójicos que impone sistemáticamente a los demás, en los que niega que se comunique con otros y al mismo tiempo niega que la primera negación sea comunicación86. El contexto paradójico producto de “espontaneidad impuesta” como la ha denominado Watzlawick (2001, p. 30-31) se presenta en toda contingencia en donde se ordene acciones que son espontaneas como las siguientes: quiéreme, sorpréndeme, olvídame, contrólame, miénteme, manipúlame, etc. Por lo que su presciencia en la comunicación cotidiana está lejos de ser extraordinaria. El funcionamiento de estas instrucciones puede ser entendido bajo el esquema explicativo propuesto. Bajo la lógica del mandato paradójico Watzlawick, Weakland y Fisch (1994) afirman que cuando se pretende controlar las reacciones naturales, se establece el mismo tipo de círculo vicioso desencadenado por la espontaneidad forzada. Cuando se fuerzan reacciones naturales como el sueño, entre más esfuerzos se hace por lograr dormir mayores dificultades se tienen para 203 lograr el descanso, enseguida, al insomnio persistente le sobrevienen tareas más intensas para poder dormir, lo que provoca más insomnio. De manera que cuando se intenta forzar algo que es natural, la dificultad original que es en sí misma trivial como no poder descansar un momento, se intenta remediar con una solución inadecuada que, al no solucionar el problema, se repite con mayor intensidad, con lo cual la dificultad queda sin resolver y se vuelve crónica, y termina por convertirse en un problema. De nuevo, el realizar más de lo mismo del intento de solución inadecuado es lo que genera y mantiene el problema. Las tres formas presentadas para la formación y mantenimiento de problemas tienen como común denominador el que cuando una dificultad se intenta resolver por medio de una solución inadecuada, y dicha solución se repite de manera sistemática a pesar de que evidentemente no resuelve la dificultad original; en consecuencia, “la ‘solución’ contribuye en gran medida a aumentar el problema y, de hecho, se convierte eventualmente en el mayor de los males” (Watzlawick, Weakland y Fisch, 1994, p. 52), es decir, el intento de solución se convierte en el problema pues permite agravar la dificultad original, y termina por generar síntomas en alguno de los miembros del sistema familiar. O, para decirlo con William Blake: “Expect poison from the standing water”. En esta situación el sistema interaccional al repetir el intento de solución, éste sirve como feedback positivo, lo cual provoca que la dificultad se agrave y faculta el desarrollo de síntomas, al mismo tiempo el síntoma, al funcionar como feedback negativo, mantiene estable el sistema familiar. En ese sentido Watzlawick, Beavin y Jackson afirman: “Los síntomas pueden así mostrarse como una constricción, como una regla del juego interaccional en que está inmerso el sujeto” (1985, p. 46). Lo síntomas funcionan como reglas (α) ya que restringen los patrones de interacciones entre los miembros del sistema interaccional y por lo tanto estabilizan sus definiciones de la relación. El síntoma es en primer lugar resultado del patrón interaccional que intenta resolver el problema, y posteriormente se convierte en la regla familiar que limita las interacciones en el sistema. Cualquier intento de desviación de la regla del sistema desencadena mecanismos homeostáticos con el fin de mantener a la familia dentro del patrón y garantizar la estabilidad del sistema, es decir, la homeostasis familiar (β). Para cambiar las reglas de que gobiernan la organización, los miembros del sistema interaccional pueden intentar usar la metacomunicación, sin embargo se presentan dos objeciones para ello. En primer lugar el lenguaje que se usa para hablar sobre el lenguaje natural, 204 es decir, el metalenguaje, es el mismo lenguaje natural, es consecuencia es imposible identificarlos durante la interacción, como lo explica Michael Dummett: But, when the language in question is our natural language, such separation of object-language and metalanguage is only a picture. In practice, we cannot effect it, for the simple reason that we do not have any alternative language, richer than natural language, to employ as metalanguage: any new linguistic device, of superior expression power, or with richer conceptual or ontological content, which we may introduce automatically becomes part of our own language, that is, natural language which we happen to speak (1981, p. 106). Dado que el lenguaje natural que se usa para referirse a lo objetos, y el lenguaje para hablar acerca del lenguaje, es decir, el metalenguaje, es el mismo, pues no hay un lenguaje exclusivo para expresar el metalenguaje; o en términos del modelo comunicacional: que la comunicación digital y la comunicación analógica verbal (X4’) usan el lenguaje natural, ambos son indiferenciables durante la secuencia comunicativa, por lo que cualquier elemento del metalenguaje se integra inmediatamente como miembro del lenguaje natural, con lo que se cancela la posibilidad de usar la metacomunicación de manera efectiva para hablar acerca de las reglas de relación entre los miembros del sistema interaccional. La segunda objeción es que, “incluso su comunicación sobre su comunicación está sujeta a las reglas” (Watzlawick, Beavin y Jackson, 1985, p. 166), aun cuando los miembros del sistema usen la metacomunicación para modificar las reglas que definen la relación, se produce una paradoja, ya que los metamensajes que intenten hablar acerca de las reglas se encuentran dentro de la clase, es decir, que el metamensaje es un miembro de los mensajes que clasifica la regla interaccional, sin embargo como miembro no puede hacer una aseveración acerca de la clase y cambiarla desde fuera. Por lo cual en el sistema interaccional patológico ningún metamensaje que se intercambie puede salir de la regla que define la relación como simétrica o complementaria y modificarla o contradecirla al ser clasificado como mensaje por la regla. Para poner un ejemplo, cuando un sistema interaccional tiene la regla de simetría, cualquier metamensaje que intente detener el conflicto participa dentro de la discusión y sirve como feedback positivo para intensificar la lucha, lo cual hacer que se perpetúe la relación de competencia y hostilidad entre los miembros al provocarse mutuamente por no poder modificar la forma en cómo se clasifican los mensajes, y 205 con ello hacer rígida la definición de la relación, desencadenando una escalada de la relación simétrica, de la cual no pueden salir por medio de la metacomunicación. Debido a la imposibilidad de usar la metacomunicación para modificar la definición de la relación dentro del sistema, el sistema se encuentra en un “juego sin fin”, en el que, “No puede generar desde su propio interior las condiciones para su propio cambio; no puede producir las normas de cambio a partir de sus normas” (Watzlawick, Weakland, Fisch, 1994, p. 42), el juego relacional no puede modificarse ni terminar debido a que carece de las reglas para modificar sus reglas, es decir, metarreglas (ε), lo cual provoca que el sistema no puede cambiar las reglas que gobiernan al sistema interaccional familiar. En estos sistemas se presentan los círculos viciosos que facultan el desarrollo de patologías en la interacción. Como lo sostiene Watzlawick: Los sistemas que funcionan bien se caracterizan claramente por una mayor flexibilidad y por un mayor repertorio de reglas, mientras que los sistemas ‘enfermos’, es decir, conflictivos, disponen de reglas escasas y rígidas (…). Los sistemas patológicos no disponen de suficientes metarreglas, es decir, de reglas para el cambio de sus reglas. Debería estar suficientemente claro que semejante sistema, por un lado, no puede desenvolverse en una situación para la que sus reglas (su repertorio de comportamiento) son inadecuadas y que, por otro, tampoco será capaz de crear a partir de sí mismo nuevas reglas ni cambiar las reglas existentes, de manera que pudiese así superar la situación en cuestión (1988. p. 31) Un sistema que está en un juego sin fin no puede modificar las reglas que gobiernan su interacción a partir de sus propias reglas, en consecuencia se mantienen rígidas las definiciones de relación y limitados los patrones de interacción entre los miembros del sistema interaccional que perpetúan la conducta sintomática y agravan el problema. Watzlawick, Weakland y Fisch (1994) denominan cambio 1 a las conductas limitadas que se intercambian en el sistema interaccional en forma de patrones de interacción que constituyen el intento de solución, pero que al no resolver la dificultad inicial, terminan por convertirse en el problema al aplicarse de manera repetitiva, a pesar de su evidente ineficiencia. Lo cual desencadena un juego sin fin, en el que resulta imposible modificar las reglas que gobiernan el sistema a partir de las reglas del sistema interaccional, pues carece de las metarreglas, es decir, 206 de reglas que regulan a las reglas: Z'''''(ε (X5'(α))), para cambiar las reglas del sistema desde dentro. En consecuencia los patrones de interacción se mantienen invariantes y las definiciones de relación entre los miembros son inmodificables. Por lo que para modificar las reglas es necesario introducir las metarreglas (ε) de cambio desde fuera del sistema interaccional patológico. De acuerdo a Watzlawick, Beavin y Jackson (1985) el objetivo de la terapia es justamente introducir las metarreglas que permitan cambiar las reglas que gobiernan al sistema por otras, y con ello eliminar el contexto interaccional que perpetúa al síntoma. A la modificación de las reglas se le llama calibración (Y4’)87, al calibrar se busca modificar la regulación del sistema al cambiar el rango de secuencias de intercambio entre los miembros del sistema interaccional, y en consecuencia se produzcan nuevas redundancias pragmáticas (X5´) que permitan introducir otros patrones interaccionales en donde la conducta anormal ya no aparezca, y el sistema tenga así una nueva estabilidad más satisfactoria para la familia. Hay que notar que la calibración es un cambio de las reglas de todo el sistema, por lo que es cambio de un nivel lógico superior a la homeostasis característica del cambio 1: Z1''''''(Y4' (Y3'(β))). A este tipo de cambio lo denominan Watzlawick, Weakland y Fisch (1994) cambio 2., por ser un salto con respecto a las reglas incambiables en el cambio 1, al modificar las reglas que gobiernan el sistema interaccional. Los miembros del BTC consideran que para calibrar el sistema familiar e interrumpir el círculo vicioso que perpetua al síntoma es suficiente con eliminar el intento de solución que mantiene y agrava el problema, como lo dicen Fisch, Weakland y Segal: Si la aparición y mantenimiento de los problemas son considerados como partes de un proceso que sigue un círculo vicioso en el que las bienintencionadas conductas de ‘solución’ otorgan continuidad a un problema, la alteración de tales conductas debe servir entonces para interrumpir el ciclo e iniciar la solución del problema, es decir, la desaparición de la conducta sintomática, que ha dejado de estar provocada por otras conductas pertenecientes al sistema de interacción (p. 37, 1994) 207 La interrupción de la secuencia del intento de solución basta para modificar el contexto interaccional que mantiene el síntoma, y que por medio de la causalidad circular (Y2’) desencadene una mejoría progresiva, y permita calibrar el funcionamiento de todo el sistema. Para lograr un cambio 2, Watzlawick, Weakland y Fisch (1994) establecen una serie de cuatro etapas que debe seguir el terapeuta. En primer lugar se busca elucidar el problema del cliente en términos concretos, esto es, de forma descriptiva. La segunda etapa consiste en identificar la clase de soluciones intentadas y que son las que mantienen el problema, con lo cual se señala que soluciones se han de evitar y en consecuencia donde aplicar la intervención. Dado que los patrones interaccionales que mantienen el síntoma se encuentran operando cuando el paciente va a terapia, pues de no estarlo, el síntoma ya hubiera desaparecido, resulta innecesario realizar un examen histórico sobre el origen del mismo; en cambio el terapeuta se concentra en indagar la secuencia en el presente mantenida por la causalidad circular (Y2’). En la tercera etapa se define el cambio por medio del establecimiento de una meta. Sin embargo, en concordancia con sus premisas, para Watzlawick, Weakland y Fisch (1994) la terapia no se propone metas utópicas, como la promesa de una felicidad desbordante, pues eso lleva a crear una meta inalcanzable que convierte a la terapia en un intento de solución mal aplicado, y en consecuencia la condena a convertirse en el problema, lo cual hace imposible solucionar el problema original ni dar termino al proceso terapéutico. En cambio, para Weakland et al. (1974) la terapia se contenta con la eliminación del síntoma: Hominem non morbum cura. Por lo cual se proponen objetivos concretos, realistas y asequibles formulados en términos observables y descriptivos, establecidos por el paciente. Para iniciar el cambio se formula un criterio específico de progreso que refleje un avance, y un cambio mínimo encaminado a resolver la queja del cliente. En la última etapa se formula la intervención. Dado que el intento de solución que se utiliza para eliminar la dificultad es lo que la mantiene y agrava, y es el que se convierte en el problema; las técnicas de intervención del cambio 2 se aplican sobre la pauta del intento de solución, “ya que si la ‘solución’ no existiría el problema” (Watzlawick, Weakland y Fisch, 1994, p. 53), con el fin interrumpir el circulo vicioso en el que se encuentra el sistema interaccional, y así eliminar síntoma. La intervención consiste básicamente en hacer que el paciente algo diferente al su intento de solución, de ser posible por medio de una indicación directa. Para convencer al paciente que 208 lo haga se realiza un reencuadre (reframing). El reencuadre del comportamiento es una técnica que consiste en redefinir la percepción que el paciente le atribuye al comportamiento que le causa problemas, y de ese modo poder flexibilizar su modo de pensar sobre sus relaciones y problemas (Weakland et al, 1974). En términos de la teoría de los tipos lógicos, para Bateson (1959a) un marco psicológico sirve para configurar una clase en la cual se agrupan algunos mensajes y se excluyen otros; de modo que organiza y estructura la percepción que se tenga de cada objeto, y sirve como un metamensaje para clasificar los demás mensajes. El reencuadre consiste en desplazar la asignación del marco que clasifica a la definición del síntoma que realiza el paciente a otro marco, con el fin de que sea clasificado de tal manera en que permita ser percibido manera diferente. El reencuadre reorganiza la forma de clasificación de los marcos perceptuales para cambiar la percepción que el paciente tiene de su problema, con lo cual se convierte en una alternativa a su realidad. Cuando se realiza la reasignación de un miembro a otra clase se espera que ya no regrese al mismo marco de referencia que mantiene el juego sin fin del problema, al clasificar la conducta en un nuevo marco psicológico. De ese modo, el síntoma pasa a un marco en donde deje de ser incambiable, y así permite ampliar el horizonte de compresión y el escenario de las posibilidades del paciente. El reencuadre, al modificar la manera en cómo se agrupan lo mensajes, es decir, de cómo se puntúa la secuencia de hechos, también posibilita la modificación de la definición de la relación que tiene alguien. A una madre que al querer ser buena realiza conductas con el fin de proteger a sus hijos, que en realidad mantienen el comportamiento disruptivo de su hijo adolescente, se le puede dar el reencuadre de que el ser buena madre significa preparar a su hijo para lo duro que es el mundo exterior, lo cual implica que debe permitirle que asuma las consecuencias de sus actos sin que ella los resuelva, con el fin de que este esté preparado para resolver los problemas de la vida adulta. De manera que desde el nuevo marco la madre ahora clasifique y perciba las conductas de su hijo como una oportunidad para que entrenarlo, por lo cual ella ya no se apresurara a vigilar, cuestionar y presionar todo lo que éste haga o deje de hacer, ni castigar, regañar e intimidar cuando el adolecente realice algo incorrecto, ni mucho menos resolver las consecuencias de las acciones del próximo adulto; sino que se limitara a observar y hasta alentar las conductas problemáticas. El reencuadre de la definición de la relación al mismo tiempo que interrumpe la secuencia de interacción que hace que se mantenga y 209 agrave el problema, hace que la madre clasifique sus acciones como tendientes a proteger a su hijo, con lo cual se legitima y mantiene su definición de relación como una buena madre (Fisch, Weakland y Segal, 1994). El reencuadre al introducir una metarregla en el sistema familiar, sirve como una técnica de cambio 2 que posibilita la aparición de nuevas redundancias pragmáticas por medio del comportamiento diferente de la madre, quien abandona las secuencias de intento de solución pertenecientes al cambio 1; lo cual obliga al hijo a comportarse manera diferente. De esa manera el sistema interaccional, al tener nuevas secuencias de intercambio, modifica las definiciones de la relación entre los miembros, y lo lleva a alcanzar una nueva estabilidad. En este ejemplo se evidencia una condición importante para realizar un reencuadre exitoso señalado por Watzlawick, Weakland y Fisch (1994): que el terapeuta conozca y utilice el marco de referencia del paciente compuesto por su lenguaje, valores, creencias, y premisas; para que el nuevo marco propuesto por el terapeuta sea aceptado por el paciente, y sirva como alternativa a los hábitos de clasificación del cliente. El reencuadre eficaz que legitime el marco del paciente permite que al introducir una intervención a nivel comportamiento sea más fácilmente aceptada y realizada por el paciente. En la técnica del reencuadre se sintetiza la habilidad técnica de Erickson de usar lo que el paciente lleva para provocar el cambio terapéutico, y la descripción de la comunicación clínica por medio de un lenguaje formal iniciado por Bateson. Del mismo modo, el uso de la paradójica terapéutica utilizada por Erikson, y su descripción por el equipo Bateson en términos de la teoría de los tipos lógicos fue asimilada por los miembros del BTC88. La paradoja terapéutica: Z2’’(η) se convirtió en la técnica característica del modelo del BTC para eliminar el síntoma. Watzlawick, Beavin y Jackson (1985), al notar que el paciente carece de control sobre la conducta sintomática, advirtieron que el síntoma siempre es experimentado como algo involuntario y espontaneo, y que el intento de solución para eliminarlo en realidad provoca que se mantenga y agrave. Ya que el síntoma es espontaneo la “prescripción del síntoma”, nombre tomado del último proyecto del equipo Bateson, consiste en que el terapeuta prescribe al paciente la paradoja pragmática derivada de la orden: se espontaneo, sobre su síntoma; es decir, prescribe su síntoma, o, para usar un aforismo de William Blake: Dip him in the river who loves water: Si se le pide a alguien que se comporte de una determinada manera que él considera espontanea, entonces ya no puede ser espontanea, porque la 210 exigencia hace imposible toda espontaneidad. Por idéntico motivo, si un terapeuta indica al paciente que realice su síntoma, está exigiendo una conducta espontánea y, mediante esa instrucción paradójica le impone un cambio de conducta. La conducta sintomática ya no es espontanea; al someterse a la instrucción del terapeuta, el paciente sale fuera del marco de su juego sintomático, que hasta ese momento carecía de reglas para modificar sus reglas. (Watzlawick, Beavin y Jackson, 1985, p. 220) La paradoja terapéutica por medio de la prescripción del síntoma provoca que el síntoma, cuya naturaleza es ser espontaneo, se haga deliberadamente, en consecuencia si se hace la conducta sintomática, ésta deja de ser espontanea. Para poner un ejemplo se retoma el problema del insomnio. La intervención del terapeuta es que el paciente debe de acostarse y hacer todo lo posible por mantenerse despierto, con lo cual se prescribe lo que de hecho ya ha estado haciendo que es quedarse despierto, más cuando se hace de manera voluntaria algo que se considera espontaneo, se produce una paradoja, de manera que si el paciente obedece gana control sobre el síntoma, y si no sigue la prescripción entonces se elimina el síntoma, es decir, se queda dormido. El uso de la instrucción paradójica en el contexto clínico puede dar lugar a un doble vínculo terapéutico. Dado que la terapia está compuesta por un sistema interaccional de dos miembros, o más, en la que el terapeuta ordena en un nivel que el paciente haga lo que quiere cambiar, y en otro nivel se afirma que esa orden sirve para cambiar, se crea un conflicto entre ambos niveles y con ello una paradoja. Además, se le cancela al paciente la posibilidad de escapar del marco paradójico. Si el paciente obedece la orden, la conducta indeseable ya no es involuntaria ni está completamente fuera de su control, aun cuando el síntoma aumente, pues eso significa que ahora tiene algo de control sobre él, y el problema deja de ser tratado como incambiable; más si el paciente desobedece la orden, es decir, dejar de hacer el síntoma, se logra eliminarlo. El terapeuta pone al paciente en una ilusión de alternativas en la que cambia la conducta sintomática haga lo que haga. Los miembros del BTC sostienen la efectividad de la técnica de prescribir el síntoma para tratar una gran variedad de casos: fisiológicos (enuresis, dolores psicógenos, problemas alimentarios, insomnio); sexuales (impotencia; anorgasmia, eyaculación precoz, frigidez); conductuales (compulsiones, temblores y tics); también problemas de inhibición social ( miedo a 211 hablar en público, a hablar a personas del sexo opuesto y a cometer errores, y ansiedad); e incluso controlar el comportamiento desviado característico de pacientes diagnosticados con paranoia y esquizofrenia (Fisch, Weakland y Segal; Watzlawick, Beavin y Jackson, 1985; Watzlawick, Weakland y Fisch, 1994). De este modo el terapeuta introduce desde afuera del sistema interaccional la metarregla para modificar la regla de la interacción, con lo cual cancela la posibilidad de repetir los intentos de solución por parte del paciente, pertenecientes al cambio 1, y permite al sistema pasar al cambio 2. A partir de la nueva regla se redefine la relación y se cambia la pauta interaccional. El uso del lenguaje paradójico no sólo una técnica en el modelo del BTC, sino que constituye la base de su comunicación terapéutica. Por lo cual el terapeuta indica contantemente al paciente durante el desarrollo del tratamiento que “vaya despacio” con los cambios, e insiste sobre las desventajas que traería una mejora; al mismo tiempo que muestra desconfianza y escepticismo constante sobre la capacidad del paciente de mejorar. Dicha instrucción es paradójica porque obliga a aquellos pacientes que avanzan lento y que esperan una solución del terapeuta participar más en el proceso clínico, y aceptaran con mayor facilidad las tareas que éste indique. Por otro lado a los pacientes que se esfuerzan demasiado por el cambio los obliga a disminuir su intento de solución y con ello a reducir sus síntomas; y además que ambos pacientes se esforzaran por contradecir el escepticismo del terapeuta mejorando (Fisch, Weakland y Segal; 1994; Watzlawick, Beavin y Jackson, 1985; Watzlawick, Weakland y Fisch, 1994). En el mismo tono, para mantener e incrementar los cambios iniciados por la prescripción del síntoma, los miembros del BTC vuelven a hacer uso de la instrucción paradójica por medio de una técnica llamada “prescripción de una recaída”, la cual consististe en indicar al paciente que a pesar de haber disminuido su síntoma, eso no significa la remisión total de éste, sino más bien que de manera segura próximamente sufrirá una recaída, por lo cual debe provocarla para conocer mejor su problema. Esta intervención es mandato para forzar la espontaneidad del síntoma, de modo que si tiene una recaída antes de la próxima sesión el paciente gana control sobre su síntoma, y si no tiene recaída alguna, entonces el paciente siente que puede eliminar sus síntoma al dejar de ser espontaneo. La conformación del lenguaje interaccional para la explicación de la formación, mantenimiento y resolución de los problemas humanos provee al modelo clínico del BTC identidad teórica e inicia la tradición de las terapias sistémicas. 212 Conclusiones Desde Aristóteles la metáfora ha sido leitmotiv de análisis filosófico, sin embargo, como otros tantos temas estudiados por él, la interpretación de la definición que le otorgo el Estagirita permaneció incuestionada e inalterada durante muchos siglos en la tradición del pensamiento Occidental. Salvo algunas excepciones como Nietzsche, Pascal, y los escritores pertenecientes al romanticismo, la metáfora fue considerada por retóricos y filósofos como un tropo dependiente del lenguaje literal; que puede ser reemplazado por un símil; cuya función es exclusivamente retórica y estética, razones por las que carece de valor cognitivo y de relevancia epistémica. Fue durante la segunda mitad del siglo XX que la discusión filosófica sobre la metáfora fue reinaugurada gracias a Max Black, quien polemizó el reduccionismo teórico con el que había sido conceptualizada. Black (1954; 1977) propuso la teoría semántica e interaccionista de la metáfora para explicar el significado metafórico, el cual es resultado de la interacción entre dos asuntos de la frase metafórica, el primario y el secundario, ambos compuestos por un sistema de ideas asociadas; el asunto secundario proyecta sobre el asunto primario un complejo implicativo, del cual se seleccionan algunas analogías que se usan para predicar al primer asunto por medio de oraciones isomoficas. A través de éstas oraciones se extiende el significado del asunto primario, y se organiza la intelección del mismo. A partir del análisis funcional de la metáfora, Black sostiene que el significado metafórico es autónomo de los significados literales que la componen, lo cual le otorga valor cognitivo propio. La introducción de la metáfora en la agenda de la filosofía por Black, fue continuada por Mary Hesse, filosofa de la ciencia que discute la teoría interaccionista para precisar los compromisos y funciones que cumple la metáfora en la ciencia. Hesse (1966) identifica al asunto principal con el explanandum, mientras considera que el asunto secundario está integrado por el lenguaje teórico u observacional de una teoría mejor conocida; ambos asuntos son sistemas compuestos por creencias compartidas por una comunidad lingüística. Por medio de la metáfora se usa el sistema de creencias e implicaciones del sistema secundario y se traslada para describir al explanandum; de tal modo que se promueve el reconocimiento de nuevas implicaciones que permitan la redescripción del explanandum al ser organizado por el lenguaje del sistema secundario por la selección, supresión y énfasis de algunas de sus características. 213 La explicación del funcionamiento de la metáfora por medio de la teoría interaccionista también posibilita la descripción del funcionamiento de los modelos teóricos de la ciencia. Para Max Black (1962) y Mary Hesse (1966) los modelos teóricos son metáforas sostenidas o extendidas ya que metáfora y modelo comparten los mismos elementos formales. Los modelos están formados por dos dominios, un dominio primario integrado por un agregado de enunciados observacionales que se quieren explicar, y un dominio secundario compuesto por los enunciados de una teoría mejor conocida y organizada; el modelo traslada los enunciados característicos del dominio secundario al dominio primario para establecer un conjunto de analogías entre ellos. Los modelos son metáfora sostenidas ya que ambos procesos requieren de la transferencia de lenguaje analógico entre dos dominios que comparten una estructura isomorfica, con el fin de conocer al asunto primario, solo que en el modelo la postulación de las analogías es sistemática. Si bien las metáforas y los modelos funcionan por medio de la creación de un sistema de analogías, ninguno de ellos es reducible a la analogía ya que ambos posibilitan el establecimiento de nuevas comparaciones entre dos sistemas semánticos. De acuerdo con Black (1977) y Hesse (1988) la diferencia entre la analogía y la metáfora es que mientras la primera se restringe al reconocimiento de una semejanza entre dos cosas, las metáforas no se agotan en la enumeración de una serie de analogías, sino que posibilitan la creación y descubrimiento de nuevas semejanzas entre los asuntos que la componen. La naturaleza de la analogía es cerrada por la clausura semántica que la limita, mientras la de la metáfora es abierta, por lo cual tiene una capacidad creativa que garantiza su valor cognitivo al ser irreductible e intraducible a un símil. Por lo cual la metáfora sirve como instrumento cognitivo que ayuda a penetrar intelectualmente en el dominio primario, al participar en la creación y percepción de las analogías que la misma metáfora ayuda a construir. En ese sentido la metáfora como intuición intelectual, para usar la feliz expresión de Kant, lejos de ser un espacio de vaguedad e indeterminación, es un escenario privilegiado de apertura semántica que, al inaugurar nuevas implicaciones y asociaciones entre dos asuntos, faculta la innovación conceptual. La metáfora renueva los vínculos con el referente de manera permanente, por lo que funciona como un vaso comunicante entre la realidad y la posibilidad en un momento de tensión semántica que permite explicar al mundo con nuevos términos e inaugurar nuevas relaciones, a través de las cuales se logra una clase de acceso epistémico único para conocer aquello que se desea comprender. 214 Del mismo modo el modelo opera por la trasferencia del lenguaje analógico. Hesse (1966) identifica tres tipos de analogías en los modelos: las negativas, las positivas y las neutras. El modelo funciona al construir correspondencias uno-a-uno entre las propiedades del dominio primario y del secundario por medio de las analogías positivas y neutras. Como resultado de este proceso no solo se trasladan las analogías entre las propiedades de los dominios, sino que también se proyecta la estructura relacional y causal del dominio secundario sobre el dominio primario. Por ello para Hesse las analogías neutrales por un lado permiten realizar predicciones sobre las relaciones entre las entidades que proyecta, y con ello sobre la dinámica de funcionamiento del dominio primario; y por otro facultan la postulación de hipótesis y entidades explicativas plausibles para explicar dominio que se desea conocer. Lo cual además de garantizar la relevancia cognitiva de los modelos les da valor creativo. Hesse (1966) agrega que la postulación de las hipótesis y entidades teóricas por medio de las metáforas y los modelos no garantiza su introducción inmediata en la teoría, el valor explicativo de éstas reside en la capacidad que tengan para realizar predicciones empíricas exitosas, lo cual le da plausibilidad a las entidades postuladas y preserva la objetividad de la actividad científica. A partir de su análisis sobre la metáfora Hesse (1966) propone que la dinámica de la explicación científica consiste en la redescripción del explanandum, es decir, del dominio que se quiere explicar. Lo cual implica que la descripción de la base empírica no es invariable a los cambios de la teoría, como pretende el modelo nomológico-deductivo de la explicación científica, sino que más bien se modifica en función de los cambios en la teoría que la describe, por lo que Hesse concluye que todo lenguaje observacional tiene un origen metafórico. Ahora bien, ya que todo enunciado que es considerado literal tiene como antecedente una expresión metafórica, para Hesse (1988) todo el lenguaje es metafórico, dado que el proceso de asignación y cambio en los significados de los predicados debido a la redescripción metafórica es continuo, todo el lenguaje tiene un origen metafórico. De modo que la distinción entre lenguaje literal y lenguaje metafórico en el lenguaje natural es pragmática; de manera análoga la división entre enunciados observacionales, básicos, atómicos o protocolares y enunciados teóricos es de carácter pragmático. Es por ello que las categorías normativas de una teoría tienen para Hesse un significado relativamente estable establecido por acuerdo intersubjetivo. 215 Como advierte Sampieri (2014) dado que el lenguaje científico tiene un origen metafórico la relación entre el lenguaje y la realidad no es de isomorfia, por lo que Hesse no se compromete con la concepción esencialista y referencialista del lenguaje que caracteriza al positivismo lógico y a gran parte de la filosofía analítica, sino con un nominalismo epistemológico que conserva algunos compromisos empiristas por su exigencia de la contrastación de las hipótesis y de las entidades explicativas plausibles postuladas a través de las metáforas y los modelos. Por lo que sustenta un realismo moderado y falibilista que asegura la objetividad y límites del lenguaje científico de una disciplina. En suma, para Hesse (1966; 1988) la ciencia es un continuo proceso de redescripción del explanandum en el que el lenguaje va realizando ajustes por medio de la metáfora para la explicación del mundo. Es por ello que las teorías no son un conjunto de enunciados terminados y por lo tanto cerrados al cambio, sino más bien son un sistema de enunciados sujetos al cambio. Apoyados en el análisis filosófico de la metáfora y el reconocimiento de su participación en la creación de modelos teóricos, y en el enfoque historicista de la filosofía de la ciencia, metáfora y modelo se utilizaron como herramientas conceptuales para describir el surgimiento y desarrollo de un modelo científico, y así evidenciar su importancia en la evolución de una disciplina científica. Para ello se propuso una reconstrucción histórica y conceptual de un modelo en la psicología clínica conocido como el modelo del Brief Therapy Center; nuestra reconstrucción permite evidenciar las principales tradiciones científicas y filosóficas de las que es heredero: la cibernética, la teoría de la información, y la teoría de los tipos lógicos; y justificar el uso de los conceptos de éstas teorías en el modelo terapéutico del BTC. La reconstrucción del modelo clínico del BTC se inicia con el concepto de la información, el cual es usado como metáfora al tomarlo como asunto secundario para describir al asunto primario, la conducta, a través de sus conceptos asociados: mensaje, reporte y comando, y la codificación analógica y digital. Al mismo tiempo se usa como dominio modelo la teoría de la información de Shannon para trasladar el enunciado correspondiente al concepto de redundancia al dominio primario, el cual posibilita la postulación de una entidad explicativa plausible: la regla interaccional. El siguiente modelo toma como dominio secundario a la cibernética, desde el cual se proyecta su lenguaje teórico compuesto por los conceptos de feedback positivo y negativo, la causalidad circular, la homeostasis y la calibración para construir un sistema de correspondencias 216 uno-a-uno sobre el dominio primario: las relaciones humanas. Este modelo permite advertir como la redescripción del dominio primario no sólo consiste en la proyección de las categorías del dominio secundario al primario, sino también de los procesos, de modo que faculta la organización de las relaciones entre los elementos del dominio primario. El último modelo toma como dominio secundario a la teoría de los tipos lógicos, y como dominio primario a los dos modelos anteriores, tanto a la redescripción del explanandum, es decir, la conducta a partir de las categorías asociadas de la metáfora de la información, y la redescripción de las relaciones humanas como sistemas cibernéticos. El lenguaje de la teoría de los tipos lógicos compuesto por la jerarquización en niveles lógicos por medio de la división entre miembro y clase, y las paradojas resultantes al violar esa división se traslada para construir un sistema de correspondencias uno-a-uno y establecer un sistema de analogías sobre el dominio primario. Este modelo permite por un lado reparar en la participación y modificación mutua de dos modelos cuando se utilizan simultáneamente en un mismo referente, ya que organiza en niveles lógicos las categorías de los otros dos modelos, y por otro lado hace evidente que el valor de un modelo teórico reside en la riqueza de implicaciones y de entidades explicativas plausibles que se pueden postular por esté para conocer y explicar al dominio primario (Hesse, 1966). A través de este modelo se postularon entidades explicativas como la metacomunicación, el metamensaje, la metarregla, y las paradojas pragmática y la terapéutica. Las analogías y las entidades explicativas plausibles postuladas por medio de la metáfora de la información, y de los modelos de la cibernética y el de la teoría de los tipos lógicos conforman el sistema conceptual que compone al modelo comunicacional del MRI y al modelo clínico del BTC. A partir de nuestra propuesta se justifica teóricamente el uso de los conceptos de estas teorías, recogidos primero en las conferencias Macy por Gregory Bateson, y caracterizados por él y por su equipo para el estudio de la comunicación; y después sistematizados y enriquecidos por los miembros del MRI y del BTC para explicar la formación, mantenimiento y resolución de los problemas humanos. Al mismo tiempo por medio de esta reconstrucción conceptual se ejemplifica el funcionamiento de las metáforas y los modelos en la investigación científica, y con ello se legitima su participación en la construcción de conocimiento científico. Por lo cual la metáfora no sólo está presente en el contexto de descubrimiento por su función heurística, sino también en el contexto de justificación, ya que los conceptos producto del sistema de analogías y 217 correspondencias de las metáforas y los modelos no desaparecen progresivamente mientras el modelo se consolidaba, sino que ya que resultaron útiles se integraron de manera permanente a la explicación de la conducta. A partir de análisis de la participación de la metáfora en la ciencia se propuso un metamodelo que permite discutir la vigencia de los criterios de evaluación del positivismo lógico para calificar a una disciplina como científica, como la pretensión de isomorfismo entre lenguaje y realidad, la invariancia del significado de la descripción de la base empírica, la tajante división entre lenguaje teórico y lenguaje observacional, la primacía del contexto de justificación sobre el contexto de descubrimiento, y el desarrollo acumulativo de una disciplina científica. De tal manera la justificación de la psicología como disciplina científica puede comenzar a emanciparse de dichos criterios en base en una idea de ciencia que mantenga el compromiso con el empirismo sofisticado, basado en el nominalismo epistemológico y el perspectivismo. El reconocimiento de la parcialidad de cada modelo y la inconmensurabilidad que media entre estos puede dar lugar a una postura de pluralismo epistémico y metodológico en una disciplina científica. Es por estas razones que en el primer capítulo citamos a Borges, en la historia de la psicología clínica el desplazamiento, no remplazo ni sustitución, de la metáfora de la energía a la metáfora de la información significó una importante discontinuidad conceptual que permitió la postulación de un lenguaje científico que conforma al BTC; lenguaje que es inconmensurable en relación a las premisas conceptuales del psicoanálisis, y que inaugura el enfoque comunicacional, interaccional y sistémico del comportamiento, al iniciar la redescripción del comportamiento en general y del desviado en particular como fenómenos comunicacionales. A partir de este sistema conceptual se posibilita la explicación de los problemas humanos como problemas interaccionales y, lo más importante, faculta la intervención terapéutica eficaz para su breve resolución. Bosquejar un capítulo de esa historia es el fin de esta nota. 218 Referencias Bibliográficas Alegre, A. G. (2010). Estudio Introductorio. En Platón. Diálogos. (Tomo I). (pp. XVII-CXXXII) España: Gredos. Aristóteles. (1974). Poética. (Traducido por García, V.) España: Gredos. Aristóteles. (1990). Retórica. (Traducido por Racionero, Q.) España: Gredos. Bateson, G. (1935). Culture Contact and Schismogenesis. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 71-82). Northvale NJ: Jason Aronson Inc. Bateson, G. (1941). Experiments in Thinking about Observed Ethnological Material. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 83-97). Northvale NJ: Jason Aronson Inc. Bateson, G. (1942a). Social Planning and the Concept of Deutero-Learning. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 166-182). Northvale NJ: Jason Aronson Inc. Bateson, G. (1942b). Morale and National Character. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 98-115). Northvale NJ: Jason Aronson Inc. Bateson, G. (1944). Cultural Determinants of Personality. En Donaldson R. (Ed.). A sacred unity: further steps to an ecology of mind. (pp. 3-28). New York: HarperCollins Publishers. Bateson, G. (1949). Bali: The Value System of a Steady State. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 116-136). Northvale NJ: Jason Aronson Inc. Bateson, G. (1955a). A Theory of Play and Fantasy. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 183- 198). Northvale NJ: Jason Aronson Inc. Bateson, G. (1955b). Epidemiology of a Schizophrenia. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 199-204). Northvale NJ: Jason Aronson Inc. 219 Bateson, G. (1958a). Naven: Epilogue 1958. En Donaldson R. (Ed.). A sacred unity: further steps to an ecology of mind. (pp. 49-68). New York: HarperCollins Publishers. Bateson, G. (1958b). Language and Psychotherapy –Frieda Fromm-Reichmann’s Last Project. En. Donaldson R. (Ed.). A sacred unity: further steps to an ecology of mind. (pp. 245- 251). New York: HarperCollins Publishers. Bateson, G. (1958c). The New Conceptual Frames for Behavioral Research. En. Donaldson R. (Ed.). A sacred unity: further steps to an ecology of mind. (pp. 93-110). New York: HarperCollins Publishers. Bateson, G. (1959). Cultural Problems Posed by a Study of Schizophrenic Process. En. Donaldson R. (Ed.). A sacred unity: further steps to an ecology of mind. (pp.111-125). New York: HarperCollins Publishers. Bateson, G. (1960). The group dynamics of schizophrenia. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 233-248). Northvale NJ: Jason Aronson Inc. Bateson, G. (1961). The Biosocial Integration of Behavior in the Schizophrenic Family. En Nathan W. Ackerman, Frances L. Beatman, y Sanford N. Sherman (Eds.). Exploring the Base for Family Therapy. (pp. 116-122). New York: Family Service Association. Bateson, G. (1966). Problems in Cetacean and Other Mammalian Communication. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 369-383). Northvale NJ: Jason Aronson Inc. Bateson, G. (1968a). Redundancy and Coding. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 419- 433). Northvale NJ: Jason Aronson Inc. Bateson, G. (1968b). Effects of Conscious Purpose on Human Adaptation. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 447-454). Northvale NJ: Jason Aronson Inc. Bateson, G. (1968c). Conscious Purpose versus Nature. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 434-446). Northvale NJ: Jason Aronson Inc. 220 Bateson, G. (1970a). Form, Substance, and Difference. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 455-471). Northvale NJ: Jason Aronson Inc. Bateson, G. (1970b). The Message of Reinforcement. En Donaldson R. (Ed.). A sacred unity: further steps to an ecology of mind. (pp. 245-251). New York: HarperCollins Publishers. Bateson, G. (1971a). The Cybernetics of “Self”: A Theory of Alcoholism. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 315-344). Northvale NJ: Jason Aronson Inc. Bateson, G. (1971b). Communication. En Mokros, H. B (Ed). Interaction & Identity. (pp. 45- 70). New Jersey: Transaction Publishers. Bateson, G. (1971c). From Versailles to Cybernetics. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 475-483). Northvale NJ: Jason Aronson Inc. Bateson, G. (1971d). Style, Grace, and Information in Primitive Art. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 137-161). Northvale NJ: Jason Aronson Inc. Bateson, G. (1971e). The Logical Categories of Learning and Communication. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp.284-314). Northvale NJ: Jason Aronson Inc. Bateson, G. (1971f). Pathologies of Epistemology. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 484- 493). Northvale NJ: Jason Aronson Inc. Bateson, G. (1971g). Double Bind, 1969. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 276-283). Northvale NJ: Jason Aronson Inc. Bateson, G. (1971h). Ecology and Flexibility in Urban Civilization. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 499-511). Northvale NJ: Jason Aronson Inc. Bateson, G. (1971i). Introduction. The Science of Mind and Order. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 1-11). Northvale NJ: Jason Aronson Inc. 221 Bateson, G. (1971j). Foreword. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. XI-XIV). Northvale NJ: Jason Aronson Inc. Bateson, G. (1972). Comment on Part II. En Bateson, G. Steps to an ecology of mind: Collected Essays in Anthropology, Psychiatry, Evolution, and Epistemology. (pp. 162-164). Northvale NJ: Jason Aronson Inc. Bateson, G. (1973). Mind/Environment. En. Donaldson R. (Ed.). A sacred unity: further steps to an ecology of mind. (pp. 161-173). New York: HarperCollins Publishers. Bateson, G. (1976). Foreword. A formal approach to explicit, implicit, and embodied ideas and to their forms of interaction. En C. Sluzki & D. Ransom (Eds). Double bind: The foundation of the communicational approach to the family. (pp. XI-XIV) New York: Grune & Stratton. Bateson, G. (1978). The Bird of a Matrix, or Double Bind and Epistemology. En. Donaldson R. (Ed.). A sacred unity: further steps to an ecology of mind. (pp. 191-213). New York: HarperCollins Publishers. Bateson, G. & M. C. Bateson. (1988). Neither Supernatural nor Mechanical. En Bateson, G y Bateson M. C. Angels Fear: Towards an Epistemology of the Sacred. (pp. 50-64). New York: Bantam. Bateson, G., Jackson D., Haley J. & Weakland J. (1956). Toward a Theory of Schizophrenia. Behavioral Science. 1 (4), 251–264. Bateson, G., Jackson D., Haley, J. & Weakland, J. (1963). A Note on the Double Bind (1962). En Sluzki, C. y Ransom, C. Double Bind: The Foundation of Communicational Approach to the Family. (pp. 39-42) New York: Grune & Stratton. Bateson, G., Weakland, J., & Haley, J. (1976). Comments on Haley’s History. In C. Sluzki & D. Ransom (Eds.). Double Bind: The foundation of the communicational approach to the family, (pp. 105-110). New York: Grune & Stratton. Bateson, M. C. (1988). Como nació Angels Fear. En Y. Winkin (Comp.). Bateson. Primer inventario de una herencia. (pp. 23-36). Argentina: Nueva visión. Bateson, M. C. (2004). Como yo los veía: Margaret Mead y Gregory Bateson recordados por su hija. Barcelona: Gedisa. Berger, M. M. (1993). Más allá del doble vinculo. Barcelona: Paidós Ibérica. 222 Beristáin, H. (2010). Diccionario de Retórica y Poética. México: Porrúa. Berman, M. (1987). El Reencantamiento del Mundo. Santiago de Chile: Cuatro Vientos. Black, M. (1954). Metaphor. Proceedings of the Aristotelian Society. 55 (1), 273- 294. Black, M. (1962). Models and Metaphors: Studies in Language and Philosophy. Ithaca, NY: Cornell University Press. Black, M. (1977). More about metaphors. Dialectica. 31, 431-457. Black, M. (1979). How Metaphors Work: A Reply to Donald Davidson. Critical Inquiry. 6 (1), 131-143. Blasco, J. L. (1998). El Positivismo Lógico. En J. Gracia. (Ed). Concepciones de la metafísica. (pp. 293-309). Madrid: Trotta. Bodin, A. (1981). The interaccional View: Family Therapy Approaches of the Mental Research Institute. En A. S. Gurman y D. P. Kniskern (Eds). Handbook of Family Therapy. Vol 1. New York: Brunner/Mazel. Boorstin, D. (1986). Los Descubridores. Barcelona: Crítica. Brand, S. (1976). For God´s Sake, Margaret: Conversation with Gregory Bateson and Margaret Mead. CoEvolution Quarterly. 10, 32-44. Bustos, E. de (2000). La metáfora: Ensayos Transdisciplinares. Madrid: FCE- UNED. Conesa F., & Nubiola, J. (1999). Filosofía del Lenguaje. Barcelona: Herder. Corona, R. H. (2008). La metáfora y los modelos en la psicología clínica. (Tesis para obtener el Doctorado en humanidades, línea Historia y Filosofía de la Ciencia). Universidad Autónoma Metropolitana-Iztapalapa, México. Davidson, D. (1978). What Metaphors Mean. Critical Inquiry. 15(1), 31-47. Descartes, R. (2014). Obras completas. (Tomo 1). España: Gredos. Di Stefano, M. (Coord.). (2006). Metáforas en uso. Buenos Aires: Biblós. Díez, J. A., & Moulines, U. (1997). Fundamentos de Filosofía de la Ciencia. Barcelona: Ariel. Draaisma, D. (2000). Metaphors of Memory. A story of ideas about the mind. Cambridge: Cambridge University Press. Dummet, M. (1981). Frege: Philosophy of Language. London: Duckworth. Dupuy, J-P. (2009). On the Origins of Cognitive Sciences: The Mechanization of the Mind. Cambridge: MIT Press. Echeverría, J. (1995). Filosofía de la Ciencia. Madrid: Akal. 223 Erickson, M., Haley, J., & Weakland, J. (1959). A transcript of a trance induction with commentary. En M. H. Erickson, & E. Rossi (Eds). The Collected Papers of Milton H. Erickson on Hypnosis: Volume I. The nature of hypnosis and suggestions. Nueva York: Irvington. Fisch, R., Weakland, J. H. & Segal, L. (1984). La táctica del cambio. Barcelona: Herder. Freud, S. (1996). Proyecto de Psicología (1950[1895]). En Freud, S. Obras Completas. (Volumen 1 (1886-1899). Publicaciones prepsicoanalíticas y manuscritos inéditos en vida de Freud). (pp. 323-463). Argentina: Amorrortu. Garza, C. B. (1998). Metáfora. México: UNAM. Govener, M. R. (2006). Lessons on being: implications of the Bateson Research project. (Tesis doctoral para obtener el grado de Doctor of Philosophy in the Department of Educational Leadership and Counseling (Marriage and Family Therapy)). Universidad de Louisiana, Monroe, LA. Haley, J. (1963). Estrategies in Psichotherapy. New York: Grune & Stratton. Haley, J. (1976). Development of a theory: A history of a research project. En C. Sluzki & D. Ransom (Eds.). Double bind: The foundation of the communicational approach to the family. (pp. 59-105). New York: Grune & Stratton. Harries-Jones, P. (1995). A Recursive Vision: Ecological Understanding and Gregory Bateson. Toronto: University of Toronto Press. Heims, S. J. (1975). Encounter of behavioral sciences with new machine-organism analogies in the 1940's. Journal of the History of the Behavioral Sciences. 11, 368–373. doi: 10.1002/1520-6696(197510)11:4<368::AID-JHBS2300110407>3.0.CO;2-L Heims, S. J. (1977). Gregory Bateson and the mathematicians: from interdisciplinary interaction to societal functions. Journal of the History of the Behavioral Science. 13 (2), 141-159. doi: 10.1002/1520-6696(197704)13:2<141::AID-JHBS2300130205>3.0.CO;2-G Heims, S. J. (1991). Constructing a Social Science for Postwar America. The Cybernetics Group, 1946-1953. Cambridge, MA: The MIT Press. Hesse, M. B. (1966). Models and Analogies in Science. Indiana: University of Notre Dame Press. Hesse, M. B. (1988). The cognitive claims of the metaphor. The Journal of Speculative Philosophy, New Series.2 (1), 1-16. Holton, G. (2001). Ciencia y Anticiencia. España: Nivola. 224 Jackson, D. D. (1957). The question of family homeostasis. The Psychiatric Quarterly Supplement. 31 (1), 79-90. Jackson, D. D. (1965ba). The Study of the Family. Family Process. 4, 1–20. Jackson, D. D. (1965b). Family Rules: The Marital Quid Pro Quo. Archives of General Psychiatry. 12, 589-594. Jackson, D. D. (2010). The Myth of Normality (1967). Journal of Systemic Therapies. 29 (2), 74-79. Keeney, B. (1991). Estética del cambio. Barcelona: Paidós. Kline, R. R. (2015). The Cybernetic Moment. Or Why We Call Our Age The Information Age. Baltimore: Johns Hopkins University Press. Koyré. A. (1984). Estudios de Historia del Pensamiento Científico. México: Siglo veintiuno Editores. Lakoff, G., & Johnson, M. (2009). Metáforas de la vida cotidiana. Madrid: Cátedra. Leary, D. (1990). (Ed.). Metaphors in the story of psychology. Cambridge: Cambridge University Press. Leeds-Hurwitz, W. (1988). La búsqueda de estructuras: Gregory Bateson y la Historia Natural de una Entrevista. En Y. Winkin (comp.). Bateson. Primer inventario de una herencia. (pp. 57-66). Argentina: Nueva Visión. Lipset, D. (1991). Gregory Bateson. El legado de un hombre de ciencia. México: FCE. Montagnini, L. (2007). Looking for “scientific” social science. The Macy Conferences on Cybernetics in Bateson’s itinerary. Kybernetes. The international journal of cybernetics, systems and management sciences, 36(7/8), 1012-1021, doi: 10.1108/03684920710777522 Nachmanovitch, S. (2009). This is Play. New Literary History. 40(1): 1-24. doi: 10.1353/nlh.0.0074. Nardone, G. & Watzlawick, P. (1992). El arte del cambio. Barcelona: Herder. Nietzsche, F., & Vaihinger, H. (1996). Sobre Verdad y Mentira en Sentido Extramoral. España: Tecnos. Pakman M. (Ed.). (2006). Las semillas de la cibernética. Obras escogidas de Heinz von Foerster. Barcelona: Gedisa. 225 Palma, H. (2005). El desarrollo de las ciencias a través de metáforas. Un programa de investigación en estudios sobre la ciencia, CTS-Revista Iberoamericana de Ciencia, Tecnología y Sociedad, 2 (6), 45-65. Pérez-Ransanz, A. R. (1999). Kuhn y el cambio científico. México: FCE. Pias, C. (2005). Analog, digital, and the cybernetic illusion. Kybernetes. 34 (3/4), 543 – 550. Popper, K. R. (1983). Conjeturas y Refutaciones. Barcelona: Paidós. Pribram, K. H. (1990). From metaphors to models: the use of analogy in neuropsychology. En D. E. Leary (Ed.). Metaphors in the history of psychology. (pp. 79-103). Cambridge: Cambridge University Press. Price, D. H. (1998). Gregory Bateson and the OSS: World War II and Bateson’s Assessment of Applied Anthropology. Human Organization. 57 (4), 379-384. Quintiliano, M. F. (1999). Institución Oratoria. (Traducido por Rodríguez, I. y Sandier, P.). México: Conaculta. Ray, W. (2004). Interaction Focused Therapy The Don Jackson Legacy. Brief Strategic and Systemic Therapy European Review. 1, 36-45. Richards, I. A. (1965). The Philosophy of Rhetoric. New York: Oxford University Press. Rivara, G. (2006). La Tiniebla de la Razón. La filosofía de María Zambrano. México: Itaca. Rosenblueth, A. (1955). La psicología y la cibernética. En Rosenblueth, A. Obra completa. (Vol. VIII Obra Filosófica. Artículos. Mente y Cerebro. El Método Científico). (pp. 33-47) México: El Colegio Nacional. Rosenblueth, A. & Wiener, N. (1945). The role of models in science. Philosophy of Science. 12 (4), 316-321. Doi: 10.1086/286874. Rosenblueth, A., Winer, N., & Bigelow, J. (1943). Behavior, Purpose and Teleology. Philosophy of Science. 10 (1), 18-24. Ruesch, J. & Bateson, G. (1951). Communication. The Social Matrix of Psychiatry. New York: W. W. Norton & Company, Inc. Sampieri, R. (2015). Ciencia y Metáfora, Una Perspectiva de la Filosofía de la Ciencia. Distrito Federal: UNAM. Schenk, H. G. (1983). El espíritu de los románticos europeos. México: FCE. Searle, J. R. (1979) Metaphor. En A. Ortony (Ed.). Metaphor and Thought. (pp. 83-111). Cambridge: Cambridge University Press. 226 Sluzki, C. E. & Ransom, D. C. (Eds.). (1976). Double bind: The foundation of the communicational approach to the family. New York: Grune & Stratton. Turbayne, C. M. (1970). El Mito de la Metáfora. México: FCE. Umpleby, S. A. (2003). Heinz von Foerster and the Mansfield Amendment. Cybernetics and Human Knowing. 10(3-4), 161-163. Umpleby, S. A. (Junio, 2015). Cybernetics: A General Theory that Includes Command and Control. En S. Alberts (Presidencia), C2, Cyber, and Trust. Simposio llevado a cabo en el 20th International Command and Control Research and Technology Symposium (ICCRTS). Annapolis, Maryland. Urban, W. M. (1952). Lenguaje y Realidad. La Filosofía del Lenguaje y Los Principios del Simbolismo. México: FCE. Vargas, P. (2004). Antecedentes de la terapia sistémica. Una aproximación a su tradición de investigación científica. En Eguiluz, L. (Ed.) Terapia Familiar. Su uso hoy en día. (pp. 1- 27) Distrito Federal: Pax México. Vargas, P. (2007). La Visión Orientada a los Sistemas de Interacción. El Centro de Terapia Breve del MRI. En M. García-Méndez (Ed.). Estrategias de evaluación e intervención psicológica. (pp. 27-62). México: Porrúa-UNAM. Vargas, P. (2011). Propuesta para un Recuento de La Historiografía de la Ciencia. Revista Electrónica de Psicología de la FES Zaragoza-UNAM. 1(1), 21-50. Velasco, A. (2000). Heurística y progreso de las tradiciones en las ciencias y las humanidades. En A. Velasco (Coord.) El concepto de Heurística en las ciencias y las humanidades. (pp. 222-238). México: Siglo XXI. Watzlawick, P. (1988). A propósito de Gregory Bateson. En Y. Winkin (comp.) (1991). Bateson. Primer inventario de una herencia. (pp. 37-46). Argentina: Nueva Visión. Watzlawick, P. (1992). La coleta del barón de Münchhausen. Barcelona: Herder. Watzlawick, P. (2001). ¿Es real la realidad? Confusión, desinformación comunicación. Barcelona: Herder. Watzlawick, P., Beavin, J., & Jackson D. (1985). Teoría de la comunicación humana: Interacciones, paradojas y patologías. Barcelona: Herder. Watzlawick, P., Weakland, J. & Fisch R. (1994). Cambio. Formación y solución de problemas humanos. Barcelona: Herder. 227 Weakland, J. (1960). The “Double Bind” Hypothesis of Schizophrenia and Three-Party Interaction. En C. Sluzki & D. Ransom (Eds.). Double bind: The foundation of the communicational approach to the family. (pp. 23-37). New York: Grune & Stratton. Weakland, J. H., Fisch, R., Watzlawick, P., & Bodin, A. M. (1974), Brief Therapy: Focused Problem Resolution. Family Process. 13, 141–168. Wiener, N. (1989). The Human Use of Human Beings. London: Free Association Books. Wiener, N. (1998). Cibernética o el control y la comunicación en animales y maquinas. España: Tusquets. Wilder, C. (1978), From the Interactional View—A Conversation with Paul Watzlawick. Journal of Communication. 28: 35–45. doi: 10.1111/j.1460-2466.1978.tb01654.x Wilder, C. (1979). The Palo Alto Group: Difficulties and directions of the interaccional view for human communication research. Human Comunicaction Research. 5 (2), 171-186. doi: 10.1111/j.1468-2958.1979.tb00632.x Winkin, Y. (1982). Una Universidad invisible. En Y. Winkin. (Coord) La Nueva Comunicación. (pp. 27-106). Barcelona: Kairós. Wittezaele, J-J. & García, T. (1994). La escuela de Palo Alto. Historia y evolución de las ideas esenciales. Barcelona: Herder. Zeig, J. K., & Geary, B. B. (Ed) (2000). The Letters of Milton H. Erickson. Phoenix: Zeig, Tucker & Theisen 228 Notas 1 Resulta conveniente describir el contexto en el que se insertan las reflexiones de Aristóteles sobre la metáfora en general y sobre el lenguaje en particular. Bustos (2000) afirma al respecto que, “el problema esencial pre-aristotélico era si el lenguaje constituía un instrumento fiable para el conocimiento de la realidad, esto es, si el análisis lingüístico podía llevar al descubrimiento de la estructura íntima de lo existente” (p. 36). El problema era entonces descubrir la relación que había entre lenguaje y el mundo, era pues una pregunta de carácter ontológico. Había dos posiciones: los teóricos naturalistas y los convencionalistas. Los primero sostenían que el lenguaje es una vía directa a la realidad, mientras los segundos creían que los nombres se imponen por convención social a las cosas por lo que su análisis revela la historia de las palabras y no la naturaleza de las cosas. Aristóteles era un convencionalista, mientras que Platón era partidario del naturalismo. En concordancia con lo anterior Antonio Alegre Gorri (2010) reconoce que en la época sofistica había un gran debate sobre la contraposición entre phýsis y nómos, es decir, entre naturaleza y convención, en varias esferas de la vida griega como la moral, la justicia, las leyes, la religión, las costumbres, la cultura y, especialmente, el lenguaje. En esa época se preguntaban: “¿Qué cosas son por naturaleza y cuales son por convención?” (p. XCVI). Algunos como Hermógenes, discípulo de Sócrates, defendía la idea de que el significado de las palabras es por convención, pacto o hábito; otros como Crátilo sostenían un naturalismo lingüístico en el que los nombres son las cosas mismas. En los Diálogos de Platón se critican ambas posturas, de manera detallada en el Crátilo y en el Sofista, en este último se cuestiona, “¿Por qué las palabras significan lo que significan? ¿Qué es el significado?” (pp. XLIV-XLV), con lo cual se demuestra el interés por aclarar la naturaleza del lenguaje en Platón. Alegre agrega que este debate se debe a que los sofistas conocían la obra histórica de Heródoto, quien mostro a los griegos que existían otras sociedades con diferentes valores, costumbres e idiomas, por lo que se puso en duda la univocidad de las palabras y se pasó a relativizar al lenguaje y a las costumbres; por ejemplo la tesis de Protágoras del hombre como medida de las cosas (homo-mensura) es un ejemplo de cómo convencionalizo y relativizo la moral de Atenas. Es indudable que el debate sigue abierto y vigente sobre la naturaleza de las costumbres y del lenguaje, pues no se ha dado una respuesta definitiva a estas cuestiones. El debate entre los sofistas y la dupla Sócrates-Platón, además de ofrecer un campo de preguntas fecundas y un amplio horizonte de comprensión a Occidente, da la posibilidad de continuar ejercitando el diálogo y el pensamiento. En este sentido, Alfred Whitehead tenía razón al afirmar que toda la filosofía Occidental no eran más que notas al pie de página de la obra de Platón. 2 La palabra metáfora está compuesta por la palabra griega pherein que hace referencia al transporte. Meta- ferein significa llevar una cosa de un lugar a otro (Bustos, 2000). 3 El estudio de la retórica era muy importante para Aristóteles ya que es lo que permitía estructurar el dialogo en la democracia griega al hacer verosímiles los argumentos. Más allá de la idea baladí de que la retórica es usada para el engaño, para él resultaba indispensable aprender las reglas de la retórica para el uso adecuado de la palabra y así poder participar en la comunidad política. 4 Popper (1983) distingue por medio de su criterio de demarcación distingue entre ciencia y pseudociencia, esta última comprende los enunciados míticos y metafísicos. Estos son aquellos que no permiten la corroboración de su veracidad empíricamente; aunque pueden llegar en algún momento a ser ciencia cuando sean capaces de expresarse tal forma que permita su falsación. Dice que los, “mitos son susceptibles de desarrollo y pueden llegar a ser testeables; que, en un sentido histórico, todas –o casi todas-las teorías científicas se originan en mitos” (p. 63). Así la propuesta de Popper es a ser evolucionista y eliminativista de todo aquel conocimiento que no fuera científico. 5 El término romántico se utiliza para destacar por un lado la tradición de pensadores que tienden a afirmar la superioridad del sentimiento contra la razón, pues el romanticismo es principalmente una reacción contra el racionalismo ilustrado; por otro lado se utiliza para señalar que, “la suposición común de los románticos, que va en contra de la filosofía perennis, es que las respuestas a las grandes preguntas no son tanto descubiertas como inventadas. No son algo que se encuentra; son algo que, literalmente, se crea” (Isaiah Berlin citado en Schenk, 1983). La tesis del romanticismo de que el arte no es una actividad mimética sino creadora los lleva a la negación de una realidad objetiva y de cualquier posición esencialista del conocimiento, en favor de la idea del conocimiento como recreación de la realidad. 6 En el primer libro de su fascinante “Los descubridores”, el historiador americano Daniel J. Boorstin (1986), aclara el origen de la metáfora del universo como un reloj mecánico mientras describe el proceso por el cual 229 la humanidad paso de medir el tiempo por medio de los ciclos naturales, como el de la luna, al tiempo regido por el reloj, y como este mecanismo tuvo importantes consecuencias a nivel filosófico y teológico. Boorstin relata: Los filósofos estaban siempre buscando nuevos asideros en el universo –nuevos parecidos, nuevas metáforas, nuevas analogías. (…) El reloj mecánico, una vez puesto en marcha, parecía ir con vida propia. ¿No podía ser el universo un inmenso reloj construido y puesto en marcha por el Creador? (…) Un influyente divulgador científico, el obispo Nicole d’Oresme (1330?-1382), creó una metáfora inolvidable, la de un universo concebido por Dios, el relojero perfecto, como un mecanismo de relojería. (p. 80) Es interesante advertir que esta metáfora de origen teológico después inspiro a más de un científico para realizar su propio trabajo, por ejemplo el astrónomo Kepler (1571-1630) en 1605 decía: “Mi propósito es demostrar que la maquina celestial no debe ser comparada a un organismo divino sino a un mecanismo de relojería” (citado en Boorstin, 1986, p. 80). El físico Robert Boyle (1627-1691), fundador de la Royal Society de Londres, también sostenía dicha visión del mundo y, por supuesto, Descartes, funda su epistemología sobre la metáfora del reloj. ¿Es la metáfora metafísica de que el mundo es un reloj la que inaugura la modernidad? 7 Al parecer de Cirilo Flores Miguel, estudioso de Descartes, “la metáfora de la máquina sustituye a la metáfora del libro” (Descartes, 2014, p. XXIII) como orientadora del hombre para entender el conocimiento y su relación con el mundo, lo cual significa que se deja de leer al mundo, para describir cómo funciona postulando hipótesis que permitan explicar los hechos sin ocuparse de las causas de los mismos. Descartes al inaugurar la modernidad coloca al sujeto epistémico en el centro de la filosofía y le pone como tarea la descripción de la máquina, pero no de las razones ultimas. Su metáfora cambia el centro de interés del conocimiento del interior al exterior de sí mismo. 8 Cf. Echeverría (1995), especialmente el cap. II, donde discute y amplía la distinción de los contextos. 9 La posición epistemológica y ontológica perspectivista, nominalista y realista de Black (1977), coincide a nuestro juicio con la propuesta epistemológica de Gregory Bateson (véase infra 3.6) 10 Cf. Moulines y Díez (1997), especialmente el capítulo 7, para una explicación clara sobre este modelo. 11 Además de seguir las ideas Black y Wittgenstein, Hesse sigue las propuestas de la tradición hermenéutica, heredera de Nietzsche, de Gadamer y Paul Ricoeur; y el nominalismo de Nelson Goodman para el desarrollo de su propuesta. Todos ellos defendían la supremacía al lenguaje metafórico sobre el literal (Sampieri, 2014). 12 Como vimos antes Black (1977) acepta que el funcionamiento de la metáfora implica el reconocimiento continuo de analogías, pero que no se reduce a una enumeración de estas. De este modo la metáfora antecede a la comparación y faculta la creación de nuevas analogías. 13 Con base en el examen de la obra de Hesse, Sampieri (2014) señala que la plausibilidad de la referencia de una metáfora sé da cuándo se integra a un sistema teórico, para lo cual debe tener coherencia epistémica y ontológica con la teoría y para ello debe aceptar los compromisos de la misma. Al mismo tiempo, debe facultar la innovación conceptual por el reordenamiento y redescripción del explanandum desde otro explanans que lo permitirían ver de otra manera. La metáfora así entendida mantendría en tensión la tradición y la innovación -para usar la feliz expresión de Kuhn- por medio de la analogía, posibilitando su afianzamiento en una tradición de conocimiento y permitiendo la apertura conceptual para explicar cosas que de otro modo estarían ocultas. 14 Aunque Black (1954) en su primer ensayo sobre la metáfora señalaba que las oraciones completamente metafóricas serían consideradas como enigmas. 15 Además de esto, para determinar las condiciones de verdad del significado literal de una oración se requiere de un conjunto de suposiciones compartidas por los hablantes y que no forman parte del contenido semántico de la oración. Por lo que la aplicación del significado literal, según Searle (1979), no puede ser considerada como acontextual pues también involucra factores pragmáticos para asignar sus condiciones de verdad. 16 Black (1962) examina además a los modelos matemáticos utilizados generalmente en las ciencias sociales, los cuales son, a saber, la aplicación de herramientas matemáticas para el análisis de datos de carácter social. Advierte que son útiles para tener mayor precisión en el análisis de las relaciones entre las variables, pero que deben tomarse con mesura, pues debido a la simplificación que exige este proceso se puede llegar a confundir dicha precisión con la verificación empírica de las hipótesis. Los modelos matemáticos así entendidos no ofrecen explicaciones causales, como sí lo hacen los modelos teoréticos. 230 17 Hesse (1966) sostiene que todo modelo está basado en una analogía subyacente entre ambos dominios (Hesse, 1966). Al basar el funcionamiento de las metáforas y los modelos en el razonamiento analógico, Hesse los justifica racionalmente por ser parte de una inferencia inductiva valida. 18 En ese mismo año Warren McCulloch y Walter Pitts publican el artículo “A Logical Calculus of the Ideas Immanent in Nervous Activity.”, en el cual ofrecen una explicación matemática para entender como las neuronas funcionan para llegar a experimentar una idea. De acuerdo con Dupuy (2009) y Umpleby (2015) esta es la segunda publicación que marca el inicio la cibernética. 19 Kline (2015) agrega que además de la escuela americana de la teoría de la información representada por Wiener y Shannon, estaba la escuela inglesa liderada por los físicos Denis Gabor y Donald MacKay quienes tenían sus propias aproximaciones al concepto de información. 20 Por parte del gobierno británico fue enviado Alan Turing a Estados Unidos para supervisar y colaborar en dicho proyecto, en 1943 paso tiempo discutiendo con Shannon en los Bell Labs (Kline, 2015). 21 Se toma como referencia el título del libro de Heims (1991). 22 De acuerdo Heims (1977) debido a la ayuda de la ciencia para ganar la Segunda Guerra Mundial a EU, la ciencia gozaba de un gran prestigio y por lo tanto de apoyo financiero casi incondicional terminado el conflicto, lo cual propició el incremento de la investigación interdisciplinaria. 23 Este encuentro no careció de accidentes pues había diferencias teóricas importantes entre la teoría de la Gestalt y el grupo cibernético. Mientras Köhler representaba al grupo de la Gestalt el cual se caracterizaba por buscar explicaciones no-reduccionistas de los mecanismos de la percepción; McCulloch, Pitts y von Neumann, proponían una explicación del funcionamiento del cerebro basado en las analogías entre este y las maquinas digitales, y un modelo que usaba la codificación de información y la retroalimentación como base explicativa (Heims, 1975). 24 Heinz von Foerster nació en Viena, Austria en 1911, participo en el Círculo de Viena y estudio con entusiasmo el Tractatus Logico-Philosophicus de su pariente Ludwig Wittgenstein. Foerster relata que llegó a Nueva York después de la Segunda Guerra Mundial y enseguida se dirigió a Chicago para encontrarse con Warren McCulloch, quien estaba interesado en su teoría cuántica de la memoria. McCulloch lo invita a las conferencias Macy donde presento dicha teoría. Entonces el grupo lo hizo ser el secretario para que aprendiera rápidamente inglés. Él se convirtió en un importante miembro de las conferencias y un prominente teórico de la cibernética y el constructivismo (Wittezaele y García, 1994). 25 Pias (2005) nota que la distinción entre analógico y digital fue discutida durante las diez conferencias ya que no todos los participantes tenían claro en qué consistía, y tampoco había consenso en el modo en que cada investigador las usaba. Mientras que Wiener pensaba que la diferencia no era tan radical ya que se podían trasformar gradualmente las cantidades analógicas a las digitales; McCulloch y von Neumann insistían en privilegiar las cantidades digitales, por la precisión que les daba a sus trabajos en la explicación de la sinapsis de forma binaria y la construcción de máquinas computadoras respectivamente. 26 Richards participo en la octava reunión, como vimos fue él quien inicio la perspectiva interaccional de la metáfora. En su participación titulada “Communication Between Men: The Meaning of Language” hablo sobre el tipo de lenguaje que es necesario para hablar sobre el lenguaje (Dupuy, 2009). 27 Al parecer de Dupuy (2009), “what we call today cognitive science had its origins in the cybernetic movement” (p. 43). Pues, aunque no siempre es reconocido, el origen de las ciencias cognitivas están en el trabajo de Wiener, y el de McCulloch junto con Walter Pitts porque inician la mecanización de la mente. Ejemplo de lo anterior es el ensayo de Rosenblueth llamado “La Psicología y la Cibernética” en el que desarrolla una agenda de investigación para investigar la mente a partir de la mecanización de los procesos psicológicos, lo cual significa lo siguiente: “Llamo mecanizar a un proceso psicológico el construir una máquina que desarrolle comportamiento al que atribuiríamos un proceso psicológico sí fuese desarrollado por un hombre” (Rosenblueth, 1955, p. 39). Para Rosenblueth dado más no es posible conocer el estado interior de alguien que piensa, sólo se puede inferir estados mentales por medio de la observación de comportamiento; por lo cual la atribución de mentalidad se puede hacer por igual a las máquinas y a los hombres si muestran un comportamiento similar. Si se cumple con esta característica se puede atribuir mentalidad a las maquinas independientemente de su composición física. La mecanización de la mente permitiría generar hipótesis para el estudio de los mecanismos cerebrales de los procesos psicológicos. Pone como modelos de estas máquinas las que realizan cálculos matemáticos, y las que tienen memoria y muestran aprendizaje, como la presentada por Shannon en la conferencia Macy de 1951. 231 28 El Biological Laboratory Computer recibía sus fondos de Air Force Office of Scientific Research; pero en 1970 el Department of Defence (DOD), con el fin de calmar las protestas académicas por la Guerra contra Vietnam y las investigaciones militares hechas en los campus universitarios, autorizo financiar sólo las investigaciones en ciencia básica que tuvieran utilidad en las misiones militares. Foerster respondió ante el DOD que las investigaciones desarrolladas por el BLC no tenían relación ni utilidad para las actividades militares, por lo cual el DOD decidió no seguir financiando las investigaciones en cibernética hechas en el BLC. Curiosamente los investigadores en IA y en robótica ofrecieron al DOD robots de batalla y por ello fueron ampliamente financiados. Lo cual explica el amplio desarrollo de estos campos y la disminución de investigaciones en cibernética (Umpleby, 2003) 29 Tiempo después de instalarse en California von Foerster es invitado por Paul Watzlawick y John Weakland al Mental Research Institute, del cual hablaremos más adelante, a dictar una serie de conferencias sobre cibernética de segundo orden y constructivismo, teorías que influyeron a la terapia familiar. Las conferencias fueron recogidas en Pakman (2006). 30 Según cuenta Bateson el origen del término cismogénesis está en un artículo que leyó del matemático L. F. Richardson, en el cual estudiaba matemáticamente la carrera de armamentos. Richardson descubrió que la relación entre dos naciones en la que la respuesta de una nación lleva inmediatamente al avance de la otra lleva a una aceleración exponencial. Bateson vio las mismas relaciones acumulativas entre las interacciones de los Itamul (Brand, 1976). 31 Es necesario señalar que la fundación Macy organizo y subsidio más conferencias a parte de las mencionadas y descritas en el capítulo 2 de este trabajo, con temas y participantes diferentes. Bateson asistió a la conferencia de 1942, y a las que comprenden el periodo entre 1946 a 1953, las que tuvieron como objetivo la aplicación las nociones de retroalimentación, sistemas circulares e información a las ciencias biológicas y a las ciencias sociales. 32 Resulta interesante señalar el vínculo que tenía William James con el físico y filósofo Ernst Mach. De acuerdo con Gerald Holton (2001) James le tenía mucho respeto y admiración al físico e intercambiaron impresiones de sus obras durante muchos años. Mach, hay que recordarlo, insiste en la importancia entre discriminar el estudio de las impresiones sensibles y las oraciones metafísicas en la ciencia; distinción que estimula al Circulo de Viena para elaborar su proyecto epistémico-metodológico de la ciencia. Ejemplo de ello fue la relación entre Mach y el físico y biólogo Joques Loeb, quien fue maestro y asesor de John Watson, padre de psicología conductista basada en la epistemología positivista y empirista. 33 De acuerdo con Vargas (2004) la amistad de Bateson con Frank, la participación de este último en las conferencias Macy y su vínculo con la “Escuela de Chicago” (fuertemente influida por el pragmatismo de William James), sobre todo con Harry Stack Sullivan, es uno de los antecedentes conceptuales de las explicaciones interaccionales de la conducta en la terapia familiar sistémica. Heims (1991) afirma que Bateson reconocía el énfasis en la interacción interpersonal como una de las premisas teóricas de Sullivan en el psicoanálisis y la psiquiatría. Esto es patente en su libro escrito junto con Ruesch (1951) y en (Bateson, 1971b). 34 Zeig y Geary (2000) afirman que Bateson tuvo contacto con Erickson en 1940 por la correspondencia de Mead, sobre el trance de los balineses. Después Bateson mantuvo correspondencia con Mead y con Erickson durante la Segunda Guerra Mundial mientras investigaban la estructura de la personalidad de los japoneses y los alemanes. 35 De acuerdo con Mary Bateson (2004), la división entre aprendizaje y deuteroaprendizaje es una anticipación del tipo de explicación jerárquica que permiten la Teoría de los tipos lógicos. 36 Es posible notar similitudes entre el pensamiento abductivo y la metáfora, ambas buscan ser explicaciones plausibles a los fenómenos que se pretenden explicar. Aunque cada proceso cognitivo tiene sus especificidades. Por otro lado mientras la abducción ha sido estudiada desde la lógica formal desde Charles S. Pierce, la metáfora ha sido objeto de estudio de varios profesionales de diversos campos. 37 A diferencia de Wiener y Bateson, von Neumann pertenecía a la comunidad científica que participaba en el uso del conocimiento con fines militares, como demuestra su asesoría en el proyecto Manhattan y su intensa colaboración con el gobierno estadounidense durante la guerra fría (Kline, 2015) 38 Véase la nota 16. 39 Hay que tener presente que el trabajo de Wiener pertenecía al área de la matemática aplicada y la ingeniería, así que estaba familiarizado con el uso de las matemáticas de manera precisa. La variabilidad y 232 naturaleza que tienen los muestreos de las disciplinas sociales lo hacía desconfiar de matematizarlas. Por lo que no creía correcto modelar matemáticamente datos con tales inconsistencias (Winkin, 1982). 40 Bateson recordara años más tarde en una entrevista que el psicoanalista Lawrence Kubie había publicado un artículo en 1947 llamado "The fallacious use of quantitative concepts in dynamic psychology", en el que también criticaba al concepto de energía de la psicología dinámica (Brand, 1976) 41 Es notable que Bateson en su búsqueda de un marco teórico firme, haya publicado estudios (Naven en 1936 y Bali en 1942) donde privilegiaba la observación natural de las conductas, la interacción entre las personas y de cierto modo anticipado en los procesos circulares de causalidad. De modo que cuando conoció las ideas de Wiener ya estaba preparado para recibirlas (Montagnini, 2007) 42 Mientras Freud escribía el “Proyecto de psicología” en 1895, donde se comienza a esbozar el modelo psicoanalítico, dice: Dos ambiciones me atormentan: primero averiguar qué forma cobrará la teoría del funcionamiento psíquico si se introduce en ella un enfoque cuantitativo, una especie de economía de la energía nerviosa, y segundo, extraer de la psicopatología aquello que pueda ser útil para la psicología normal (Freud, 1996, p. 326) Es evidente que Freud empieza a introducir el concepto de energía en su teoría del dinamismo psíquico, bajo la sospecha de que de ese modo pude justificar un enfoque cuantitativo (cabe decir que Freud nunca especifico la medida de esa energía) en el estudio de la mente. En este escrito, del que Freud se desligo después, describe el funcionamiento psíquico tomando como base la interacción de tres tipos de neuronas ideales. A juicio de Corona (2008) este ensayo comienza a pasar de un modelo teórico existencial a un modelo teórico ficticio según la tipología de los modelos de Black (1962), porque pasa de un modelo explicativo biológico basado en el funcionamiento neuronal a un modelo que propone entidades especulativas como la energía: Si Freud al teorizar sobre una cantidad de energía que no se puede cuantificar, entra en la creación de un modelo ficticio y al proponer un tercer grupo de neuronas que van a dar lo que es la conciencia y la cualidad se adentra más a un modelo ficticio claro, sin dejar aún el modelo existencial al seguir aferrado al sistema neuronal (Corona, 2008, p. 38) Por lo tanto, Freud al percatarse de que el modelo biológico le es insuficiente para explicar los fenómenos psicopatológicos que le interesan decide proponer entidades ficticias basadas en la metáfora energética como la librado. 43 Braford Keeney (1991) va más lejos afirmando que además del psicoanálisis, el conductismo y el humanismo tienen como premisas epistemológicas la fuerza y la energía, por lo que no son verdaderamente alternativas teóricas a la noción materialista de la ciencia del siglo XIX. Como si lo puede ser la epistemología cibernética basada en la metáfora de la información como lo veremos más adelante. 44 Bateson reconoce a Lawrence Kubie por haber sido el primero en haber realizado la observación de la metáfora energética en el psicoanálisis y los problemas que tiene en un artículo de 1947 (véase Brand 1976). 45 Conviene reconocer que el proceso primario es una categoría del psicoanálisis introducida por Freud en 1985 dentro de su “Proyecto de Psicología” (1996); pero aquí Bateson le da una lectura diferente a la específicamente Freudiana para explicar la posibilidad de discriminar entre el mapa y el territorio. Hay que tener presente que en la época en que Bateson el psicoanálisis era una teoría con plena vigencia para la explicación de la psicopatología, de modo que en el desarrollo del razonamiento de Bateson se encuentran en ocasiones términos propios del psicoanálisis junto con las herramientas conceptuales de la cibernética, lo cual no resulta extraño cuando se examina históricamente la evolución de una propuesta teórica. Será hasta el modelo clínico del MRI donde la enfoque interaccional de la etiología de las enfermedades mentales adquiera mayor madurez y conforme un léxico propio que le provee de identidad e independencia conceptual. 46 Resulta oportuno señalar que el modo en cómo entiende Bateson la metáfora es diferente en cómo se postula en el primer capítulo de este trabajo. Para Bateson una metáfora se define de la siguiente manera: “A metaphor retains unchanged the relationship which it ‘illustrates’ while substituting other things or persons for the relata” (Bateson. 1971d, p. 149). Es decir, en la metáfora se sustituyen los objetos o personas, pero se mantienen las relaciones que corresponden a los objetos sustituidos. 233 47 En adelante tener presente que las citas que mencionen a uno de los miembros del equipo Bateson citado por Govener vienen de la serie de trascripciones y grabaciones de las reuniones del grupo entre 1955 y 1958 recogidas por Govener en su tesis doctoral. El equipo solía grabar sus discusiones teóricas y ahora están a cargo de Wendell Ray en el “Don D. Jackson Archive”, ubicado en la Universidad de Louisiana. 48 Bateson no veía con buenos ojos a la terapia debido a la idea de ejercer “poder” sobre el paciente al grado de afirmar: “the very idea of ‘curing’ must always propose the idea of power” (1976, p. XII) Por lo que cuando él daba terapia se limitaba jugar golf o a charlar con sus pacientes (Heims, 1991). 49 El análisis de las conversaciones que Govener (2006) realizó sobre las reuniones del equipo Bateson muestra que no había un acuerdo uniforme sobre las intervenciones de Erickson. Tanto Jackson como Bateson mostraban reservas sobre el carácter abiertamente manipulador de Erickson y señalaban el parecido de sus maniobras con las de la madre del esquizofrénico; mientras que Haley y Weakland defendían que Erickson lo hacía con el fin de ayudar al paciente. A pesar de las divergencias teóricas ninguno de ellos tenía dudas sobre la habilidad y creatividad de Erickson para ayudar a sus pacientes. 50 En el mismo sentido el humor es una forma en que el paciente se puede metacomunicar con su familia de manera segura. Y también les permite evitar definir las relaciones que tienen con los demás. De hecho para Bateson el humor era una forma de doble vínculo. Fry será quien desarrolle investigue el humor y el doble vinculo (Govener, 2006). 51 Véase la nota 46 para ver la definición de metáfora que sigue Bateson. 52 Bateson las llama metáforas rotuladas porque son identificadas como tal por medio del proceso secundario, a diferencia de las metáforas no rotuladas producto de las actividades del proceso primario como el arte, el sueño, la religión, la poesía y el ritual. Para Bateson (1971d) el discurso del proceso primario está cifrado en el lenguaje metafórico, pero este proceso al no tener negaciones, ni tiempo gramatical, ni algún signo que identifique su modo gramatical, carece del mensaje metacomunicativo que señale que son metáforas, por lo que la distinción entre el mapa y el territorio se suspende. 53 Véanse capítulos 3.3 y 3.6. 54 Bateson da cuenta de su experiencia en el grupo, y de su relación con Fromm-Richmann en Bateson (1958b). 55 En resumen Bateson (1971b) afirma que gran parte de la percepción y emisión de la comunicación es necesariamente inconsciente, por lo que mucho de lo que se expresa es por los canales no verbales, los cuales informan sobre el contenido del proceso primario, por lo que también resulta importante estudiar esos canales, como el tono de voz y los movimientos. Además, en general las personas esperan que sus mensajes sean comprendidos correctamente por su interlocutor, lo cual, por supuesto, nunca pasa, ya que un significado adquiere sentido por más de una Gestalt, cada una producto de múltiples puntuaciones de la experiencia, lo que da lugar a múltiples codificaciones del mensaje. Entre más amplia sea la Gestalt más cambiara el contexto de interpretación de un mensaje y más preciso es su significado para alguien más. Dado que las reglas de codificación son implícitas e inconscientes, y que estas cambian continuamente, se aprende continuamente a recibir mensajes, y también se aprende a aprender la codificación de los mensajes, por la estructura jerárquica del aprendizaje, por lo que se negocia constantemente la relación entre las personas. Cuando hay conflicto entre los contextos de aprendizaje puede dar lugar a disturbios en la comunicación, ya que si el contexto de aprendizaje conflictivo es repetido, una persona generaliza ese contexto a todos los escenarios y responde al mundo de acuerdo con él. Lo que puede explicar cómo los contextos de aprendizaje generados en la corriente comunicacional de las personas pueden desarrollar problemas comunicacionales, distorsionado la comunicación sistemáticamente. 56 Cfr. Jackson (1957). 57 Al respecto Weakland (1960) hizo notar que cuando hay un desacuerdo encubierto entre dos personas significativas para el paciente identificado, como entre el doctor y un enfermero, ellos mandan mensajes contradictorios de modo que el paciente recibe mensajes incongruentes y queda imposibilitado para responder porque demandan una doble respuesta, como pasa en su propio sistema familiar, cuando ambos padres expresan sus desacuerdos y hostilidades entre ellos de forma encubierta. En este artículo además realiza una relectura del doble vinculo de forma que el estudio de la interacción fuera tripartita, de manera que la pauta comunicacional incluyera al padre y la relación de este con la madre, y con el hijo. 234 58 Sin embargo Bateson (1960) reconoce los límites del modelo de la teoría de juegos: la diferencia entre los jugadores ideales y los miembros de una familia es que estos últimos aprenden por ensayo y error, mientras los autómatas de Neumann, cuya inteligencia es infinita, no comenten errores ni admiten aprendizaje alguno, por lo que nunca van a experimentar el dolor que los humanos sienten cada vez que hay disturbios en el aprendizaje como sucede en la experiencia del doble vínculo. 59 Bateson (1961) toma esta distinción del trabajo del biólogo alemán Horst Mittelstaedt, quien participo en las conferencias Macy. Para definir ambos conceptos utiliza el termostato que controla la temperatura de una casa: el feedback es un proceso correctivo que se desencadena cuando la temperatura de la casa sube o baja de acuerdo a cierta variable predeterminada, apagando o encendiendo la caldera respectivamente. Mientras la calibración permite modificar las variables del sistema y así modificar la habitual respuesta del mismo. Dado que la calibración permite modificar un hábito involucra un proceso de aprendizaje. Sin embargo, el mismo ejemplo del termostato Bateson lo usa en otro lugar (Bateson, 1958a) para describir los niveles de ordenes en un sistema, pero siguiendo la categorización de Ashby, quien usa el término “variable” para definir las medidas sobre las cuales oscila la temperatura de la casa; y “parámetro” para definir las características del sistema que son cambiadas cuando se cambian los valores del termostato. Se puede decir que el feedback es un proceso correctivo que oscila entre las variables, mientras la calibración modifica los parámetros del sistema. Ambas distinciones pretenden evidenciar que en los procesos correctivos de un sistema esta estructurados en tipos lógicos o niveles de orden. 60 Aunque ya desde 1952 en una carta que Bateson le manda a Wiener, se lee: “is it not conceivable that to pose a paradox to the machines might be therapeutic” (Heims, 1977, p. 150). Por lo que ya pensaba desde antes que la paradoja podía tener una función terapéutica. 61 Véanse Berger (1993) y Sluzki & Ransom (1976) para estudiar las distintas investigaciones con el fin de obtener datos experimentales sobre el doble vínculo. 62 Para Bateson (1971d) en cada mensaje hay una jerarquía en las redundancias que trasmite, de tal modo que la codificación analógica está en un grado más alto y engloba a la codificación digital. 63 Véase Bateson (1971e). 64 Desde finales de los sesenta y durante el resto de su vida, Bateson escribió distintos artículos donde expone los criterios del proceso mental variando el orden de su organización y agregando nuevos elementos como la recursividad. En lo que a este ensayo respecta, se toma como referencia la lista que expone en Bateson (1978) para la reconstrucción del primer periodo de formulación de la epistemología cibernética, aproximadamente de 1968 a 1972, por ser la que mejor recoge y sintetiza la argumentación llevada a lo largo de este capítulo. 65 Es conocida su diferencia sobre el tema del poder con Haley, quien consideraba –y consideró a lo largo de su carrera- que el poder era necesario en las relaciones familiares para establecer jerarquías en ella. Mientras que Bateson siempre pensó el poder en términos epistemológicos, por lo cual dijo: Haley slides too lightly over very real epistemological differences between himself and me. As I saw it, he believed in the validity of the metaphor of the “power” in human relationships. I believed –and today believe even more strongly-that myth of the power always corrupts because it proposed always a false (thought conventional) epistemology. I believed that all such metaphors derived from the pleroma and applied to creatura are antiheuristic. (Bateson en Bateson, Weakland y Haley, 1976, p. 106) Para el antropólogo usar el lenguaje del pleroma para explicar la creatura era un grave error, pues significaba querer explicar el mundo de la pauta y de la información, por medio de las ciencias duras, y con ello regresar a la epistemología materialista donde la mente y el cuerpo son entidades separadas. Pero para Haley la lucha por el control en una familia era necesario para su organización, ya que a su juicio, en las relaciones las personas luchan por ser quienes definir la clase de relación que tienen con el otro. Durante su carrera Haley siguió precisando el concepto de poder, afirmando que la relación entre el hipnotizador y el paciente, y entre el niño y la madre se pueden entender como luchas por el control (Haley, 1963). Por lo que la diferencia entre ambos nunca se pudo resolver. 66 Véase (Bateson, 1971h) 67 En este sentido Bateson estableció una clara relación entre los niveles de la consciencia y la estética, para él, la función del arte en la vida del hombre consiste en integrar las partes que componen a la mente: la consiente y la inconsciente. El arte, al facultar la integración psíquica del proceso primario y del proceso secundario, y realizar 235 enunciados sobre que expresen la combinación de ambos procesos, funciona correctivamente contra el exceso de la visión teleológica de la vida, y ayuda reconocer la naturaleza sistémica de la mente y del mundo (Bateson, 1971d). 68 La importancia de la epistemología para el terapeuta es que, como Pakman (2006) advierte, cuando se desconoce la epistemología de un campo y se usan sus conceptos para justificar un modelo clínico, “se suelen generar transferencias inadecuadas de conceptos de una disciplina a otra.” (p. 27,). Dado que el primer campo tiene implícita una epistemología y ontología acerca de la verdad, la realidad y el mundo, al trasladar conceptos a al modelo, se heredan también los compromisos epistémicos del primer campo de manera automática y, en ocasiones, esta operación resulta inadecuada. Por ejemplo, el caso de la metáfora energética del psicoanálisis. Por lo anterior, Pakman insiste en que el traslado de conceptos debe tener como paso intermedio el conocimiento de la epistemología del primer campo, de modo que al crear un modelo clínico basado en ese campo, asuma con responsabilidad y juicio la epistemología de esa disciplina. Además considera que el terapeuta que conoce la epistemología de sus modelos tiene la posibilidad de evitar ser un mero repetidor de técnicas terapéuticas y en cambio estará en la posibilidad de por un lado ser consciente de las raíces conceptuales de su modelo y aceptar con responsabilidad el legado intelectual con que justifica su práctica clínica; y por otro lado tener flexibilidad en el uso de sus modelos y poder ser creativo tanto a nivel técnico como a nivel teórico. Por último, Pakman sostiene que en el caso de los modelos de terapia interaccionales, la cibernética de segundo orden posibilita ese paso epistémico de los conceptos de la cibernética a la terapia familiar, ya que en sí misma es una epistemología que incluye al observador dentro de lo observado y, en consecuencia, al terapeuta dentro de la terapia. 69 Véase Bateson (1973). 70 Un trabajo que han reunido la presencia de distintas metáforas en la historia de la psicología es Leary (1990); mientras que Corona (2008) muestra la participación de las metáforas en la configuración de un par modelos clínicos en la psicología. 71 Hay que reconocer esfuerzos previos por establecer un modelo historiográfico para escribir la historia de psicoterapia sistémica (Vargas, 2011). 72 El origen del nombre, relata Riskin, es debido a que una de las personas que financiaron el proyecto, le pidió a Jackson que tuviera un título que se relacionara con investigar la mente. Jackson accedió por motivos económicos, aunque resultara contradictorio y confuso poner un nombre así a un instituto que desde el inicio se comprometía con el enfoque interaccional para el estudio de las enfermedades mentales (Wittezeale y García, 1994). 73 Paul Watzlawick termino siendo un importante miembro del MRI por lo cual conviene recordar como llego ahí. Nacido en Austria en 1921. Él se había doctorado en filosofía y había estudiado en Zurich psicoanálisis jungiano. Después de trabajar en Europa y la India, se va a San Salvador a impartir clases de psicoterapia; después de tres años decide regresar a Europa, pero antes se anima a visitar varios centros de EU. Conoce a Ray Birthwhistell y a Albert Scheflen que lo inician en las investigaciones sobre la comunicación. En octubre de 1959 Scheflen le presenta a Jackson en Filadelfia, quien de manera amistosa lo invita a visitar Palo Alto. Watzlawick llega en noviembre de ese mismo año a Menlo Park (Watzlawick, 1988; Wilder, 1978). 74 Hay que recordar que el equipo Bateson al introducir el uso del espejo unidireccional y la grabación durante su investigación de la comunicación, realizó un cambio metodológico importante en la investigación y practica terapéutica. Como parte de la labor antropológica y la perspectiva naturalista de Bateson se registraban las sesiones que tenía con su equipo de trabajo; además Haley grababa sus citas con los pacientes psiquiátricos. Esta técnica se mantuvo después con la grabación de sesiones clínicas para la formación de futuros terapeutas por medio de un magnetófono y video (Wittezaele y García, 1994) 75 Esta idea provoco una de las divisiones más claras entre el equipo de Bateson. Particularmente Jackson sostenía que el del síntoma tiene una función homeostática en el sistema familiar, por lo que eliminarlo no significaba arreglar el verdadero problema, sólo daba un alivio momentáneo pero eventualmente el síntoma regresaría en el mismo paciente o en otro miembro de la familia. Erickson en cambio pensaba que lo importante en el proceso terapéutico era provocar el cambio rápidamente, por lo que eliminar el síntoma equivalía a solucionar el problema (Govener, 2006). 76 Cf. Jackson (2010) y Ray (2004). 77 No debe confundirse la teoría pragmática presentada en este apartado con las teorías pragmáticas expuestas en la sección 1.3.3 ya que las teorías pragmáticas de Davidson y Searle buscan explicar el significado de las metáforas, por lo que son teorías pragmáticas propuestas para entender la semántica de las oraciones metafóricas. 236 Por otro lado, la teoría pragmática de Watzlawick tiene el objetivo de explicar cómo es que la comunicación en general afecta el comportamiento entre las personas; y que para ello retoma herramientas conceptuales sintácticas y semánticas para explicar la pragmática en la comunicación humana. 78 Puede resultar confuso para el lector el que se use teoría y modelo para referirse al marco teórico que trata sobre la pragmática en la comunicación humana. Para aclarar esta cuestión se señala que el nombre que Watzlawick le pone es el de teoría ya que tiene la pretensión de funcionar como tal. Sin embargo, la interpretación que se hace en la presente investigación es que es un modelo basado en algunas metáforas como se argumentara enseguida. Aunque se respetó el nombre de teoría, en nuestra investigación es un modelo sobre la comunicación. 79 Cf. Ruesch & Bateson (1951) y Bateson (1970, 1971i) 80 El origen de este axioma se puede encontrar en los proyectos iniciales del equipo Bateson, recordemos su objetivo inicial era estudiar la comunicación, por lo que paso a considerar los datos de la conducta como comunicación, Como ejemplo de una antecedente claro de este axioma, en una de las reuniones semanales que el equipo Bateson llevaba a cabo se puede encontrar que en 1957 Haley declaraba lo siguiente: “You cannot not communicate” (citado en Govener, 2006, p. 63). 81 Cf. Ruesch y Bateson (1951) y Bateson (1955a). 82 Cf. Bateson (1942) y Bateson (1971e) (este último fue escrito en desde 1964). 83 Cf. Bateson (1955a; 1966). 84 Cf. Bateson (1935, 1942b, 1949, 1958a). 85 Cf. Bateson (1968a; 1971d). 86 Cf. Bateson (1955a; 1955b; 1959; 1960); Bateson, et al, (1956; 1963); Weakland (1960). 87 Cf. Bateson (1961). 88 Cf. Erickson, Haley & Weakland (1959); Haley (1963).