Análisis Funcional, Teoría de Distribuciones de Schwartz y ChatGPT en Ingeniería Física
Resumen
La formación en matemáticas en titulaciones tanto de física como de ingeniería está esencialmente orientada a la presentación de los conceptos fundamentales y de sus aplicaciones. Sin embargo, cada vez hay una mayor disponibilidad de recursos online relacionados con la parte divulgativa, que podrían hacer más atractivas las asignaturas pero que acabamos obviando. Por otra parte, el auge de los Grandes Modelos de Lenguaje, como ChatGPT, ha iniciado una reflexión profunda sobre la práctica docente, principalmente en la evaluación.
En esta contribución presentamos una experiencia desarrollada en un curso de métodos avanzados de análisis matemático para ingeniería física. En ella combinamos la parte divulgativa y el uso de ChatGPT, proporcionando una visión actualizada de herramientas clásicas de análsis como pueden ser la Teoría de Distribuciones o las Series de Fourier para la resolución de EDP’s.
Palabras clave
ChatGPT, Grandes Modelos de Lenguaje, Análisis Funcional, Teoría de Distribuciones, Series de Fourier, Ecuaciones en Derivadas Parciales.
Abstract
Mathematics education in both physics and engineering degrees is essentially addressed to the presentation of fundamental concepts and their applications. However, there is an increasing availability of online resources related to the informative part, which could make the subjects more attractive, but which we end up ignoring. Besides, the rise of Large Language Models, such as ChatGPT, has initiated a deep reflection on teaching practice, mainly in evaluation.
In this contribution we present an experience recently developed in a course of advanced methods on mathematical analysis for engineering physics. In it we combine the informative part and the use of ChatGPT, thus providing an updated view of classical analysis tools such as the Theory of Distributions or Fourier Series for the resolution of PDEs.
Keywords
ChatGPT, Large Language Models, Functional Analysis, Theory of Distributions, Fourier Series, Partial Differential Equations.
Introducción
En la docencia universitaria se habla con mucha frecuencia de la incorporación de nuevas metodologías docentes. En muchos casos, se utiliza el concepto de “nuevo” simplemente para indicar que se están empleando metodologías más allá de la lección magistral en el aula. No obstante, sería más preciso insistir en que esa “novedad” fuera real. En ese sentido, es pertinente que el profesorado no sólo domine la materia que imparte sino que se encuentre también en la parte metodológica y se mantenga lo más actualizado posible en ambos sentidos.
El 30 de noviembre de 2022 la tecnológica Open AI, fundada en el año 2015, lanzó al público y en abierto ChatGPT (Generative Pretrained Transformer), un chatbot basado en un Gran Modelo de Lenguaje (Large Language Model [9]) que ha sido desarrollado mediante aprendizaje por refuerzo basado en textos escritos, permitiéndole tener un aspecto conversacional. En los primeros días tras su lanzamiento causó furor, a nivel mundial, por la sorprendente capacidad de dar respuesta a cuestiones de lo más variado y de una manera bastante precisa. De hecho, ChatGPT consiguió en solo dos meses más de 100 millones de usuarios, entre los que podemos encontrar a gran parte de la actual comunidad de jóvenes universitarios, teniendo un crecimiento exponencial mucho más acusado que el de las también actuales y famosas redes sociales de Tik-Tok e Instagram. Con el tiempo se ha ido desarrollando la forma de preguntar a ChatGPT, tanto con el objetivo de obtener respuestas más precisas (prompting) [15], como para esquivar algunas de las limitaciones o simplemente forzarlo a que conteste de manera errónea, sacando a relucir algunos de los sesgos de los que adolece y que residen en los datos utilizados para el entrenamiento del mismo, véase [10].
Al poco de su lanzamiento apareció el debate de si se podría limitar su uso o bien de cómo debería integrarse correctamente en la docencia, así como las repercusiones que iba a tener en el área de la investigación científica. En este último campo ya existe una opinión bastante generalizada sobre la capacidad de la actual inteligencia artificial, y aunque ChatGPT ha demostrado ser de gran ayuda en diversas tareas, todavía esta muy lejos de poder llevar a cabo una investigación real por si mismo (véase [5]), sobre todo si nos centramos en las áreas de la ciencia más cercanas a la lógica como las matemáticas. En cuanto a la docencia, dado que los trabajos académicas que los estudiantes realizan no exigen tanto como una investigación científica, es entendible que los docentes quieran prohibir estas herramientas pensando en el proceso de evaluación.
Ante esta situación, en diciembre de 2022 nos propusimos aceptar el reto de incorporar ChatGPT en la docencia, explorando su uso como herramienta de apoyo al aprendizaje conjuntamente con los estudiantes. En esta comunicación describimos la experiencia docente llevada a cabo con los alumnos de una asignatura de matemáticas avanzadas, en un grado de ingeniería física, con el objetivo de responder a la pregunta: “¿Cuánto y cómo pueden nuestros alumnos usar ChatGPT en un trabajo de los que típicamente usamos para evaluarlos?”.
Nos gustaría destacar que experiencias similares han sido llevadas a cabo en distintos contextos (véanse [8] y [14]), pero el punto de partida de todas ellas es el mismo: imponer el uso obligatorio de ChatGPT en una o varias tareas determinadas, sin seguir la norma general establecida en la docencia universitaria actual basada en la prohibición de su uso, y luego observar las consecuencias e impacto que tiene este hecho para los estudiantes y en sus trabajos.
El resto del artículo se ha organizado como sigue: en primer lugar se expone el Contexto de la experiencia docente, luego la Metodología empleada, para pasar finalmente a los Resultados obtenidos y a las Conclusiones finales.
Contexto de la experiencia docente
La asignatura en cuestión se titula “Métodos Matemáticos II” (MMII), que forma parte del “Grado en Ingeniería Física”, el cual ha sido incorporado recientemente en la Escuela Técnica Superior de Ingeniería de Telecomunicación (ETSIT) de la Universitat Politècnica de València (UPV).
En esta asignatura de 2º curso se presentan los espacios métricos en sentido abstracto, para posteriormente introducir los espacios de Banach y los espacios de Hilbert, así como operadores sencillos entre ellos. En concreto, se estudian operadores entre espacios de dimensión finita, pero también entre espacios de funciones y sucesiones, prestando especial atención al caso Hilbert por su gran interés para la formulación de la mecánica cuántica, temática que se trata en el grado pero en cursos posteriores. Luego se introducen los conceptos clave de serie y transformada de Fourier, desde un punto de vista abstracto y de manera complementaria a como se estudian en las asignaturas de grado relacionadas con teoría de la señal, observándolas desde el dominio de las frecuencias. Ya al final de la asignatura, se incluyen las distribuciones (definidas tanto en el espacio de funciones test como en el espacio de las funciones de la clase de Schwarz), sus transformadas y aplicaciones para resolver algunas ecuaciones en derivadas parciales, analizando los casos particulares de la ecuación del calor, y sobre todo de la ecuación de ondas. Más en concreto, las Unidades Didácticas incluidas en la Guía Docente de la asignatura en la página web del grado son siete:
- Espacios métricos, espacios de Banach y espacios de Hilbert.
- Operadores en espacios de Banach y en espacios de Hilbert.
- Teoría espectral en espacios de Hilbert.
- Análisis harmónico.
- Series e integrales de Fourier.
- Aplicaciones a la resolución de ecuaciones en derivadas parciales.
- Aplicaciones: Teoría ergódica, caos, termodinámica y mecánica cuántica.
Los libros de Bollobás [1], Shima [12] y Stritcharz [13] forman un compendio de las referencias teóricas básicas de la materia en cuestión.
La asignatura consta de 6 ECTS, distribuidos en teoría de aula (3), prácticas de aula (1,8) y prácticas informáticas (1,2). En el aula se combina la exposición en forma de lección magistral con la resolución de problemas. No obstante, se insiste mucho en dar una visión computacional de todos estos temas, para lo cual se han desarrollado 5 prácticas para trabajar con el lenguaje de programación Python (véase [7] para una introducción al mismo), cubriendo los contenidos:
Normas de vectores y operadores: se revisan las distintas normas de vectores en espacios de dimensión finita, pero también se exploran sus extensiones más conocidas a espacios de funciones y sucesiones mediante las correspondientes técnicas de integración. Esta práctica forma parte y se incluye dentro de las Unidades Didácticas (1) y (2) mencionadas arriba.
Teoría espectral, grafos y redes: introduciendo el paquete “NetworkX” de Python, su utilidad para el tratamiento de grafos/redes y su relación con el álgebra lineal, la teoría espectral y en particular los valores propios de las matrices de adyacencia. Esta práctica forma parte y se incluye dentro de las Unidades Didácticas (2) y (3) anteriormente mencionadas.
Series de Fourier: revisando la teoría vista en clase sobre el clave sistema trigonométrico, pero llevando el tema a un terreno computacional mediante las distintas herramientas que Python presenta para el cálculo, simbólico y exacto, de los coeficientes de Fourier, exponiendo también aplicaciones. Esta práctica forma parte de las Unidades Didácticas (4) y (5).
Transformada de Fourier: estudiando de forma computacional tanto la transformada continua como la discreta, mostrando aplicaciones directas de dicha teoría como el tratamiento de señales de audio, y enfrontando la estabilidad de las transformadas en relación a la señal original. En esta práctica se trabajan las Unidades Didácticas (4), (5) y (6).
Sistemas dinámicos, caos y fractales: introduciendo el teórico concepto de sistema dinámico, exponiendo sus distintas aplicaciones y abordando el fenómeno conocido como caos, donde aparecen los famosos fractales, y sus aplicaciones, de manera natural. Esta práctica forma parte y desarrolla también la Unidad Didáctica (7) anteriormente mencionada.
En el curso 2022-2023 la teoría del aula fue impartida por Alberto Conejero y las prácticas fueron elaboradas por Lucas Goiriz y Antoni López-Martínez, e impartidas por este último, todos ellos siendo miembros y/o colaboradores docentes en el Departamento de Matemática Aplicada (DMA) de la UPV. La cantidad de alumnos que cursaron esta materia fueron 73.
La evaluación de la asignatura se realiza mediante la resolución de ejercicios, de respuesta abierta escritos (70 %), o basados en las prácticas de laboratorio y para resolver computacionalmente mediante el uso de Python (20 %). Además, se propone un trabajo a desarrollar en grupos de 2 ó 3 personas sobre alguno de los contenidos de la asignatura, que debe ser expuesto en grupo, con el fin de completar la calificación (10%) y poder evaluar la competencia transversal de “Comunicación efectiva”, que es la que se ha acordado adjudicar, desde la dirección del centro, a esta asignatura para su evaluación. Es en esta última parte de la evaluación, en el trabajo en grupo, en la que hemos desarrollado la innovación docente propuesta en esta comunicación.
Metodología
A la hora de evaluar la competencia de comunicación efectiva se entiende que es importante considerar tanto la parte escrita como la parte oral. Es por ello que al comienzo del curso se pensó en facilitarle a los estudiantes materiales divulgativos sobre aspectos directa o indirectamente relacionados con el contenido de la asignatura para que elaborarán una presentación, y además entregaran un documento en el que se desarrollaba el trabajo realizado. Además, y con el fin de que profundizaran en el contenido y no sólo lo transcribieran, se les propuso que desarrollaran, computacionalmente, algunas de las cuestiones que hubieran aparecido alrededor del trabajo.
En relación con esta parte computacional, y teniendo en cuenta que ChatGPT no sólo había sorprendido con el grado más que razonable de precisión en sus respuestas si no también con la capacidad que tenía para desarrollar códigos que dieran solución a un problema, se les propuso a los alumnos que como parte del trabajo era obligatorio usar ChatGPT y documentar su uso, poniendo énfasis tanto en la utilidad de su uso, como en las limitaciones encontradas. Esta imposición contrasta con las medidas usuales que se han tomado durante los últimos meses sobre el uso de ChatGPT en la docencia universitaria, y que desde el principio se ha basado en el rechazo absoluto y la prohibición de una herramienta, a la cual tiene acceso todo el mundo de manera gratuita si se dispone de un dispositivo electrónico con internet y una cuenta de Google [6].
Si bien es cierto que es práctica común facilitar a los alumnos artículos, bien sea de investigación o de carácter divulgativo, se decidió ir un paso más lejos y facilitar como referencias artículos del agregador de blogs Medium. De hecho, tras realizar una inspección del contenido, los profesores propusieron los varios artículos que se relacionan en la Tabla 1, en la que indicamos el título de cada entrada, junto con su enlace, así como los contenidos que se tratan en estas. Como se puede observar, los contenidos cubren los temas propiamente dichos de la asignatura, como las series y transformadas de Fourier, las ecuaciones en derivadas parciales o la teoría de distribuciones, pero también contenidos que están indirectamente relacionados pero que no se cubren en otras materias del grado, como puede ser la teoría del caos, la ciencia de redes o el uso de Python para la realización de simulaciones numéricas.
Título | Contenidos tratados |
---|---|
Fourier Series | Harmonic Analysis, Orthogonal Systems and Fourier Coefficients |
Fourier Transform | Harmonic Analysis, Fourier Series and Fourier Transform |
Fast Fourier Transform | Harmonic Analysis, Signal Processing and Neural Networks |
Network Science with NetworkX | Graph Theory, Python Packages and Graph Representation |
Montecarlo Tree Search | Data Science, Python Packages and Solving Algorithms |
The Butterfly Effect | Dynamical Systems, Chaos Theory and the Butterfly Effect |
Chaos Theory: Fractals | Dynamical Systems, Chaos Theory and Fractals |
The Feigenbaum Constant | Dynamical Systems, Chaos Theory and Logistic Equation |
Eduard Lorentz: Father of Chaos | Dynamical Systems, Chaos Theory and the Butterfly Effect |
Python: Complex Systems | Dynamical Systems, Chaos Theory and Lorentz Attractor |
Distributions: The Dirac Delta | Distributions, Measure Theory and the Dirac Mass distribution |
The Wave Equation | Waves in Physics, some particular PDEs and its solution |
PDEs using Fourier Analysis | Wave Equation, some particular PDEs and its solution |
A los estudiantes se les propuso 10 minutos para la presentación y otros 10 minutos para debatir con ellos. Este trabajo, que podría haber sido individual, se planteó hacerlo en grupos de 2 ó 3 personas creándose 25 grupos. Esto se debe a que: por una parte, el impacto de la actividad era sólo de un 10% de la nota final; y por otro lado, el periodo de tiempo de evaluaciones era limitado y debía ser asumible el poder asistir, por parte del profesorado, a todas las presentaciones y posteriormente preguntar a los alumnos sobre el trabajo desarrollado.
Resultados
Los resultados que presentamos en esta sección son puramente cualitativos y están basados en las opiniones que los alumnos nos trasladaron después de la realización del trabajo y el uso de ChatGPT en el mismo. En concreto, hemos dividido esta sección en dos partes: incluimos primero las limitaciones que ha presentado ChatGPT y posteriormente los puntos fuertes del mismo.
Algunas limitaciones
Aunque inicialmente se pretendía que el uso de ChatGPT fuera en dirección a la obtención de código (la parte computacional del trabajo), los estudiantes han acabado utilizándolo (y documentando su uso) incluso para realizar preguntas aclaratorias sobre los conceptos teóricos. Sin embargo, como la actividad fue propuesta a los pocos días de aparecer ChatGPT, no eran todavía muy conocidas las diferentes opciones a la hora de realizar preguntas al chatbot.
La mayoría de las preguntas o peticiones sobre el contenido han ido en la línea de solicitar explicación o aclaración de los conceptos centrales de cada trabajo: “¿Qué es la teoría del caos?” o “¿Qué es un fractal?”. En muchos de los casos los propios alumnos solicitan una síntesis de las respuestas recibidas “¿Puedes explicármelo de manera más breve?”. No obstante, este conocimiento en ocasiones no distaba mucho de aquel que los propios estudiantes podían encontrar en Wikipedia y ellos mismos confesaban que “es conveniente tener unas nociones a cerca de lo que se pregunta para entender la respuesta”. Esta es una limitación de ChatGPT que también ha sido expuesta en experiencias similares (véase [14]).
Si hablamos de “razonamientos”, y en concreto de pedirle a ChatGPT que “razone”, aunque el chatbot sí lograba contestar correctamente y hacer entender a los alumnos indicaciones generales a preguntas del tipo “¿Cómo llegar desde la ecuación de Schrödinger a la ecuación de ondas?”, este era incapaz de dar respuestas coherentes a preguntas más complejas como “Si la derivada de la función Heaviside es la delta en sentido distribucional, ¿existe alguna ecuación generalizada cuya n-ésima derivada sea la función delta?”. Es conveniente notar que este tipo de preguntas de mayor complejidad están más cerca de lo que sería investigación matemática y la lógica que de un mero trabajo de recopilación de información o definiciones, aunque ChatGPT tampoco resultó de gran ayuda a la hora de interpretar “diagramas de bifurcación” o de comprender conceptos más teóricos tales como “la dependencia sensible de las condiciones iniciales”.
En relación a las limitaciones anteriormente incluidas, debemos tener en cuenta que la versión de ChatGPT utilizada fue la 3.0, y que esta y otras herramientas basadas en modelos generativos y Grandes Modelos de Lenguaje han seguido evolucionando en los últimos meses. De hecho, es conveniente mencionar que las versiones de ChatGPT 3.5 (gratuita) y 4.0 (de pago) ya están disponibles desde marzo de 2023.
Algunos puntos fuertes
Lo que sí llamó poderosamente la atención de los estudiantes es la capacidad de generar un código que diera solución a un problema formulado únicamente con texto: “¿Puedes escribir un código en Python que que dibuje el diagrama de bifurcación de la ecuación logística?” o “¿Podrías facilitarme un código para calcular los coeficientes de Fourier de una función en Python?”. Si bien es cierto que en la mayoría de casos los códigos no compilaban correctamente nada más ser devueltos, estaban razonablemente escritos y estructurados, incorporando las librerías necesarias para ejecutar las funciones utilizadas. El avance de obtener estos códigos es sustancial para los estudiantes pues, aunque algunos alumnos sí se veían capaces de haber generado dicho código por sí mismos buscando ayuda en manuales de referencia o Stack Overflow, el ahorro de tiempo que implica es considerable: “Me he ahorrado mucho tiempo a la hora de hacer la tarea, aunque si no supiera programar no habría podido completarla”.
Por otro lado, ChatGPT funciona muy bien para entender que hace un cierto código, “¿Puedes documentar este código y decirme qué hace en cada línea?”, o a la hora de aprender a utilizar otras herramientas informáticas como LATEX “¿Cómo se inserta una figura en un documento de LATEX?” o “¿Cómo puedo incluir en LATEX una tabla de valores con 4 filas y 5 columnas?”.
Conclusiones
En esta contribución hemos mostrado como una herramienta computacional y muy novedosa, ChatGPT, ha podido ser incluida en el marco de un curso de matemáticas teóricas, en particular de contenidos de análisis vinculados con la física. El hecho de que fuera un curso orientado a presentar diversas herramientas matemáticas y a explorar su uso desde la parte computacional ha facilitado su incorporación. Tal como hemos comentado, ChatGPT resulta de gran ayuda para resolver cuestiones incluso a nivel universitario, sobre todo computacionalmente, aunque a nivel de posgrado todavía presenta limitaciones tal como se comenta en la mayoría de artículos que hablan del tema actualmente (véase [4]).
Con la progresión de la inteligencia artificial en la última década, y ahora más recientemente de los Grandes Modelos de Lenguaje, que ya llevan avisando de su gran potencial desde hace unos años (véase [9]), nos veremos cada vez más ante la urgencia de replantear los sistemas de evaluación que utilizamos para puntuar a los alumnos, sobre todo aquellos en los que el profesor no está totalmente presente durante el desarrollo del trabajo. Se ha visto como ChatGPT no sólo resulta de utilidad para los estudiantes, sino también al profesorado en el diseño de tareas, directamente preguntándole posibles actividades a realizar en un contexto concreto, o bien para facilitar tareas administrativas (véase [11]).
Cabe destacar que en seguida aparecieron mcuhos plugins para navegadores como “YouTube summary with ChatGPT” para resumir vídeos, o también como “ChatGPT for Google Chrome Search” para integrar las búsquedas en la barra del navegador, y que los propios alumnos empezaron a utilizar inmediatamente.
En este sentido, plantear análisis minuciosos de la respuesta de herramientas generadoras de contenido, y basadas en inteligencia artificial, nos puede aportar no sólo una manera de actualizar las herramientas que se manejan a la hora de exponer y evaluar una asignatura, sino que sirven además para fomentar el espíritu crítico de los estudiantes, potenciando también su capacidad a la hora de interaccionar exitosamente con ellas. Dado que su impacto va a ser considerable en las tareas de carácter matemático, tal y como se remarca en diversos artículos que tratan este tema (ver por ejemplo [2]), es conveniente formar a los alumnos teniendo presente cuales son las características y competencias que les pueden aportar, y que van a necesitar en un futuro totalmente cercano.
Por último, con esta experiencia se pretendía comunicar de manera clara que los alumnos no eran ajenos a las últimas tecnologías. De hecho, sólo un tercio de nuestros estudiantes (27 de 73) oyó por primera vez de la herramienta ChatGPT al ser presentada la actividad en clase. En ese sentido, y aunque los alumnos que ya la conocían la utilizaban para que resolviera (al menos parcialmente) ciertas tareas, el hecho de tener que documentar su uso favoreció que los estudiantes la vieran desde un punto de vista crítico, y no sólo como una caja mágica que les podría ayudar a resolver sus tareas mucho más rápidamente.
En cualquier caso, y como punto final a esta comunicación, debemos ser capaces de transmitir a los estudiantes que la cautela es nuestra mejor arma ahora mismo frente al uso de ChatGPT, pues actualmente es una herramienta útil pero incompleta y su uso indiscriminado (al menos en pleno 2023) puede llevar, por una lado al error en las tesis obtenidas, y por otro lado al rechazo por parte de la comunidad científica [3].
Referencias
[1] Bollobás, B. Linear Analysis: an introductory course. Cambridge Mathematical Textbooks. Cambridge University PressElsevier, 1990.
[2] Eloundou, T. et al. GPTs are GPTs: An early look at the labor market impact potential of large language models. arXiv 2303.10130 (2023).
[3] Else, H. Abstracts written by ChatGPT fool scientists. Nature, 613 (7944), 423 (2023).
[4] Frieder, S. et al. Mathematical capabilities of ChatGPT. arXiv 2301.13867 (2023).
[5] Holden Thorp, H. ChatGPT is fun, but not an author. Science, 379 (6630), 313 (2023).
[6] Hao, Y. Reflection on whether Chat GPT should be banned by academia from the perspective of education and teaching. Frontiers in Psychology, 14 1181712, (2023).
[7] Lutz,M. Learning python: Powerful object-oriented programming.O’Reilly Media, Inc, 2013.
[8] Pérez Colomé, J. “Obligo a usar ChatGPT en mis clases”. Así es la irrupción inexorable de la nueva IA a las aulas. El País [Consulta: 21 de septiembre de 2023].
[9] Radford, A., Wu, J., Child, R., Luan, D., Amodei, D., Sutskever, I. Language models are unsupervised multitask learners. OpenAI blog, 1 (8), 9 (2019).
[10] Ray, P.P. ChatGPT: A comprehensive review on background, applications, key challenges, bias, ethics, limitations and future scope. Internet Things CyberPhys. Syst., 3, 121-154 (2023).
[11] Sabzalieva, E., Valentini, A. ChatGPT and artificial intelligence in higher education. UNESCO (2023).
[12] Shima, H. Functional Analysis for Physics and Engineering: An Introduction. CRC Press, 2016.
[13] Strichartz, R.S. A guide to distribution theory and Fourier transforms. World Scientific Publishing Company, 2003.
[14] Vukovic R. ChatGPT lesson activity: Secondary students testing the fallibility of AI Webpage [Consulta: 21 de septiembre de 2023].
[15] White, J. et al. A prompt pattern catalog to enhance prompt engineering with ChatGPT. arXiv arXiv:2302.11382 (2023).