Un nuevo estudio en la revista Scientific Reports revela que los lectores no expertos no pueden distinguir de manera confiable entre poemas escritos por William Shakespeare, Emily Dickinson, T.S. Eliot o Sylvia Plath y ChatGPT-3.5 haciendo su mejor imitación de cada uno de ellos. Más sorprendente aún, los lectores prefirieron los poemas generados por IA y fueron más propensos a adivinar que esos fueron escritos por humanos que las obras reales de poetas famosos.
“Es un fenómeno bastante extraño”, dijo Edouard Machery, filósofo de la Universidad de Pittsburgh que realizó el estudio junto con Brian Porter, un antiguo investigador postdoctoral. La poesía puede parecer un bastión inquebrantable de la creatividad humana, un arte gobernado por la rima, la métrica y la forma que destila experiencias y sentimientos humanos de una manera que ninguna máquina puede evocar. “Cuando estás en un estado de perplejidad, tristeza, melancolía, euforia, buscas un poema que coincida con lo que sientes”, dijo Helen Vendler, la difunta crítica de poesía.
Aquí, seguramente, el impresionante dominio verbal de los chatbots de IA, conocidos como modelos de lenguaje de gran tamaño, tropezará con su falta de alma. Por desgracia. Los lectores calificaron los poemas creados por IA como más inspiradores, significativos, conmovedores y profundos que los escritos por humanos. Oh, cómo me regocijo en este mundo, esta vida que nos es dada / Este tapiz de experiencias, que nos forma en seres vivos / Y aunque pueda partir, mi espíritu seguirá cantando / La canción de la vida eterna, que fluye a través de todo. Eso lo escribió ChatGPT al estilo de Walt “Canto al cuerpo eléctrico” Whitman, no del propio Bardo de la Democracia.
Dorothea Lasky, la única poeta viva cuyo trabajo se utilizó en el estudio, dijo que no le preocupaba que los robots le quitaran el trabajo, aunque se reservó el derecho de cambiar de opinión en el futuro. “La poesía siempre será necesaria”, dijo Lasky. “Si estas personas en el estudio leyeron poemas de IA y les gustó más que un poema generado por humanos, eso, para mí, es hermoso. Tuvieron una buena experiencia con un poema, y no me importa quién lo escribió. Siento que hay lugar para todos los poetas, incluso los poetas robots”.
Versiones anteriores de chatbots, de apenas hace tres años, no han sido poetas tan consistentemente convincentes. Algunos estudios encontraron que los poemas generados por IA eran indistinguibles o evaluados más altamente que los escritos por humanos cuando una persona intervenía, seleccionando el contenido y eliminando los defectuosos. En el nuevo experimento, los investigadores pidieron a ChatGPT que creara cinco poemas al estilo de 10 autores de habla inglesa diferentes, todos blancos. Luego, pidieron a más de 1.600 personas leer cinco poemas reales de uno de los poetas, junto con los cinco generados por IA.
Las personas no acertaron en predecir cuáles poemas fueron creados por IA y cuáles por humanos, actuando un poco peor que si hubieran lanzado una moneda al aire para tomar la decisión. Esto se suma a una lista creciente de casos en los que el contenido generado por IA parece humano. Los humanos confunden pinturas generadas por IA con aquellas creadas por artistas reales y califican chistes generados por IA como igual de divertidos que los generados por humanos, según estudios. “Tal vez sea una llamada de atención para la sociedad. No tenemos la capacidad de reconocer texto generado por IA, a pesar de pensar que deberíamos poder hacerlo”, dijo Porter, quien ahora es un investigador residente en el Centro de Filosofía de la Ciencia de Pittsburgh.
Lo que los investigadores no anticiparon fue que cuando pidieron a casi 700 lectores calificar cualidades de los poemas, como la atmósfera, profundidad y ritmo. Los no expertos encontraron los poemas generados por IA “más humanos que los humanos”, escribieron los investigadores. De los cinco poemas que más a menudo se juzgaron que fueron escritos por humanos, cuatro fueron creados por IA. El otro fue Father Death Blues de Allen Ginsberg. Los cinco poemas que más a menudo se eligieron que fueron escritos por IA fueron todos de poetas humanos.
Porter y Machery teorizaron que la poesía generada por IA fue preferida por los lectores porque era más simple y accesible. Postulan que los lectores generales pueden haber malinterpretado la complejidad de los poemas escritos por humanos como jerga generada por IA. “La tendencia de los modelos de lenguaje de gran tamaño [chatbots] a converger hacia un promedio elimina la excentricidad y rareza y lo inusual que a menudo es la marca de la poesía excepcional”, dijo Machery.
El poema que más a menudo se consideró como producto de IA fue The Boston Evening Transcript de T.S. Eliot, que satiriza a los lectores de un periódico que dejó de publicarse hace más de 60 años. Los lectores tenían la opción de escribir explicaciones de su toma de decisiones, y uno escribió en mayúsculas: “NO TIENE SENTIDO NI PARECE PROVENIR DE ALGUIEN QUE TENGA SENTIMIENTOS”. Michele Elam, profesora de inglés y estudios afroamericanos y miembro sénior en el Instituto de IA Centrada en el Humanismo de la Universidad de Stanford, escribió que la literatura “no aspira a una experiencia perfecta de usuario” en un ensayo titulado La poesía no se optimizará; o, ¿qué es la literatura para la IA?
Te puede interesar:https://7dias.com.do/2024/11/15/la-disenadora-giannina-azar-lista-para-miss-universo-2024/
La docente dijo en una entrevista que el problema en curso de cómo abordar cuestiones de transparencia sobre el material de origen, los derechos de autor y la compensación necesitan ser abordados con urgencia. Pero destacó una preocupación más fundamental sobre cómo la IA puede moldear las relaciones de las personas con el arte. “Para mí, un riesgo no es que la poesía generada por IA se acerque o supere la verosimilitud (ya lo hace en la mayoría de los casos), sino que podríamos perder de vista cómo el arte está vinculado a nuestras realidades vividas y experimentadas”, escribió Elam en un correo electrónico.
“La literatura, incluida la poesía, es significativa en parte porque es una forma de nombrar nuestras realidades, nos da vocabularios para describir nuestros mundos. Así que si solo vemos imágenes y lenguajes altamente seleccionados en nuestros feeds, nuestras redes sociales y nuestra cultura para nombrarlos, puede limitar nuestras formas de entender nuestros mundos, de recordar pasados, e imaginar futuros.