Nov. 11, 2024
Escribe tus propias palabras
Contra la IA para escribir
Hace dos años se lanzó ChatGPT, popularizando la IA como una herramienta para crear cosas. Los modelos lingüísticos de gran tamaño generan texto basándose en instrucciones, produciendo palabras que son difíciles de distinguir de las escritas por una persona. Los beneficios a corto plazo son claros, pero sospecho que mucha gente subestima los costes a largo plazo.
Desde que OpenAI lanzó ChatGPT, he estado trabajando activamente con la nueva tecnología para comprender sus capacidades. He programado con IA, he aprendido con IA y he enseñado a la gente a trabajar con IA. Volví a la universidad para refrescar mis conocimientos sobre las tecnologías subyacentes a la IA. Escribí una entrada de blog realista con IA. Pero además, he estado pensando en el impacto de la IA en nuestra sociedad.
Es una herramienta poderosa, capaz de hacer cosas asombrosas como detectar cáncer a partir de imágenes de resonancia magnética o estructurar y documentar código informático para su reutilización. Todo el mundo puede usar la IA, y ahí radica un problema potencial, específicamente para la creación de contenido.
Únicamente humano
Si todos usamos las mismas herramientas para generar contenido, todo empezará a parecerse con el tiempo. Nos arriesgamos a perder diversidad. Especialmente a medida que los nuevos modelos informáticos se entrenan con contenido recién generado. Es un bucle recursivo que hace que el nuevo contenido se parezca más al contenido existente.
Ya se puede ver este problema si se observan los resultados de búsqueda de Google. La gente ha notado que los resultados están empeorando. Esto se atribuye a menudo a una cantidad creciente de contenido optimizado para motores de búsqueda, pero de baja calidad. Deberías consultar este artículo de Bevendorff Et Al para una investigación longitudinal del spam SEO en los motores de búsqueda. El contenido de baja calidad, pero de buen aspecto está desplazando al contenido realmente valioso.
¿Qué podemos hacer al respecto? Seguro que la gente que fabrica los modelos informáticos ideará filtros inteligentes diseñados para excluir el material de baja calidad utilizado para el entrenamiento. Espero que haya una prima por el contenido que no esté generado por IA. Al igual que el antiguo acero de bajo fondo se valora porque no está contaminado con rastros de lluvia radiactiva presente en el acero moderno.

Detectando contenido de IA
¿Escribió esto la IA? ¿Qué tan diferente escribe ChatGPT en comparación con los humanos? Investigadores de Preply buscaron señales para detectar textos escritos por IA para determinar el origen de los ensayos de los estudiantes. Analizaron 12.000 ensayos y crearon un análisis de las palabras, frases y errores más frecuentes tanto en los trabajos escritos por humanos como en los generados por ordenador. Estas son algunas de sus conclusiones clave:
- Los textos escritos por humanos eran mucho más propensos a contener errores, con un 78% de los textos que contenían al menos un error, en comparación con sólo el 13% de los ensayos de IA.
- Los errores de puntuación más comunes en los textos humanos incluían la falta de comas, errores de guiones y la falta de espacios.
- ChatGPT utiliza un 35% menos de vocabulario único que los humanos, con sólo 7.308 palabras únicas en total, en comparación con las 11.248 palabras únicas de los textos escritos por humanos.
- Los humanos son más propensos a utilizar sustantivos y verbos comunes como "uno" o "gente", mientras que ChatGPT prefiere términos complejos y especializados como "cultural" o "económico".

Arte en lugar de Artificial
Si te importa el contenido, deberías considerarlo como arte, puede haber una cualidad humana que determine su significado para otros humanos. En una comparación detallada, Gold Penguin compara el arte creado por humanos con el arte generado por IA. Sus principales hallazgos para detectar el contenido creado por IA son:
- Uso excesivo de patrones: Las máquinas no funcionan bien con la entropía o los datos aleatorios, lo que hace que los generadores de IA sean más propensos a repetir ciertos patrones que son prominentes en otras imágenes.
- Complejidad: La IA tiene dificultades para replicar los elementos únicos o inusuales con los que los artistas humanos son más propensos a experimentar.
- Falta de emoción: Aunque a veces pueden ser visualmente mejores, el arte de la IA carece de la profundidad emocional y conceptual del arte humano.
- Errores: ¿Alguna vez has visto una obra de arte y sabes que es falsa aunque no puedas explicar por qué? Ese es el valle inquietante. Suele manifestarse en pequeños ejemplos en lugar de algo que esté justo delante de ti. Seis dedos, pupilas sangrantes, sujeción incorrecta de objetos, la lista continúa.


Ahora entiendo que no todos los textos son igual de importantes y que algunos pueden no merecer la pena ser elevados a la categoría de obras de arte. Hay muy buenos casos de uso para los generadores de IA, incluyendo traducciones o resúmenes. No estoy en contra de los grandes modelos lingüísticos en general, sólo argumento que deben ser vistos como una herramienta con ventajas y desventajas.
Conclusión
Cuanto más poderosa es una herramienta, mayor es el daño que puede causar - depende de la persona que maneja la herramienta usarla bien. Si bien los grandes modelos lingüísticos son poderosos en su capacidad para generar textos de buen aspecto, su valor está determinado en última instancia por el significado que los humanos le atribuyen. Si los museos llenos de arte son un indicio, espero que siempre haya aprecio por las cosas creadas a mano. Deberíamos empezar por preocuparnos un poco más por las cosas que creamos, escribiendo nuestras propias palabras, por ejemplo.