
Desde que ChatGPT hizo que la inteligencia artificial generativa se abriera a todo aquel que quisiera, ha existido el debate. ¿Hasta qué punto son detectables los textos generados con inteligencia artificial?
La respuesta es complicada. Muchos programas antiplagio y anti-IA utilizado por Universidades han demostrado no ser eficientes del todo, pero también está claro que los textos generados por los grandes modelos de lenguaje cuentan con unos patrones que, a puro de usarlos, tienden a ser repetitivos.
"En resumen", como diría ChatGPT
Inicios anodinos con frases como "en el contexto" actual, su afán por adjetivar todo lo posible, y párrafos que cierran con coletillas como "en resumen" o "en conclusión" eran algunos de los más evidentes.
En Estados Unidos, un análisis había probado que la palabra 'delve' (ahondar o sumergirse) había disparado su presencia en papers académicos desde la llegada de la IAG. Pero ahora, el analista y consultor SEO español Natzir Turrado ha extraído qué palabras son también las que más se repiten en español.
Estas son las 50 palabras más usadas por la IA en español. "Crucial" es utilizada por la IA 6413 veces más que en textos humanos ?.
— Natzir (@natzir9) July 24, 2024
He calculado ~5000. ¿Os gustaría saber con qué frecuencia se repite alguna otra palabra? Por ejemplo, "vibrante" xD Preguntadme en este hilo :) pic.twitter.com/Sh8zyyEJGU
Para el análisis, publicado en Twitter, Turrado ha comparado las bases de datos de algunos de los modelos más populares con un corpus de textos escritos por humanos.
En concreto, se basó en los modelos Llama3-8b-8192, Llama-3-sonar-small-32k-chat, Gemma-7b-It, GPT3.5 Turbo, GPT4, GPT4o. Pero mayoría del corpus con modelos GPT. El tamaño total para el análisis fue de 360.337.739 tokens generados con IA.
El resultado es que a la IA le gustan mucho palabras como "crucial", que es 6.413 veces más frecuente en texto generados con IA que en textos naturales; "desafíos", o "exploraremos", ambas unas 2.000 veces más frecuentes.
"En este artículo exploraremos…"
En su análisis también ha extraído los trigramas, construcciones de tres palabras más frecuentes, donde aparecen por ejemplo "este artículo exploraremos", "consideraciones éticas" o "comenzando a desempeñar".
Los trigramas indican una estructura estándar y predecible en los textos de IA, lo cual es útil para mantener la coherencia en los resultados, pero también hace que muchas veces carezcan de fluidez.
La pregunta que queda por responder es: ¿hasta qué punto podrán las IAs cerrar esta brecha en el futuro?
Formación en IA
Si quieres transformar tu productividad y potenciar tu carrera a través de la IA, la escuela The Valley junto a elEconomista.es, ofrece un curso semipresencial diseñado para perfiles que buscan incorporar las últimas herramientas y técnicas de inteligencia artificial en su trabajo diario. Aprende de expertos del sector y adquiere habilidades prácticas que te diferenciarán en el competitivo mercado laboral, accediendo a puestos mejor remunerados y con mayores oportunidades de trabajo. Además, por ser lector de eleconomista.es, obtendrás un 10% de descuento en la inscripción. No dejes pasar esta ocasión de avanzar en tu desarrollo profesional y apúntate aquí.
Relacionados
- Cinco películas para entender o predecir cómo va a ser la Inteligencia Artificial en el futuro
- Cómo funciona el nuevo AI DJ de Spotify: escucha recomendaciones de música personalizadas gracias a la inteligencia artificial
- Meta acaba de lanzar Llama 3.1: su Inteligencia Artificial "más grande y capaz" que puede competir con ChatGPT
- ¿Ayuda realmente la Inteligencia Artificial a la productividad? Jefes y empleados tienen una visión muy distinta