La IA generativa de OpenAI bajo la lupa: Un 60% de sus respuestas contienen plagio

En un estudio reciente realizado por la empresa especializada en detección de plagio Copyleaks, se ha revelado que el 60% de las respuestas generadas por el modelo GPT-3.5 de OpenAI contienen algún tipo de plagio. Este descubrimiento ha puesto en el punto de mira a la inteligencia artificial generativa, en un momento en el que creadores de contenido, desde autores hasta el prestigioso diario The New York Times, están llevando a los tribunales el uso de esta tecnología por procesar material protegido por derechos de autor y producir copias exactas.

Copyleaks, una compañía con amplia experiencia en el análisis de textos mediante IA, ha analizado miles de respuestas generadas por GPT-3.5, el modelo que impulsaba ChatGPT en su lanzamiento. Los resultados muestran altas tasas de texto idéntico y paráfrasis en diversos campos del conocimiento. El estudio revela que el 45,7% de todas las respuestas contenían texto idéntico, el 27,4% presentaban cambios menores y el 46,5% incluían texto parafraseado.

La metodología empleada por Copyleaks asigna una «puntuación de similitud» a cada contenido, basándose en la agregación de diferentes factores como la tasa de texto idéntico, cambios menores y paráfrasis. Una puntuación del 0% indica que todo el contenido es original, mientras que una del 100% significa que nada del contenido lo es. En el caso de GPT-3.5, las respuestas individuales con mayor puntuación de similitud se encontraron en las áreas de informática (100%), física (92%) y psicología (88%), mientras que las puntuaciones más bajas aparecieron en teatro (0,9%), humanidades (2,8%) y lengua inglesa (5,4%).

Ante estos hallazgos, OpenAI ha defendido sus modelos argumentando que están diseñados y entrenados para aprender conceptos y ayudar a resolver nuevos problemas. Lindsey Held, portavoz de la compañía, ha declarado que cuentan con medidas para limitar la memorización inadvertida y que sus términos de uso prohíben el uso intencional de sus modelos para regurgitar contenido.

Sin embargo, la demanda interpuesta por The New York Times contra Microsoft y OpenAI alega que la «copia a gran escala» realizada por sus sistemas de IA constituye una infracción de derechos de autor. OpenAI ha respondido a la demanda argumentando que la «regurgitación» es un «error poco frecuente» y acusando al diario de «manipular las indicaciones».

Este estudio pone de manifiesto la necesidad de seguir investigando y perfeccionando los modelos de IA generativa para evitar el plagio y respetar los derechos de autor. A medida que esta tecnología se vuelve más sofisticada y accesible, es crucial establecer un marco legal y ético que garantice su uso responsable y transparente. Solo así podremos aprovechar todo el potencial de la IA generativa sin comprometer la integridad y originalidad del contenido creado por humanos.

En un mundo cada vez más digitalizado, donde la generación automática de textos se está convirtiendo en una herramienta habitual, es fundamental encontrar un equilibrio entre la innovación tecnológica y el respeto por la propiedad intelectual. Los creadores de contenido, las empresas de tecnología y los legisladores deberán trabajar juntos para establecer directrices claras que fomenten el desarrollo responsable de la IA generativa, al tiempo que protegen los derechos de los autores y garantizan la calidad y autenticidad de la información que consumimos.

Este estudio de Copyleaks no solo pone en tela de juicio la originalidad de las respuestas generadas por GPT-3.5, sino que también plantea interrogantes sobre el futuro de la creación de contenido y el papel que desempeñará la IA en este ámbito. ¿Podremos confiar en la autenticidad de los textos generados por máquinas? ¿Cómo distinguiremos entre el contenido original y el plagiado? ¿Qué implicaciones tendrá esto para los creadores humanos y su sustento?

Estas son solo algunas de las preguntas que deberemos abordar a medida que la IA generativa continúe evolucionando y expandiéndose. La detección y prevención del plagio será un desafío constante, pero también una oportunidad para reflexionar sobre el valor de la creatividad humana y la importancia de protegerla en un mundo cada vez más automatizado.

En definitiva, el estudio de Copyleaks sobre el plagio en las respuestas de GPT-3.5 de OpenAI es un llamado de atención sobre los riesgos y desafíos que plantea la IA generativa. Solo mediante un enfoque colaborativo y responsable podremos aprovechar todo su potencial sin comprometer la integridad y la originalidad del conocimiento que generamos y compartimos como sociedad.

Scroll al inicio