El equipo de la Universidad de Stanford se disculpa por las acusaciones de que copiaron un proyecto de modelo de IA chino
«Queremos disculparnos sinceramente con los autores originales», dijeron Aksh Garg y Siddharth Sharma, estudiantes de informática de la Universidad de Stanford, en un comunicado publicado en X el lunes.
Dijeron que el modelo original había sido eliminado.
Llama 3-V fue desarrollado por Garg, Sharma y otro investigador, Mostafa Al-Jadri, que no es de Stanford. Los tres investigadores no respondieron de inmediato a las solicitudes de comentarios.
Cuando lanzaron Llama 3-V la semana pasada, afirmaron que podría entrenarse para rivalizar con el rendimiento de modelos de IA de vanguardia como GPT4-V, Gemini Ultra y Claude Opus por poco menos de 500 dólares.
Poco después de su lanzamiento, Llama 3-V alcanzó la lista de los cinco más populares en Hugging Face, una popular plataforma de inteligencia artificial.
Pero dentro de la comunidad de IA han surgido dudas sobre si gran parte del nuevo modelo fue robado de MiniCPM-Llama3-V 2.5. El modelo fue desarrollado conjuntamente por el Laboratorio de Procesamiento del Lenguaje Natural de la Universidad de Tsinghua y ModelBest, una startup de inteligencia artificial con sede en Beijing fundada en 2022.
El contenido publicado por un denunciante en la plataforma de código abierto GitHub indica que la estructura del modelo y el código de los dos proyectos son casi idénticos.
Liu Zhiyuan, cofundador de ModelBest, dijo en una publicación de WeChat el lunes que estaba «relativamente seguro» de que el nuevo modelo había sido robado de su proyecto.
Dijo que el MiniCPM-Llama3-V2.5 tiene una función incorporada: puede reconocer esquejes de bambú del período de los Reinos Combatientes (ca. 475-221 a. C.).
En 2008, la Universidad de Tsinghua adquirió 2.500 fragmentos de bambú (textos chinos escritos en tiras de bambú) de este período.
El equipo de Liu escaneó y anotó los textos palabra por palabra para crear un conjunto de datos de entrenamiento. Este conjunto de datos no está disponible públicamente, pero el modelo Llama3-V mostró la misma capacidad de reconocimiento, según Liu.
«Incluso los casos equivocados son los mismos», afirmó.
Liu dijo que el rápido desarrollo de la inteligencia artificial no se puede lograr sin el intercambio global de algoritmos, datos y modelos de código abierto. Señaló que su modelo utilizó como base la última versión de código abierto de Llama 3 de Meta.
Pero dijo que las piedras angulares de la participación en el código abierto son el cumplimiento de los protocolos, la confianza en otros contribuyentes y el respeto y reconocimiento del trabajo de los pioneros, que el equipo de Stanford «socavó gravemente».
En un comunicado el lunes, Garg y Sharma, ambos estudiantes de la Universidad de Stanford, dijeron que el tercer miembro del equipo, Al-Jadri, escribió todo el código del proyecto.
«Pedimos disculpas a los autores y asumimos toda la responsabilidad por no ejercer la debida diligencia para verificar la autenticidad de este trabajo», dijeron.
En una publicación en X el martes, Christopher Manning, profesor de informática y lingüística en la Universidad de Stanford y director del Laboratorio de Inteligencia Artificial de Stanford, dijo que no tenía conocimiento del caso. «La frase ‘finge antes de lograrlo’ es un producto despreciable de Silicon Valley», añadió.
El caso provocó un revuelo en las redes sociales, especialmente en China, donde encabezó la lista de temas principales en Weibo el martes. También dio lugar a un debate más amplio sobre el progreso de China en inteligencia artificial.
Lukas Baer, investigador del laboratorio de investigación de inteligencia artificial Google DeepMind, comentó en una publicación sobre el laboratorio chino.
En su publicación en WeChat, Liu de ModelBest reconoció una «enorme» brecha entre los modelos generativos de IA de China y proyectos occidentales de alto perfil como Sora y GPT-4. Pero dijo que China se había transformado rápidamente “de una nación don nadie hace más de una década a un importante impulsor de la innovación en tecnología de inteligencia artificial”.