Inteligencia artificial aprende a jugar Minecraft tras ver videos de YouTube

OpenAI, una organización de investigación sobre inteligencia artificial, fundada por Elon Musk, entrenó una IA para jugar Minecraft. Y después de mirar alrededor de 70 mil horas de videos en YouTube, la Inteligencia Artificial lo logró casi tan bien como los humanos.

En una publicación de blog, la organización detalló la hazaña, lograda por una técnica conocida como Video PreTraining (VPT). Esto implicó recopilar 2 mil horas de conjuntos de datos de muestra de humanos reales que jugaban Minecraft. De esta forma, no sólo se logró incluir el video sin procesar, sino también las pulsaciones exactas de teclas y movimientos del mouse.

A partir de esto, los investigadores entrenaron un modelo de dinámica inversa (IDM) para predecir la acción futura que se tomará en cada paso de los videos. Finalmente, al IDM «entrenado» le mostraron 70 mil horas de videos de YouTube de Minecraft.

¿El resultado? El modelo pudo copiar los comportamientos de los videos, incluyendo la tala de árboles para recolectar troncos, y convertirlos en una mesa de crafteo.

Pero eso no fue todo, ya que también podía realizar otras actividades complejas como nadar, cazar y comer. La IA podía incluso hacer «saltos de pilares», que implica mantenerse en el aire saltando repetidamente y colocando un bloque debajo de sí misma.

Los investigadores pudieron crear un «modelo básico» basado en los datos proporcionados a la IA. A partir de ahí, pudieron afinar los comportamientos o aprender uno nuevo. Se observó que la IA podía realizar habilidades tempranas del juego, como construir herramientas de madera y piedra, asaltar cofres e incluso construir refugios.

La IA logró construir un pico de diamante

Cuantas más horas de datos se introducen en el modelo base, la IA era más capaz. Los investigadores incluso utilizaron el «aprendizaje de refuerzo» para «recompensar» a la IA por realizar desafíos especialmente difíciles. Dicho sistema logró que el modelo pudiera fabricar con éxito un pico de diamante, tarea que requiere una larga secuencia de tareas.

La aplicación de aprendizaje automático muestra cómo se pueden usar los juegos para entrenar computadoras. Quizá en un futuro pueda incluso incorporarse a los juegos para proporcionar un desafío más natural, similar a jugar contra otros humanos.