Avance revolucionario: El RT-2 de Google DeepMind aprende de Internet para mejorar las habilidades de los robots

Google DeepMind ha dado un salto importante en el campo de la inteligencia artificial (IA) aplicada a la robótica. Su reciente creación, el sistema RT-2, es un “cerebro” para robots que permite a estas máquinas aprender de Internet.

¿Por qué es esto un avance tan significativo? Para responder a esta pregunta, primero necesitamos entender qué hace este modelo. Al igual que los modelos de lenguaje grande (LLM, por sus siglas en inglés), como ChatGPT, que han estado facilitando diversas tareas humanas, el RT-2 utiliza textos e imágenes de Internet para aprender nuevas habilidades. Este proceso implica que el software “entiende” un concepto, lo aplica a un conjunto de instrucciones y luego realiza acciones que satisfacen dichas instrucciones. Es una forma de aprendizaje autodirigido y basado en la práctica que es muy similar a cómo aprenden los humanos.

Fuente: Google DeepMind

En el mundo de la robótica, esto es revolucionario. Con la capacidad de aprender nuevas tareas del 32% al 62%, RT-2 ha demostrado una mejora significativa en la eficacia de los robots desde su antecesor RT-1. El modelo fue capaz de aprender, a través de la vasta cantidad de información y datos en Internet, lo que constituye “basura”, y luego diseñar y ejecutar las etapas para eliminarla. Este es solo un ejemplo de las posibilidades que este modelo de aprendizaje puede desbloquear.

En términos de salud humana, los avances como este tienen el potencial de revolucionar la forma en que interactuamos y utilizamos la tecnología. Los robots equipados con la IA como RT-2 pueden mejorar la calidad de vida, asumiendo tareas peligrosas o monótonas, ayudando a las personas con discapacidades y, potencialmente, brindando servicios de atención médica. Imagina un futuro en el que los robots pueden ayudar en el cuidado de los ancianos, realizar tareas domésticas, e incluso, en un escenario más avanzado, asistir en intervenciones médicas.

Observen al Robot RT-2 completando diferentes tareas físicas.

La robótica y la inteligencia artificial están haciendo avances impresionantes en la creación de máquinas que pueden aprender y adaptarse a nuevas situaciones. El RT-2 es un importante paso en esta dirección, pero aún queda trabajo por hacer. Aunque el RT-2 ha demostrado habilidades para generalizar conceptos semánticos y visuales, aún no puede aprender nuevas acciones por sí solo. En cambio, aplica las acciones que ya conoce a nuevos escenarios.

Esto podría cambiar con las próximas iteraciones, como el RT-3 o RT-4. Los investigadores de DeepMind tienen la esperanza de que estos futuros modelos puedan llevar las habilidades demostradas por el RT-2 al siguiente nivel, permitiendo a los robots aprender nuevas acciones por sí mismos y actuar de manera más autónoma.

Tiempos emocionantes estamos viviendo.

Fuentes: DeepMind’s ChatGPT-Like Brain for Robots Lets Them Learn From the Internet
Google DeepMind Researchers Introduce RT-2: A Novel Vision-Language-Action (VLA) Model that Learns from both Web and Robotics Data and Turns it into Action


Por favor síguenos en Google News:


Acerca de CD

Suscríbete a nuestro Boletín Semanal