Los investigadores de Microsoft están utilizando ChatGPT para instruir a robots y drones

mano-robot.jpg

El ChatGPT de OpenAI no solo es capaz de generar respuestas de texto coherentes en respuesta a comandos de lenguaje natural, sino que también puede desempeñar un papel en las interacciones humano-robot y utilizar la retroalimentación de los sensores para escribir código para las acciones de los robots.

Microsoft llevó a cabo recientemente una investigación para "ver si ChatGPT puede pensar más allá del texto y razonar sobre el mundo físico para ayudar en tareas de robótica". El objetivo era ver si las personas pueden usar ChatGPT para instruir robots sin aprender lenguajes de programación ni entender sistemas robóticos.

En profundidad: Estos expertos están compitiendo por proteger la inteligencia artificial de los hackers. El tiempo se acaba.

"El desafío clave aquí es enseñar a ChatGPT cómo resolver problemas teniendo en cuenta las leyes de la física, el contexto del entorno de operación y cómo las acciones físicas del robot pueden cambiar el estado del mundo", señala un equipo del Grupo de Investigación en Sistemas Autónomos y Robótica de Microsoft en una publicación de blog.

Los investigadores de Microsoft exploraron la capacidad de ChatGPT para generar código, principalmente en Python, para escenarios de robótica, como la planificación y generación de código sin usar datos previos, después de que ChatGPT tuviera acceso a la detección y distancia de objetos a través de interfaces de aplicación.

ChatGPT puede producir código porque se entrenó con grandes cantidades de código y texto escrito. Se ha demostrado que el sistema es capaz de resolver problemas de codificación y depurar programas, con la capacidad única adicional de responder al diálogo y buscar aclaraciones. También está Codex, el modelo basado en GPT-3 de OpenAI que respalda el servicio de programación en pareja de GitHub llamado Copilot, que autocompleta el código para los desarrolladores en varios lenguajes de programación.

También: ¿Qué es ChatGPT? Aquí tienes todo lo que necesitas saber

Teniendo en cuenta estas habilidades de diálogo y clarificación, Microsoft probó la capacidad de ChatGPT como interfaz basada en el lenguaje entre un usuario no técnico y un dron. Como señalan los investigadores en un artículo, aunque GPT-3, LaMDA y Codex mostraron prometedoras en tareas de planificación robótica y generación de código, ChatGPT en particular es "una herramienta potencialmente más versátil para el dominio de la robótica, ya que incorpora las fortalezas de los modelos de lenguaje natural y generación de código junto con la flexibilidad del diálogo".

Los investigadores señalan en su publicación en el blog: "ChatGPT hizo preguntas de aclaración cuando las instrucciones del usuario eran ambiguas y escribió estructuras de código complejas para el dron, como un patrón en zigzag para inspeccionar visualmente los estantes".

Microsoft probó ChatGPT para utilizar un brazo robótico para mover bloques y formar el logo de Microsoft. Los investigadores también encargaron a ChatGPT escribir un algoritmo para que un dron llegue a un punto sin chocar con obstáculos. También probaron si ChatGPT puede decidir dónde debe ir un robot basado en la retroalimentación del sensor en tiempo real.

Los investigadores de Google Research y Everyday Robots, propiedad de Alphabet, también han trabajado en desafíos de robótica similares utilizando modelos de lenguaje llamados PaLM, o Modelo de Lenguaje de Trayectorias, que ayudaron a un robot a procesar solicitudes sin límites y responder de manera razonable.

Artículos relacionados

Ver más >>