OpenAI ha presentado una IA de respuesta a preguntas largas llamada ChatGPT que responde a preguntas complejas de forma conversacional.
Es una tecnología revolucionaria porque está entrenada para aprender lo que los humanos quieren decir cuando hacen una pregunta.
Muchos usuarios están asombrados por su capacidad para ofrecer respuestas de calidad humana, lo que hace pensar que puede llegar a alterar la forma en que los humanos interactúan con los ordenadores y cambiar la manera de obtener información.
¿Qué es ChatGPT?
ChatGPT es un chatbot con un gran modelo lingüístico desarrollado por OpenAI y basado en GPT-3.5. Tiene una notable capacidad para interactuar en forma de diálogo conversacional y proporcionar respuestas que pueden parecer sorprendentemente humanas.
Los grandes modelos lingüísticos realizan la tarea de predecir la siguiente palabra de una serie de palabras.
El Aprendizaje por Refuerzo con Retroalimentación Humana (RLHF) es una capa adicional de entrenamiento que utiliza la retroalimentación humana para ayudar a ChatGPT a aprender la capacidad de seguir instrucciones y generar respuestas que sean satisfactorias para los humanos.
¿Quién creó ChatGPT?
ChatGPT fue creado por la empresa de inteligencia artificial OpenAI, con sede en San Francisco. OpenAI Inc. es la empresa matriz sin ánimo de lucro de OpenAI LP, con ánimo de lucro.
OpenAI es famosa por su conocido DALL-E, un modelo de aprendizaje profundo que genera imágenes a partir de instrucciones de texto llamadas prompts.
Grandes modelos lingüísticos
ChatGPT es un gran modelo lingüístico (LLM). Los grandes modelos lingüísticos (LLM) se entrenan con cantidades masivas de datos para predecir con precisión qué palabra viene a continuación en una frase.
Se descubrió que aumentar la cantidad de datos se incrementaba la capacidad de los modelos lingüísticos para hacer más.
Los LLM predicen la palabra siguiente en una serie de palabras de una frase y las frases siguientes, algo así como autocompletar, pero a una escala alucinante.
Esta capacidad les permite escribir párrafos y páginas enteras de contenido.
Pero los LLM tienen la limitación de que no siempre entienden exactamente lo que quiere un humano.
Y ahí es donde ChatGPT mejora el estado del arte, con el ya mencionado aprendizaje por refuerzo con retroalimentación humana (RLHF).
¿Cómo se entrenó ChatGPT?
GPT-3.5 se entrenó con cantidades masivas de datos sobre código e información de Internet, incluidas fuentes como los debates de Reddit, para ayudar a ChatGPT a aprender a dialogar y alcanzar un estilo humano de respuesta.
ChatGPT también se entrenó utilizando comentarios humanos (una técnica llamada Aprendizaje por Refuerzo con Comentarios Humanos) para que la IA aprendiera lo que los humanos esperaban cuando hacían una pregunta. Entrenar el LLM de esta forma es revolucionario porque va más allá de simplemente entrenarlo para predecir la siguiente palabra.
ChatGPT se concibe como una herramienta por la que el público tendrá que pagar en algún momento.
Más de un millón de usuarios se han registrado para utilizar ChatGPT en los primeros cinco días desde que se abrió al público. Solo nos resta esperar si el uso constante de esta tecnología puede beneficiar a la humanidad.
Fuente: Search Engine Journal