Desafío de Google: revolución Gemini vs ChatGPT

Hace un poco más de un año, la compañía OpenAI lanzaba ChatGPT, un asombroso prototipo de inteligencia artificial conversacional que, con el correr de los meses, rápidamente se convirtió en el referente de una nueva era tecnológica.

De hecho, con más de 180 millones de usuarios activos, ChatGPT se posicionó como el líder indiscutible, pero lamentablemente ahora, el gigante tecnológico Google, está dando un paso audaz con su nuevo competidor, “Gemini”.

El duelo de modelos de lenguaje: ChatGPT vs. Gemini

Es clave entender que Gemini y ChatGPT no son idénticos y no pueden compararse de manera directa. Informáticos a Domicilio.

Respecto de ChatGPT, hay que decir que fue construido sobre el modelo de lenguaje GPT-4 o GPT-3.5, mientras que Gemini es en sí mismo un modelo de lenguaje. 

Ahora bien, la equivalencia de Google a ChatGPT es “Bard”, que anteriormente utilizaba el modelo PaLM y ahora opera con una versión adaptada de Gemini para consultas en inglés.

Ambas compañías ofrecen sus modelos de lenguaje para suscripciones a empresas y desarrolladores, brindando una gama de posibilidades más allá de la interfaz conversacional.

Tres variantes de Gemini: Ultra, Pro y Nano

En “Informáticos a Domicilio”, sabemos que Gemini se despliega en tres versiones distintas: Ultra, Pro y Nano. 

  • La versión Ultra, la más avanzada, será multimodal, capaz de comprender preguntas presentadas con imágenes, videos, texto o voz, aunque esta característica no estará disponible hasta 2024. 
  • En cuanto a la versión Pro, equivalente a GPT-3.5, ya está disponible en la versión en inglés de Bard. 
  • La variante Nano está diseñada para dispositivos con capacidades computacionales y de memoria más limitadas, como teléfonos móviles.

Por lo pronto, Google ha presentado comparaciones entre Gemini Ultra y GPT-4, ambos modelos multimodales. En pruebas de lógica, ciencia y comprensión lectora o auditiva, Gemini superó a GPT-4 en 30 de las 32 realizadas. 

Ahora, en el MMMU multimodal reasoning benchmark, que incluye 11.500 preguntas de nivel universitario en más de 57 disciplinas, Gemini se destacó al responder correctamente el 90% de las preguntas, superando tanto a GPT-4 como a la media humana.

Detalles cruciales: ¿Por qué Gemini sobresale?

Fuera de las pruebas estándar, se hace complicado comparar directamente sin acceder aún a la versión Ultra de Gemini. Informáticos a Domicilio.

En este caso, Jeff Dean, científico jefe de Google DeepMind, ofreció algunos datos reveladores. Por ejemplo, Gemini puede manejar un contexto de aproximadamente 32.000 tokens en las preguntas, lo que se traduce en la capacidad de comprender preguntas con un contexto extenso de 32.000 palabras. 

Es más, aunque esta cifra es similar a la de GPT-4, es esencial tener en cuenta que OpenAI anunció hace pocos días una versión de GOT4, GPT4 Turbo, que cuadruplica esa capacidad.

Por lo pronto, ambos modelos comparten la misma tecnología, desarrollada principalmente por Google, aunque es de dominio abierto. La diferencia radica en el entrenamiento. GPT-4 se ha entrenado con un corpus de más de 13 billones de tokens, incluyendo documentos, obras, imágenes, videos y mensajes de diversas fuentes. 

En cuanto a Google, hay que decir que todavía no ha revelado el tamaño del conjunto de datos para Gemini, pero destaca un enfoque novedoso centrado en la capacidad multimodal, haciendo que este modelo de IA sea más efectivo al considerar cuestiones que involucren imágenes y texto, como problemas de física presentados con diagramas.

El futuro de la batalla: ¿Gemini superará a ChatGPT?

La pregunta que todos se hacen es si Gemini superará a ChatGPT. Aunque las comparaciones actuales indican un rendimiento excepcional de Gemini, la respuesta final dependerá de diversos factores, incluido el lanzamiento de la versión Ultra y cómo se adapta Gemini a contextos más amplios.

En “Informáticos a Domicilio” creemos que en los próximos meses, la comunidad tecnológica estará expectante para ver si la estrategia de Google con Gemini, centrada en su capacidad multimodal y el enfoque innovador en el entrenamiento, le otorgará una ventaja crucial sobre su competidor más fuerte, ChatGPT.

(S.M.C)