La distinción entre Gemini y ChatGPT

En un paisaje donde la inteligencia artificial redefine los límites de la interacción humana, la comparación entre Gemini y ChatGPT es inevitable. Google, en su afán por ofrecer tecnología puntera, ha anunciado Gemini, su contraparte en este campo. Pero, ¿qué diferencia realmente a ambos?
Mientras Google alardea de su modelo de lenguaje avanzado y la capacidad de razonamiento que se espera para 2024, hace apenas un año, OpenAI presentó al mundo ChatGPT. Esta IA conversacional se convirtió rápidamente en un fenómeno, con más de 180 millones de usuarios activos, marcando un nuevo estándar en la industria tecnológica y emergiendo como un catalizador de transformación social.
Ahora, Gemini ofrece a Google la oportunidad de rivalizar con estos servicios. Sin embargo, es crucial entender que no es apropiado comparar directamente Gemini con ChatGPT.
Gemini es un modelo de lenguaje, mientras que ChatGPT es una aplicación conversacional construida sobre modelos como GPT-4 o GPT-3.5, dependiendo de su versión (paga o gratuita). En el caso de Google, su equivalente a ChatGPT es Bard, que anteriormente utilizaba el modelo PaLM y ahora opera con una adaptación de Gemini para consultas en inglés.
Estos modelos de lenguaje funcionan como motores detrás de estas aplicaciones y no se limitan únicamente a interfaces conversacionales. Tanto Google como OpenAI ofrecen estos modelos a empresas y desarrolladores bajo suscripción.
Gemini llegará en tres versiones: Ultra, Pro y Nano. La primera, la más avanzada y multimodal, estará disponible en 2024, mientras que Google ha presentado vídeos de su funcionamiento. La versión Pro, similar en capacidad y funciones a GPT-3.5, ya está disponible en la versión en inglés de Bard. Por último, Nano, diseñada para dispositivos con menor capacidad de computación.
Las comparaciones presentadas por Google se centran principalmente en Gemini Ultra y GPT-4, ambos modelos multimodales. Según pruebas realizadas, Gemini supera a GPT-4 en 30 de 32 pruebas de lógica, ciencia y comprensión auditiva o lectora.
Una de las pruebas más notables, el benchmark de razonamiento multimodal MMMU, reveló que Gemini respondió correctamente al 90% de las 11,500 preguntas de nivel universitario, superando a GPT-4 y a la media humana.
Sin embargo, es difícil realizar comparaciones más allá de estas pruebas sin acceso a la versión Ultra de Gemini. Jeff Dean, científico jefe de Google DeepMind, anticipa algunos detalles, como la capacidad de Gemini para manejar contextos de hasta 32,000 tokens, comparable a GPT-4.
Ambos modelos se construyen sobre tecnologías similares, principalmente desarrolladas por Google, aunque de código abierto. La diferencia radica en el entrenamiento que reciben, basado en análisis estadísticos complejos de millones de datos en texto, imágenes y vídeos.
GPT-4 se entrena con un corpus de más de 13 billones de tokens, mientras que Google no ha revelado el tamaño del conjunto de datos de Gemini. No obstante, destaca un enfoque innovador en la capacidad multimodal de Gemini para considerar problemas que mezclan imágenes y texto.
En conclusión, la llegada de Gemini plantea una competencia relevante en el ámbito de las IA conversacionales y promete desafiar el liderazgo de ChatGPT, especialmente con su versión Ultra aún por llegar. El tiempo dirá si la estrategia de Google con Gemini realmente marca la diferencia frente a su rival directo.
