Hacia ciudades inteligentes,
sustentables e inclusivas.

Explora la nueva frontera de la inteligencia artificial con Google Gemini, un modelo multimodal que redefine la interacción digital y se propone superar modelos de lenguaje como Chat GPT. Descubre sus capacidades revolucionarias y su impacto en servicios como Google Bard que serán lo próximo en estas tecnologías.

En un avance revolucionario en el mundo de la inteligencia artificial (IA), Google ha presentado su último modelo, Gemini, con 3 versiones distintas: Ultra, Pro y Nano. Estas versiones ofrecen una variedad de capacidades, desde la más avanzada y multimodal hasta una versión enfocada a dispositivos móviles con menor capacidad de computación y memoria.

Específicamente Gemini es un modelo multimodal de IA, lo que significa que puede entender información de varias fuentes, desde texto hasta imágenes, pasando por vídeo, audio o código. Es así como explican desde Google, que se trata de su “modelo más flexible hasta la fecha”.

En un fascinante video de promoción, Gemini demostró su capacidad para identificar dibujos de manera intuitiva, independientemente de la calidad artística o la improvisación del dibujante. Desde reconocer una guitarra hasta añadir elementos como un cable o una batería, Gemini demuestra una comprensión sorprendente. Incluso al mostrar una palmera, la IA puede agregar un ritmo caribeño a la música.

Gemini aspira a liderar el competitivo mercado de la inteligencia artificial y su objetivo es suceder a PaLM, el actual modelo utilizado por Google Bard. Aunque PaLM y Gemini comparten el mismo bot de IA, se espera que las respuestas proporcionadas por Gemini sean significativamente mejoradas, marcando así un nuevo estándar en el campo.

Gemini no se limitará a Google Bard, ya que se espera su integración en otros servicios y aplicaciones de Google. Desde el buscador de Google hasta Google Ads, Duet AI y Google Chrome, Gemini promete extender su influencia en varios aspectos de la experiencia digital. Los desarrolladores podrán acceder a Gemini Pro a partir del 13 de diciembre a través de la API en Google AI Studio o Vertex AI.

Google Gemini ha destacado al superar a sus rivales en pruebas clave, incluyendo a GPT-4, el modelo de OpenAI. Según dieron a entender desde Google, los resultados de Gemini en su versión Ultra son los mejores de una IA en 30 de las 32 pruebas académicas de uso generalizado, superando ligeramente los porcentajes obtenidos por GPT-4. Además. con una puntuación superior al 90% en MMLU (comprensión masiva del lenguaje multitarea), se convirtió en el primer modelo que supera a los expertos humanos en un test que combina 57 materias como física, historia, ética o medicina, junto a la capacidad de resolución de problemas.

Aunque GPT-4 sigue siendo un competidor fuerte, Gemini busca establecerse como un modelo multimodal excepcionalmente flexible, capaz de comprender texto, imágenes, audio y código de programación.

Las distintas versiones de Gemini se lanzarán escalonadamente en los próximos meses. Gemini Pro ya está disponible en Google Bard en inglés y se espera su llegada a Europa en los próximos meses. Además, se planea lanzar Bard Advance, una versión mejorada que integrará Gemini Ultra, el próximo año.

Podemos decir entonces que Google Gemini marca un hito en la evolución de la inteligencia artificial, prometiendo respuestas más avanzadas y una comprensión multimodal que redefine el estándar de la industria. Con su lanzamiento gradual y su integración planificada en una variedad de servicios, Gemini se prepara para liderar el camino hacia el futuro de la innovación tecnológica digital.

Video Google Gemini (créditos Google):  

tienes que ser suscriptor para comentar