Investigadores en inteligencia artificial revelaron el descubrimiento impulsado por el modelo de lenguaje avanzado Gemini, marcando un paso significativo en la capacidad de generar información más allá del conocimiento humano. Desarrollado por Google, Gemini supera a modelos anteriores, incluido ChatGPT, exhibiendo “razonamiento avanzado” y la habilidad de evaluar tareas de física estudiantil.
Este nuevo modelo multimodal, llamado Gemini, comprende texto, audio, imágenes, video y código simultáneamente. Google planea integrar Gemini en productos clave, como su motor de búsqueda, y lanzará una actualización del chatbot Bard en más de 170 países. La versión más potente, Ultra, superó a expertos humanos en pruebas multitarea y se espera que se lance en 2024.
Aunque Gemini se posiciona como un avance impresionante, persisten desafíos, como las “alucinaciones” o respuestas falsas, según Eli Collins, jefe de producto de Google DeepMind. La versión Pro de Bard, alimentada por Gemini, no se lanzará en el Reino Unido ni en la UE hasta obtener la aprobación regulatoria.
Demis Hassabis, CEO de DeepMind, unidad de Google que desarrolló Gemini, destaca el complejo proceso detrás del proyecto y la importancia de pruebas externas de seguridad. Google busca colaborar con el gobierno del Reino Unido para evaluar el modelo mediante el recién creado AI Safety Institute.
El lanzamiento de Gemini plantea preguntas sobre la dirección hacia la inteligencia artificial general (AGI), con Hassabis sugiriendo que modelos multimodales como Gemini serán componentes clave de la AGI, aunque enfatiza la continua investigación e innovación necesaria. Además, se abordan las preocupaciones sobre el uso de datos, con Gemini entrenándose con información de diversas fuentes, incluida la web abierta, generando inquietudes en las industrias editorial y creativa.
SIGUE LEYENDO |
Logran científicos crear nuevos materiales con inteligencia artificial