(Foto de ARCHIVO) La IA de Google Gemini. REMITIDA / HANDOUT por GOOGLE Fotografía remitida a medios de comunicación exclusivamente para ilustrar la noticia a la que hace referencia la imagen, y citando la procedencia de la imagen en la firma 10/4/2025

Grabar un video, por ejemplo, de un electrodoméstico que no funciona, y pedirle a Gemini que diagnostique el problema basándose en lo que ve y escucha, es posible. Esta función transforma a Gemini en un ojo y un oído aún más potentes. Podrá interpretar acciones, contextos y secuencias temporales dentro de los videos.El futuro de la interacción con la inteligencia artificial se vuelve más dinámico. Gemini, el modelo de IA de Google, dio un salto significativo al admitir la subida de videos para su análisis.

Esta nueva capacidad, según publicó Europa Press, permite a los usuarios no solo mostrarle a Gemini lo que están viendo, sino también lo que están experimentando, abriendo un abanico de posibilidades para la creatividad y la productividad.

¿Qué significa esto?

Hasta ahora, se podía interactuar con Gemini a través de texto e imágenes. Ahora, por ejemplo, grabar un video de un electrodoméstico que no funciona, y pedirle a Gemini que diagnostique el problema basándose en lo que ve y escucha, es posible.

O, quizás, filmar un tutorial rápido y pedirle a la IA que lo transcriba y resuma los pasos clave.

Esta función transforma a Gemini en un ojo y un oído aún más potentes. Podrá interpretar acciones, contextos y secuencias temporales dentro de los videos. Esto es crucial para tareas que van desde la depuración de problemas técnicos hasta la creación de contenido o el análisis de situaciones complejas.

Gemini, más allá de la imagen fija

La capacidad de analizar videos va mucho más allá de procesar imágenes fijas. La aplicación ahora podrá entender lo siguiente:

Movimiento y secuencia: captar cómo se desarrollan los eventos.

Audio contextual: interpretar sonidos y diálogos para una comprensión más profunda.

Interacciones: observar cómo los elementos interactúan entre sí o con personas.

Esta innovación promete hacer la interacción con la IA mucho más intuitiva y práctica para situaciones de la vida real, elevando el nivel de asistencia que Gemini puede ofrecer.

Vale destacar que ya empezó a desplegarse en la app, tanto para Android como para iOS, junto con los modelos Gemini 2.5 Flash y Gemini 2.5 Pro, anunciados en mayo en el marco del evento anual de desarrolladores de Google.

Es un paso adelante para que la inteligencia artificial se integre de forma más fluida en el día a día, facilitando tareas que antes requerían descripciones complejas o múltiples imágenes.

Gemini y los Periodistas

Según organización de eventos y conferencias del Colegio Nacional de Periodistas en Venezuela, estas nuevas herramientas tecnológicas de Inteligencia Artificial vienen a facilitar tanto el entretenimiento como el trabajo profesional de los periodistas, desarrollando así nuevas estrategias periodísticas tanto para la investigación como para las publicaciones.

Noti/Imágenes

Síguenos en:

Instagram: elpregon.news

Facebook: El Pregón Venezolano

“X” antes Twitter: @DiarioElPregón 

Telegram: elpregon.news

Amenhotep Planas Raga en “X” @AmenhotepPlanas

En Ig: Planas Raga

Diario El Pregón copyright 2023 Desarrollado por @SocialMediaAlterna