¡Una excelente función llega a la aplicación Gemini! Ahora es posible subir archivos de audio, incluso de forma gratuita

  • La aplicación Gemini finalmente es compatible con la carga de archivos de audio en Android, iOS y la web
  • Los usuarios gratuitos pueden subir hasta 10 minutos de audio, los suscriptores hasta 3 horas
  • La función estaba disponible en la API desde hace dos años, pero sorprendentemente faltaba en la aplicación

Sdílejte:
Jakub Kárník
Jakub Kárník
9. 9. 2025 12:00
gemini google audio

La aplicación Gemini finalmente ha recibido soporte para la carga de archivos de audio, una función que los usuarios han solicitado desde el principio. Lo curioso es que estaba disponible en la API desde hace dos años y funcionaba en AI Studio desde el lanzamiento del modelo 2.5 Pro. Simplemente… no estaba en la propia aplicación.

Según Google, era la función más solicitada de todas. Lo cual tiene sentido: ¿quién no querría que la IA transcribiera una grabación de una reunión de una hora o analizara un podcast?

¿Cómo hacerlo? Simplemente haz clic en el signo más

Usarlo es tan sencillo como un chasquido de dedos. En el móvil, abre el menú con el signo más y selecciona «Archivos»; en la web, selecciona «Subir archivos». La aplicación acepta prácticamente cualquier formato de audio: MP3, M4A, WAV y muchos otros. Luego, solo tienes que escribir lo que quieres hacer con la grabación.

Pero aquí viene el primer inconveniente. Los usuarios gratuitos pueden subir un máximo de 10 minutos de audio. Si tienes una suscripción a Google AI Pro o Ultra, el límite aumenta a 3 horas. Esa es una diferencia que vale la pena considerar, especialmente si trabajas regularmente con grabaciones más largas.

¿Qué puede procesar Gemini?

Los archivos de audio no son lo único que puedes subir a Gemini. La aplicación ya admitía videos anteriormente: 5 minutos gratis o una hora con suscripción, con un máximo de 2 GB. Más interesante es el soporte para desarrolladores:

  • Carpeta de código o repositorio de GitHub – hasta 5000 archivos de hasta 100 MB
  • Archivos ZIP – un máximo de 10 archivos dentro
  • Otros formatos – archivos individuales de hasta 100 MB

En total, puedes subir hasta 10 archivos de cualquier formato a un solo chat. No está mal, aunque la competencia a veces ofrece más.

¿Por qué demonios tardó tanto?

Los usuarios de Reddit se preguntan, con razón, ¿por qué una función disponible en la API durante dos años no estaba en la aplicación? La respuesta es probablemente prosaica. Google necesitaba asegurar suficiente capacidad de cómputo para millones de usuarios. Una cosa es ofrecer una función a los desarrolladores a través de la API, y otra es escalarla para las masas.

Además, como señaló un usuario, el problema no era el modelo en sí, sino la interfaz de usuario de la aplicación. Google simplemente necesitaba tiempo para la implementación. Lo cual es un poco vergonzoso para una empresa que presume de sus capacidades de IA en cada esquina.

¿Primeras impresiones? Sorprendentemente buenas

Según las primeras reacciones, la función funciona sorprendentemente bien. Un usuario probó el análisis de una canción con mucha distorsión y Gemini pudo reconocer los instrumentos y la letra, aunque con algunas divertidas equivocaciones ocasionales. Para la transcripción de grabaciones comunes o el análisis de podcasts, debería ser más que suficiente.

Por supuesto, no a todos les funciona de inmediato; algunos usuarios informan problemas con el procesamiento de archivos. Sin embargo, esto es lamentablemente estándar en el lanzamiento gradual de nuevas funciones de Google. Lo importante es que la función finalmente existe. Aunque con un retraso de dos años.

Al momento de escribir este artículo, no estaba disponible en el Pixel 10 Pro de la redacción, pero parece que eso cambiará en unas pocas horas.

¿Aprovecharás la opción de subir archivos de audio a Gemini?

Fuente: 9to5google

Sobre el autor

Jakub Kárník

Jakub je znám svou nekonečnou zvědavostí a vášní pro nejnovější technologie. Jeho láska k mobilním telefonům začala s iPhonem 3G, ale dnes se spoléhá na… Más sobre el autor

Jakub Kárník
Sdílejte: