Hoy

    Probé la herramienta de IA de Nvidia para mejorar tu webcam, y… ¡vaya!

    I Tested Nvidia’s AI Tool for Making Your Webcam Better, and Oof

    Introducción a Nvidia Broadcast 2.0

    Cuando Nvidia lanzó la aplicación gratuita Nvidia Broadcast en 2020, prometió utilizar las capacidades de inteligencia artificial de las GPUs RTX para mejorar la calidad de video y sonido de las grabaciones de los usuarios, suponiendo que tuvieran el hardware adecuado. Esto podría ser útil cuando la webcam y los micrófonos integrados de un portátil no capturan el mejor video ni el audio más rico, y podría ayudar a los streamers a optimizar su configuración con equipos más económicos. Con la versión 2.0 de la aplicación Nvidia Broadcast, lanzada a finales de enero, las capacidades aumentan aún más… quizás un poco demasiado.

    Funciones mejoradas en Nvidia Broadcast 2.0

    En Nvidia Broadcast 2.0, los micrófonos aún tienen opciones para la eliminación de ruido y eco de sala, pero ahora también hay un efecto de voz de estudio en beta que “mejora la calidad de tu micrófono para simular un estudio de grabación de alta gama”. Para video, la aplicación aún puede hacer ajustes al fondo (reemplazándolo, desenfocándolo o esencialmente aplicando un efecto de pantalla verde), eliminar ruido de grabaciones granuladas, hacer zoom y mantenerte automáticamente en el encuadre y, curiosamente, hacer que tus ojos parezcan estar mirando a la cámara. Entre las nuevas funciones se encuentra la iluminación virtual, para resaltar mejor a los usuarios en sus videos. Algunas de estas nuevas características requieren GPUs potentes. La voz de estudio, la eliminación de ruido de video y la luz clave virtual exigen una “GPU de alta gama” y no se recomiendan para su uso mientras se juega o se utilizan otras aplicaciones que consumen muchos recursos de la GPU. Todas las funciones requieren hardware RTX, lo que significa que necesitarás al menos una RTX 2060 o superior para probarlas, pero para las características que requieren una “GPU de alta gama”, Nvidia indica que se necesita una RTX 4080, 5080 o superior. Dicho esto, pude ejecutar ambas funciones en una GPU RTX 4060 móvil.

    Efectividad de las nuevas características

    La idea detrás de estas funciones de IA es emocionante, pero la eficacia real de funcionamiento es aún cuestionable. Por un lado, podrían ser realmente tan exigentes como dice Nvidia. Ejecutar ya sea la luz clave virtual o la función de voz de estudio en mi laptop con RTX 4060 mostró que la GPU estaba absolutamente sobrecargada por el proceso. El monitor de utilización de GPU integrado de Nvidia mostraba un estado rojo, con la RTX 4060 casi al máximo de su capacidad y la superposición de rendimiento mostrando que consumía 60 vatios. Los ventiladores de mi laptop incluso se aceleraron como si estuviera jugando a máxima potencia. Por lo tanto, desde una perspectiva económica, estas características son costosas sin importar cómo se vean. Necesitarás hardware potente para ejecutarlas y ese hardware también tendrá que funcionar duro. Planea usar estas funciones en un ordenador de escritorio o con tu portátil conectado a la corriente.

    Análisis de la calidad de audio y video

    Luego está el asunto aún más crucial de cómo realmente se ven y suenan. Comenzando con el video, la herramienta de contacto visual, a pesar de estar disponible antes de Broadcast 2.0, ha salido ahora de beta. Sin embargo, no estoy convencido de que debiera haberlo hecho. Claro, activarla hace que parezca que estoy mirando a la cámara en el metraje de video. Pero en mis pruebas, inevitablemente me dio grandes ojos azules que me hacían parecer un Caminante Blanco salido de Game of Thrones. Cabe mencionar que no tengo ojos azules. Incluso cuando estaba haciendo contacto visual con la cámara, Nvidia Broadcast aún insistía en editar mis ojos y volverlos azules.

    La luz clave virtual funcionó como se anunciaría. Creó iluminación artificial para aumentar el brillo sobre mí sin aumentar el brillo de todo el video. Sin embargo, los resultados no me impresionaron. Con ella activada, simplemente parezco haberme vuelto radiactivo. La iluminación es muy poco natural. En cuanto al audio, a primera vista, suena bastante impresionante. Los micrófonos de mi laptop no son muy buenos. Incluso en una habitación silenciosa, emiten un audio que me hace sonar distante y ligeramente apagado. Con la voz de estudio activada, mi voz resulta mucho más completa y clara. Pero al escuchar atentamente, hay una extraña digitalización en curso. Es difícil caracterizar, pero no suena como realmente mi voz. Más bien suena como si se hubiera usado una grabación de mi voz en un clonador de voz, y luego eso repitió todo lo que dije.

    La función de voz de estudio tampoco puede salvar el micrófono de un mal entorno de grabación. Probar en una habitación pequeña con un ventilador de caja funcionando a toda potencia resultó en una mejora dramática en la claridad en comparación con la grabación en crudo de los micrófonos, pero aún sonaba procesado, y los esfuerzos por reducir el ruido de fondo hicieron que mi voz sonara especialmente extraña. Si tienes un micrófono medio decente, la voz de estudio podría incluso empeorar la calidad. Hice grabaciones de prueba adicionales usando el micrófono boom integrado en los auriculares Audeze Maxwell, conectados directamente a mi laptop. En ambos, en una habitación tranquila y en una ruidosa, proporcionó una grabación clara y completa de mi voz sin la voz de estudio activada. En ambos casos, activar la voz de estudio introdujo una digitalización difícil de ignorar que no solo empeoró el audio, sino que también dificultó su comprensión.

    Conclusión sobre Nvidia AI y su utilidad

    Dadas los requisitos de hardware, las exigencias de rendimiento y la calidad de los resultados, realmente las estrellas tienen que alinearse para que estas nuevas funciones de Nvidia Broadcast se sientan verdaderamente valiosas. Si tienes un sistema de Nvidia, por supuesto, juega con la herramienta. Algunas de las características pueden ser útiles, como la de encuadre automático. Pero no recomendaría gastar en una nueva GPU de Nvidia solo para ahorrar en equipos de grabación de audio y video, especialmente si deseas obtener una calidad profesional. Y no olvides que el consumo energético de la GPU al intentar ejecutar estas funciones se acumulará con el tiempo.

    La calidad de audio que obtuve de la voz de estudio —quizás limitada por la RTX 4060 en mi sistema— no era algo que quisiera compartir con ningún tipo de audiencia de forma regular, y se quedó corta en comparación con la calidad que conseguiría simplemente con unos auriculares con micrófono boom. He probado muchos auriculares para juegos y, incluso los auriculares por cable muy baratos con micrófono boom, son mucho mejores que lo que escuché de la voz de estudio. La función de contacto ocular no fue más que inquietante, y no creo que engañe a nadie haciéndoles creer que realmente estás manteniendo contacto visual con ellos. Y la luz clave virtual, al igual que la voz de estudio, no parece ser un sustituto de calidad para una verdadera luz clave, especialmente cuando hay luces LED asequibles que son abundantes.

    Fuente y créditos: lifehacker.com

    Cats: Tech

    Deja un comentario

    Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *


    Mi resumen de noticias

    WhatsApp