GUÍA TERMINOLÓGICA DE QC

Este documento contiene explicaciones breves de términos comunes de audio y video que se utilizan durante el proceso de QC de los videos enviados a Universal Music Group.

ÍNDICE

Haga clic en uno de los siguientes términos para ir a esa sección.

PROBLEMAS DE VIDEO (VIDEO ISSUES)

Artefactos de compresión (Compression Artifacts)

Defectos visuales de video que pueden ocurrir durante el proceso de compresión de datos, como pérdida de calidad de imagen (por ejemplo, el códec de video H.264), o por un procesamiento del color inferior a 10 bits. Las dos variedades más comunes de artefactos de compresión son:

Macrobloqueo (Macroblocking)
- Cuando las áreas de una imagen parecen estar formadas por pequeños cuadrados en lugar de detalles finos y realistas, sin contornos.

Banding / Posterización (Posterization)
- Cambio brusco, a veces irregular, de un tono de color a otro en lugar de un gradiente suave y difuminado. Como resultado, se pueden ver bandas o franjas de color distintas en lugar de una transición gradual.

(Haga clic en la imagen para ampliarla)

Falla digital (Digital Hit)

Corrupción visual en un archivo de video que resulta en desplazamientos o cambios (generalmente momentáneos) en los píxeles o en artefactos digitales visibles. Normalmente, se debe a un error de codificación.
Una de las soluciones más efectivas es volver a codificar o exportar el archivo de origen que no contenga esa falla digital.
Este error también se conoce como “falla de video” (video hit) o, en material grabado en cinta, “falla de cinta” (tape hit).

Cambio cromático o de luminancia (Chroma or Luma Shift)

Cambio repentino de color o brillo/luz. Suele suceder por un error humano en el proceso de corrección de color. En casos menos habituales, puede ser causado por un error en el proceso de codificación o renderización.

(Issue occurs at 0:03)

Desborde cromático (Chroma Bleed)

Cuando los pigmentos de una imagen en color aparecen fuera de lugar o se desbordan de su área designada. Puede deberse a que las señales de color de un video están desalineadas.

Ruido cromático (Chroma Noise)

Manchas o parches de color entre píxeles que afectan específicamente a la información de color en una imagen o video.

(Haga clic en la imagen para ampliarla)

Moiré

Patrón ondulado que aparece en las imágenes cuando las líneas están tan cerca que el sistema de imagen tiene dificultades para diferenciarlas. La ropa a rayas y las persianas venecianas son fuentes comunes de moiré.
Este efecto puede aparecer con color o sin color.

(Haga clic en la imagen para ampliarla)

Píxel muerto (Dead Pixel)

Pérdida de datos en un punto específico de una imagen. Suele ser el resultado de una imagen grabada con una cámara con un sensor defectuoso.
En casos menos habituales, los píxeles muertos también pueden ser el resultado de un error de codificación o edición.

(Haga clic en la imagen para ampliarla)

Franjas negras (Blanking)

Pérdida de video en el borde de la imagen, que se presenta como una franja negra, horizontal o vertical. Suele ser el resultado de un error de edición o de un video SD más antiguo enviado a UMG sin haber sido recortado a su apertura limpia.

(Haga clic en la imagen para ampliarla)

Información VBI visible (Visible VBI Information)

En una señal de video analógica, el intervalo vertical (Vertical Blanking Interval – VBI) es el tiempo que transcurre entre el final de la última línea de un fotograma o campo y el comienzo de la primera línea del fotograma siguiente. El intervalo vertical se utilizaba a menudo para la difusión de información como el código de tiempo y los subtítulos, ya que nada de lo que se enviaba durante el VBI se mostraba en la pantalla cuando se emitía correctamente. Esta información puede hacerse visible como líneas blancas a lo largo del borde superior de la imagen cuando se realiza una conversión incorrecta de video analógico a digital.

(Haga clic en la imagen para ampliarla)

Cambios en las barras negras (Matte Shifts)

Cuando las barras negras cambian ligeramente de tamaño de una toma a otra. Rara vez, es intencionado y suele ser un error de edición.
Tenga en cuenta que no son cambios simétricos o intencionados en las barras negras, típicos de los videos con relación de aspecto mixto.

(El problema se produce en 0:03 a lo largo del mate derecho)

Aliasing

Cuando se muestrea una señal de manera insuficiente, lo que resulta en artefactos visuales como bordes dentados o patrones irregulares en la imagen.
Puede introducirse involuntariamente mediante procesos de escalado de la imagen, conversiones de desentrelazado o video comprimido con pérdida de calidad.
A menudo se denominan “jaggies” (dientes de sierra) o “stair-stepping” (escalones).

(Haga clic en la imagen para ampliarla)

Fotogramas omitidos (Skipped Frames)

Cuando se han eliminado uno o más fotogramas del video original, y como resultado da una experiencia de visualización interrumpida o entrecortada.
Un patrón constante de fotogramas omitidos es un problema grave que suele estar causado por una conversión destructiva de la velocidad de fotogramas del video original. Algunos casos comunes son:
- De cada 4 fotogramas progresivos, uno es omitido en un video de 24 fps.
  - Esto indica que se ha producido una conversión destructiva de velocidad de fotogramas de 30 a 24 fps.
- De cada 5 fotogramas progresivos, uno es omitido en un video de 25 fps.
  - Esto indica que se ha producido una conversión destructiva de velocidad de fotogramas de 30 a 25 fps.
- De cada 25 fotogramas progresivos, uno es omitido en un video de 24 fps.
  - Esto indica que se ha producido una conversión destructiva de velocidad de fotogramas de 25 a 24 fps.

(Pause el video, luego use los atajos de teclado “<” y “>” para pasar de fotograma a fotograma – observe que después del 4to fotograma sucede un salto parecido al doble del movimiento del fotograma anterior)

Fotogramas duplicados (Duplicate Frames)

Cuando uno o más fotogramas del video se repiten/duplican, provocando un movimiento entrecortado.
Cuando un video presenta un patrón de fotogramas repetidos se denomina “cadencia de fotogramas duplicados” (duplicate frame cadence) y es un problema grave que suele estar causado por una conversión destructiva de la velocidad de fotogramas. Algunos casos comunes son:
- Cadencia de fotogramas duplicados 4:1 en un archivo de 30 fps.
  - Cuatro fotogramas de movimiento progresivo, seguidos de un fotograma duplicado durante todo el video.
  - Esto indica que se ha producido una conversión destructiva de velocidad de fotogramas de 24 a 30 fps.
- Cadencia de fotogramas duplicados 5:1 en un archivo de 30 fps.
  - Cinco fotogramas de movimiento progresivo, seguidos de un fotograma duplicado durante todo el video.
  - Indica que se ha producido una conversión destructiva de la cadencia de fotogramas de 25 a 30 fps.
- Cadencia de fotogramas duplicados 24:1 en un archivo de 25 fps.
  - Veinticuatro fotogramas de movimiento progresivo, seguidos de un fotograma duplicado durante todo el video.
  - Esto indica que se ha producido una conversión destructiva de la cadencia de fotogramas de 24 a 25 fps.

(Pause el video, luego use los atajos de teclado “<” y “>” para pasar de fotograma a fotograma – observe que después del 4to fotograma sucede una repetición del fotograma anterior)

3:2 Pulldown / Telecine

Un proceso en el que el video original progresivo en 23,98 o 24 fps se convierte a un video entrelazado en 29,97 fps para cumplir con los antiguos estándares de transmisión NTSC. Por cada tres fotogramas progresivos en el archivo final, hay dos fotogramas entrelazados.
UMG no acepta la ingestión de videos telecinados. Si el video original previo al proceso de telecine no existe, se debe realizar un proceso de telecine inverso antes de la ingestión.

(Observe el patrón de 3 fotogramas progresivos, 2 entrelazados a medida que avance fotograma por fotograma en el video)

Artefactos de entrelazado (Combing / Interlacing Artifacts)

Si los archivos de video original entrelazados no se manejan correctamente durante el proceso de postproducción, los artefactos de entrelazado (combing/interlacing artifacts) pueden ser erróneamente “incrustados” en una imagen progresiva y no podrán ser eliminados mediante un proceso estándar de desentrelazado.
Los artefactos de entrelazado se distinguen como líneas horizontales finas en los objetos en movimiento.
Estos artefactos suelen introducirse cuando un video entrelazado se escala a una resolución distinta sin ser previamente desentrelazado.
Consulte la sección Tipo de escaneo / Entrelazado (Scan Type / Interlacing) de esta página para obtener más información sobre el video entrelazado.

(Haga clic en la imagen para ampliarla)

Efecto de imagen fantasma / Superposición de fotogramas (Ghosting / Blended Frames)

Es cuando una imagen u objeto en movimiento deja una estela o rastro en el video. Esto sucede cuando un conjunto de fotogramas adyacentes se ha combinado y superpuesto. Suele deberse a una conversión incorrecta de un video entrelazado a uno progresivo o a una conversión destructiva en la velocidad de fotogramas del archivo.

(Haga clic en la imagen para ampliarla)

Claqueta / Barras de color y tono (Slates / Bars & Tone)

Una claqueta se refiere a la placa o pantalla que se utiliza al comienzo de un video o una toma para identificar el título, el nombre de la producción, la duración, entre otros detalles relevantes.

(Haga clic en la imagen para ampliarla)

Las barras de color y tono se refieren a un patrón de barras de colores y un tono de referencia de audio que se utiliza para calibrar y ajustar equipos de video y audio antes de una producción o emisión. También pueden incluir un reloj que marque la cuenta atrás.

El inicio y final del video sin negro y silencio (P2P Formatting)

“P2P” es la abreviatura de “Programa a Programa”.
Todos los videos enviados a UMG deberán contener un máximo de dos segundos de negro y silencio antes del “Inicio del programa” y después del “Final del programa”.
El “Inicio del programa” se define como el primer fotograma de video o audio activo, y el “Final del programa” como el último fotograma de video o audio activo.
Más de dos segundos de negro en el inicio o final del programa (video igual o por debajo de 0 IRE) y silencio (audio por debajo de -90 dB) resultará como falla en el control de calidad.
Tenga en cuenta que este requisito sólo se aplica a una combinación de video negro y silencio. Si el video negro tiene música audible por debajo no existe un límite específico para su duración.

Presentación de los avisos de derechos de autor (Copyright Formatting)

Los avisos de derechos de autor (Copyright Notice cards) suelen incluirse al final de los videos de UMG.
La presencia de los avisos de derechos de autor no es obligatoria ni está impuesta por Video Services y queda a discreción del sello discográfico.
Cuando los avisos de derechos de autor están presentes, deben adherirse a los siguientes criterios:
- Deben estar centrados en la imagen, de izquierda a derecha.
- No deben de estar sobrepuestos en las barras negras (mattes) del video.
- Deben tener una duración de 3 a 5 segundos.
- No deben solaparse con video o audio activo.

(Haga clic en la imagen para ampliarla)

Directrices y Restricciones de Apple Music (Apple Flags)

Apple Music tiene estrictas directrices y restricciones de contenido para los videos enviados a su servicio. Consulte los siguientes enlaces para obtener más información.
- UMG Apple Sharepoint – Videos
- Guía de estilo de Apple Music (Apple Music Style Guide)

PROBLEMAS DE AUDIO (AUDIO ISSUES)

Mono Dual (Dual Mono)

Se denomina Mono Dual al audio que contiene dos canales que son idénticos entre sí. Al reproducirlo, el audio Mono Dual no tendrá imagen estereofónica y todo el audio sonará como si procediera del “centro fantasma” (phantom center).
La música moderna casi siempre se mezcla en estéreo, por lo que los archivos de video que contengan música deben tener una verdadera pista de audio estéreo (“True Stereo”) para mantener la intención creativa de la música.
Los programas y aplicaciones que ofrecen inspección de datos de los archivos de video y audio (como QuickTime Player) normalmente se referirán como “Estéreo” a cualquier pista de audio que tenga dos canales, independientemente de si los dos canales son idénticos, por lo que se debe usar los inspectores de audio de un programa de edición para comprobar si efectivamente es estéreo (ver siguiente imagen).
Consulte nuestra Guía de solución de problemas de Mono Dual (Dual Mono Troubleshooting Guide) en la página de ayuda al editor (Editor Help) para obtener consejos sobre cómo arreglar un audio en Mono Dual.

Inversión de Fase (Inverse Phase)

Ocurre cuando la polaridad de los distintos canales de una mezcla de audio es accidentalmente opuesta. Esto hace que la música suene débil, hueca, difusa y poco natural.
Los problemas de inversión de fase entre canales son fáciles de solucionar invirtiendo la polaridad de un solo canal.

Desbalance entre canales (Channel Imbalance)

Cuando los dos canales de audio tienen niveles de volumen notablemente diferentes entre sí, esto provoca que todo el campo sonoro se desvíe involuntariamente hacia la izquierda o la derecha.

(Observe que todo el audio se encuentra muy inclinado hacia la izquierda)

Audios comprimidos con pérdida de calidad (Lossy Audio Compression)

La reducción del tamaño del archivo provoca pérdidas en la calidad del audio.
Las pistas de audio enviadas a UMG no deben estar codificadas en un formato con pérdidas de calidad (MP3, AAC, etc.) ni convertidas a PCM desde un archivo de audio original con pérdidas. Todos los envíos deben codificarse a partir de un máster con la mejor calidad posible.

ATRIBUTOS TÉCNICOS (TECHNICAL ATTRIBUTES) – VIDEO

Códec de video (Video Codec)

Es un algoritmo que codifica y descodifica data de video digital. El códec de un video determina como se comprimen y descomprimen los datos de video. Cada códec tiene sus propias características y niveles de compresión.
UMG sólo acepta los códecs de video Apple ProRes 422 HQ, 4444 y 4444 XQ. Serán rechazados los archivos Apple ProRes 422, 422 Proxy o 422 LT.
Será rechazado el códec de calidad web H.264.

Resolución (Frame Size)

Se refiere al tamaño de la imagen (ancho y alto) que forma el video, medido en píxeles.
El documento de Especificaciones Técnicas de Video (Video Servicing Asset Specs) indica todas las resoluciones aceptadas por UMG, los videos deben ser entregados a UMG en una de esas resoluciones.
- 3840×2160 o 1920×1080 son las resoluciones ideales para la mayoría de los nuevos contenidos que son HD/UHD, pero puede encontrar más opciones en el enlace de nuestras especificaciones de video.
No se aceptarán videos de “sólo imagen activa” (Active Picture) en una resolución más ancha o alta de las aceptadas por UMG.

UMG requiere entregas de resolución estándar de la industria, ya que la gran mayoría de DSPs también requieren estas resoluciones estándar.
Una pequeña cantidad de DSPs, YouTube incluido, aceptará entregas de “sólo imagen activa” (Active Picture) para que los videos puedan mostrarse sin barras negras (Black Mattes) en la interfaz de los DSPs. Si desea que su video aparezca en YouTube sin las barras negras debe asegurarse de seleccionar la opción “Sí” en la sección “¿Cortar a imagen activa?” (Crop To Active Picture) al crear la solicitud (Submission) en VSP. Encontrará más información sobre cortar a imagen activa (Crop to Active Picture) en la pestaña “Cortar a imagen activa” (Crop to Active Picture tab).
Si un video se graba o masteriza en una resolución que no es aceptada por UMG, el mejor curso de acción sería aumentar la resolución del video final a una resolución compatible más cercana al tamaño de imagen original.
- Por ejemplo, un video con una resolución de 3200×1800 puede escalarse a 3840×2160.
Los videos 4K (4096×2160) y 2K (2048×1080) no deben contener barras negras verticales en el borde izquierdo y derecho de la imagen (Pillarboxing).

Relación de aspecto de la pantalla (Display Aspect Ratio-DAR)

La proporción entre el ancho y alto de una imagen de video que se muestra en una pantalla durante su reproducción.
Los videos enviados a UMG deben contener los metadatos técnicos correctos en relación de aspecto de la pantalla (DAR) basados en las Especificaciones Técnicas de Video (Video Servicing Asset Specs).
Para videos en definición estándar (SD) si es correcto utilizar 16:9 o 4:3, dependerá del contenido presente en el video.
En la pestaña “Ayuda al editor” (Editor Help) de esta página encontrará un tutorial de video sobre cómo conformar la relación de aspecto de la pantalla.

Aumento de resolución de un video (Upscaling)

Es el proceso de convertir un video original de resolución inferior a una resolución superior.
El aumento de la resolución (upscaling) no suele aumentar la calidad visual percibida y, de hecho, este proceso puede reducir la calidad, dependiendo del algoritmo de escalado.
Los videos enviados a UMG no deben de aumentar su resolución de SD a HD o de HD a 4K/UHD.

Velocidad de fotogramas (Frame Rate)

Es la frecuencia con la que se capturan o muestran imágenes consecutivas en una señal de video. Normalmente se expresa en “fps” – fotogramas por segundo.
Los videos enviados a UMG deben tener la velocidad de fotogramas nativa (sin conversiones).
- Consulte las secciones Fotogramas Omitidos (Skipped Frames) y Fotogramas Duplicados (Duplicate Frames) en esta guía para obtener una descripción detallada de los errores más comunes por los que un video no pasa el control de calidad cuando no se envía en la velocidad de fotograma nativa.
En los casos de videos inusuales que tienen una velocidad de fotogramas nativa que no figura como compatible en nuestras Especificaciones Técnicas de Video (Video Servicing Asset Specs), recomendamos que se envíen en una velocidad de fotogramas compatible que sea un múltiplo o factor de la velocidad de fotogramas nativa.
- Por ejemplo, un video stop-motion animado en 15 fps puede presentarse en 30 fps.
- En otro ejemplo, un video capturado en 48 fps puede presentarse en 24 fps.
NO se aceptarán videos que han sido convertidos de estándares (es decir, convertidos de NTSC 29.97 fps a PAL 25 fps o viceversa).

Tipo de escaneo / Entrelazado (Scan Type / Interlacing)

Hay tres tipos de escaneo de video posibles: Progresivo, campo inferior primero entrelazado (Bottom Field First – BFF) y campo superior primero entrelazado (Top Field First – TFF).
El estándar moderno, en la era del streaming, es el escaneo progresivo.
- Generalmente se obtiene una calidad de video superior cuando la imagen se captura en un formato progresivo.
El escaneo entrelazado es una técnica que duplica la velocidad de fotogramas percibida en una pantalla sin consumir ancho de banda adicional. Fue desarrollado para permitir la transmisión de video mediante las infraestructuras de transmisión tradicionales con ancho de banda limitado.
- Generalmente, los video capturados en formato entrelazado son de menor calidad.
- La captura de videos con escaneo entrelazado se sigue utilizando a menudo en los nuevos contenidos que tienen en mente la transmisión tradicional como principal método de distribución.
Los videos capturados originalmente en formato entrelazado deben enviarse a UMG como tales, sin ningún tipo de desentrelazado.
Hay dos tipos de lectura sobre el escaneo en los resultados de un informe de Auto-QC de UMG Video Services:
- Tipo de escaneo decodificado (Scan Type Decoded)
  - Este valor es el tipo de escaneo decodificado de la secuencia de bits de video real, determinado según la mejor capacidad de nuestro proceso de Auto-QC.
- Indicador de tipo de escaneo (Scan Type Flag)
  - Este valor es el que aparece indicado en los metadatos técnicos del archivo.
Para que el archivo de video sea aceptado y pase el Auto-QC de UMG, el tipo de escaneo decodificado (Scan Type Decoded) y el indicador de tipo de escaneo (Scan Type Flag) deberán coincidir Y ADEMÁS ser compatibles con la combinación de la resolución y la velocidad de fotogramas listados en nuestras Especificaciones Técnicas de Video (Video Servicing Asset Specs).
Tenga especialmente en cuenta que los videos enviados con una velocidad de fotogramas de 23,976 o 24 fps deben tener siempre un escaneo progresivo.

Colores Primarios (Color Primaries)

“Colores primarios” es un indicador de la metadata técnica que se almacena en un archivo QuickTime. El término hace referencia a las tres coordenadas “primarias” de rojo, verde y azul que definen un espacio de color.
Los videos enviados a UMG deben contener los colores primarios correctos indicados en la metadata técnica basada en la combinación de la resolución y el rango dinámico listados en las Especificaciones Técnicas de Video (Video Servicing Asset Specs).
Para asegurar que el indicador de metadata de colores primarios sea correcto en su archivo final, compruebe la configuración de su secuencia y las opciones de exportación en su software de edición.

Video HDR vs SDR

SDR hace referencia al video de rango dinámico estándar (Standard Dynamic Range), por lo general, en BT.709 o BT.601, espacios de color con BT.1886 o con una curva gamma especificada como función de transferencia.
HDR hace referencia al video de alto rango dinámico (High Dynamic Range), por lo general, en los espacios de color BT.2020 o P3 con ST.2084 (PQ) o HLG como función de transferencia.
Se rechazará el envío de videos en alto rango dinámico (HDR) a UMG. Todos los videos deben enviarse en rango dinámico estándar (SDR).
Para obtener un borrador de las especificaciones HDR que UMG tiene previsto admitir en el futuro, consulte la sección “ESPECIFICACIONES DE LA PRÓXIMA GENERACIÓN” (NEXT GENERATION SPECIFICATIONS) en nuestras Especificaciones Técnicas de Video (Video Servicing Asset Specs).

Barras negras horizontales (Letterbox)

Barras negras (black mattes) horizontales en el borde superior e inferior de la imagen – estas pueden llegar a ser cortadas/removidas por algunos partners.

(Haga clic en la imagen para ampliarla)

Barras negras verticales (Pillarbox)

Barras negras (black mattes) verticales en el borde izquierdo y derecho de la imagen – estas pueden llegar a ser cortadas/removidas por algunos partners.

(Haga clic en la imagen para ampliarla)

Barras negras en todos los bordes (Windowbox)

La imagen aparece dentro de un cuadrado negro (barras negras en todos los bordes).

(Haga clic en la imagen para ampliarla)

ATRIBUTOS TÉCNICOS (TECHNICAL ATTRIBUTES) – AUDIO

Configuración de audio (Audio Configuration)

Se refiere a la disposición de las pistas y los canales de audio presentes en un archivo y como estos están distribuidos para su reproducción.
Hay seis tipos de lecturas para la comprobación de los canales de audio que realiza el servicio de video de UMG Auto-QC. Cada una de las lecturas representa una configuración de audio diferente:
- ESTÉREO (STEREO)
  - La única lectura que conducirá a un aprobado (PASS) en Auto-QC.
  - Este análisis indica que el video enviado contiene una pista de audio con dos canales que NO son idénticos y que están indicados correctamente en los metadatos del archivo como “Izquierda” y “Derecha”.
- MONO DUAL (DUAL MONO)
  - Este fallo (FAIL) de Auto-QC indica que el video enviado contiene una pista de audio con dos canales idénticos.
  - Para más información, consulte la sección Mono Dual (Dual Mono) de esta página.
- DOS PISTAS DE AUDIO INDEPENDIENTES (TWO DISCRETE TRACKS)
  - Este fallo (FAIL) de Auto-QC indica que el video enviado contiene 2 pistas independientes de audio, con 1 canal en cada pista. Según nuestras Especificaciones Técnicas de Video (Video Servicing Asset Specs), todo audio debe entregarse en un par estéreo de 2 canales contenido en 1 pista de audio.
  - NOTA: Este fallo (FAIL) no especifica si el audio está en Mono Dual o en Estéreo. El audio deberá de ser revisado a través de medidores de audio como se indica en la sección de Mono Dual (Dual Mono section), y así determinar si el audio puede ser reconfigurado para cumplir con nuestras especificaciones.
- MULTICANAL (MULTICHANNEL)
  - Este fallo (FAIL) de Auto-QC indica que el video enviado contiene más de 2 canales de audio, independientemente del número de pistas de audio. Según nuestras Especificaciones Técnicas de Video (Video Servicing Asset Specs), todo audio debe entregarse en un par estéreo de 2 canales contenido en 1 pista de audio.
  - NOTA: Dependiendo del contenido de cada canal de audio, Video Services podría reconfigurar el archivo que tuvo este fallo (FAIL) para que así cumpla con nuestras especificaciones. La discográfica puede responder a nuestro reporte sobre el fallo (FAIL) de MULTICANAL (MULTICHANNEL) del Auto-QC y solicitar a Video Services que determine si alguno de los canales de audio tiene un par estéreo de 2 canales intencionados para una mezcla estéreo.
- UN CANAL EN MONO (SINGLE CHANNEL MONO)
  - Este fallo (FAIL) de Auto-QC indica que el video enviado contiene 1 pista de audio con 1 canal de audio. Según nuestras Especificaciones Técnicas de Video (Video Servicing Asset Specs), los audios deben entregarse como un par estéreo de 2 canales contenido en 1 pista de audio.
- CATEGORIZACIÓN DE CANALES NO COMPATIBLE (UNSUPPORTED CHANNEL TAGGING)
  - Este fallo (FAIL) de Auto-QC indica que el video enviado contiene canales de audio a los que no se ha asignado correctamente la posición de altavoz en los metadatos del archivo. Según nuestras Especificaciones Técnicas de Video (Video Servicing Asset Specs), en el par estéreo el canal 1 debe tener asignada la posición “Izquierda” y el canal 2 debe tener asignada la posición “Derecha”.

Códec de audio (Audio Codec)

Es un algoritmo que codifica y descodifica data de audio digital.
El audio debe entregarse a UMG como PCM lineal sin comprimir.
Se rechazarán los códecs de audio AAC y MP3 de calidad web.

Frecuencia de muestreo en el audio / Profundidad de bits (Audio Sample Rate / Bit Depth)

La frecuencia de muestreo es el número de muestras de audio registradas por unidad de tiempo y la profundidad de bits mide la precisión con la que se han codificado las muestras. Juntas, la profundidad de bits y la frecuencia de muestreo determinan la resolución del audio.
Todas las pistas de audio en los archivos de video que se envíen a UMG deben tener una frecuencia de muestreo de 48 kHz y una profundidad de bits de 16 o 24.
Se rechazarán las pistas de audio en los archivos de video con una frecuencia de muestreo de 44,1 kHz.
Las pistas de audio en los archivos de video de 32-bit “float” serán rechazadas.

ATRIBUTOS TÉCNICOS (TECHNICAL ATTRIBUTES) – DOLBY ATMOS AUDIO

¿Qué es Dolby Atmos? (What is Dolby Atmos?)

Dolby Atmos es una tecnología de sonido de audio espacial/inmersivo/envolvente. Mientras que los formatos de audio convencionales se basan en canales (como Estéreo o 5.1 con seis canales), Dolby Atmos se basa en objetos. Esto significa que el ingeniero de audio puede asignar coordenadas 3-D X, Y y Z específicas para indicar la posición en la que desea que se escuche un objeto/instrumento/sonido en una sala. El audio Dolby Atmos es luego enviado y decodificado del lado del consumidor de forma que recreará el posicionamiento de la mejor manera posible según las capacidades del dispositivo/sistema.

ADM BWF (Audio Definition Model Broadcast Wave Format)

Se pronuncia en inglés “ADM B-wave”.
Es un tipo de archivo .wav más sofisticado, asimismo es audio con una esencia sin compresión y puede acarrear valores de metadata complejos y dinámicos. Es el formato de archivo utilizado para almacenar y enviar audio Dolby Atmos.

FFOA Primer Cuadro de Acción (FFOA – First Frame Of Action)

Un código de tiempo de metadata establecido manualmente en los archivos de audio para indicar donde terminan los pre-rolls (tonos de referencia, etc.) y donde incia el programa, comienza la acción, destinado para la distribución. UMG no aceptará un archivo Dolby Atmos con FFOA presente.

Pistas base / Canales de cama (Bed Channels)

Las pistas base diagraman el audio en ubicaciones fijas en el espacio que están limitadas fuertemente al posisionamiento de los altavoces utilizados en formatos de audio tradicionales basado en canales como 2.0, 5.1 y 7.1.

Pistas de Objeto / Canales de Objeto (Object Channels)

Las pistas de objeto diagraman el audio en elementos de audio específicos que pueden ser posicionados y paneados dinámicamente donde sea dentro de un espacio sonoro tridimensional. El contenido auditivo de una pista de objeto podrá ser escuchado en tantos o tan pocos altavoces como lo definan sus metadatos de posición y tamaño de ese objeto, así como la disposición y el número de altavoces en un entorno de reproducción determinado.

LFE o Efectos de Baja Frecuencia (Low Frequency Effects)

En los masters Dolby Atmos, la información que ocupa la sección más baja de la banda de frecuencia audible, es posible proporcionarla en un tipo especial de canal de cama denominado canal “LFE”. En los sistemas de home theater tradicionales, el contenido de audio de estos canales de cama LFE se enviará directamente a un subwofer, independientemente de la configuración en la gestión de graves.
Como su nombre lo indica, estos canales de cama LFE están destinados a contener únicamente información de baja frecuencia y, como tal, UMG exige que estos canales estén limitados mediante un filtro de paso bajo, con una frecuencia de corte entre 100 y 150 Hz durante el proceso de creación de la mezcla.

Modo 5.1 Downmix (5.1 Downmix Mode)

Un valor de metadata que dicta la base de un algoritmo que será utilizado para diagramar información de audio en un espacio sonoro más limitado facilitado por las configuraciones de altavoces 5.1 y 5.1.x.
UMG exige que los audios Dolby Atmos se envíen en modo “5.1 Downmix” en “Direct Render”.

Controles de acortamiento/recorte (Trim controls)

Los controles de acortamiento son valores de metadata que permiten a los ingenieros ajustar el balance de energía de audio a través de las coordinadas X, Y y Z en una configuración determinada de reproducción en los altavoces. En el reporte de VSP AQC se puede leer un resumen general de los distintos ajustes de acortamiento que se establecen para los altavoces en la disposición 5.1 & 2.0, 5.1.2, 5.1.4, y 7.1. Las lecturas posibles son en Automático, Manual (Todo 0), Manual (Personalizado) o cualquier combinación de las tres.

Metadatos binaurales (Binaural Metadata)

Valores de metadata en los canales de audio que afectan cómo el audio es percibido espacialmente cuando se renderiza para la reproducción binaural en auriculares. En el reporte de VSP AQC se puede leer un resumen general de cada configuración binaural única especificada en el archivo. Las lecturas posibles son Off, Near, Mid, Far, o cualquier combinación de las cuatro. UMG no aceptará audios Dolby Atmos en los que todos los valores de metadata binaurales estén configurados en «Off», ya que esto desactivará el efecto de «sonido envolvente simulado» previsto al escuchar audio Dolby Atmos con auriculares.

Pico real (True Peak)

Una medición calculada de las instancias de nivel máximo en la señal de audio, dando cuenta de posibles cortes en el audio o distorsiones al convertir la señal de audio digital en ondas sonoras analógicas. Se mide en decibelios.
UMG exige que los audios Dolby Atmos tengan un pico verdadero que no sea superior a -1,0 dBTP.

Volumen integrado (Integrated Loudness)

Una medición calculada que indica el nivel de volumen perceptual medio del audio. Se mide en LKFS (siglas en inglés de “loudness, k-weighted, relative to full scale”).
UMG exige que los audios Dolby Atmos tengan una sonoridad integrada que no sea superior a -18,0 LKFS.

ATRIBUTOS TÉCNICOS (TECHNICAL ATTRIBUTES) – ARCHIVO (FILE)

Formato contenedor (File Container)

El formato de archivo en el que se almacena el video (y el audio).
UMG sólo acepta videos en el contenedor QuickTime (.mov).
El contenedor común .mp4 será rechazado.
Los archivos enviados a UMG no deben contener dentro del formato contenedor ninguna otra pista que no sea de video, audio o código de tiempo.

Archivos corruptos (File Corruption)

Durante el proceso de renderizar, exportar, codificar, cargar, descargar o en la copia de archivos de video, pueden producirse errores que dañen el archivo. Esto puede generar que ciertos fotogramas de video no se reproduzcan correctamente, que un archivo no se abra o que no se reproduzca en absoluto.
Los videos enviados a UMG no deben contener ningún tipo de corrupción de datos, ni siquiera en un fotograma. Asegúrese de reproducir su video antes de enviarlo para comprobar que todos los fotogramas y el audio se reproduzcan con normalidad, sin artefactos de corrupción.

Nomenclatura de archivos (File Naming)

Los nombres de archivo enviados a UMG sólo deben contener caracteres estándar (a-z, A-Z, 0-9 y guiones bajos), y no pueden comenzar con un punto o guión bajo. No utilice caracteres especiales como guiones, espacios, barras diagonales, barras invertidas, acentos, &, @, #, etc. Los espacios en blanco no están permitidos ni en el nombre del archivo, ni en las carpetas.
El nombre del archivo no debe contener más de 120 caracteres.

MD5 Checksum

MD5 Checksum es un identificador único, una “huella digital” del archivo, que se utiliza para verificar si el archivo ha sido alterado o modificado. Se genera a través de un algoritmo matemático que toma el contenido del archivo y lo convierte en una cadena de texto de 32 caracteres. Si dos archivos tienen el mismo MD5, significa que los dos archivos son exactamente iguales, incluso si los nombres de los archivos son diferentes o es simplemente una copia. UMG utiliza MD5 checksum para detectar archivos de video duplicados y rechazará cualquier nuevo envío con un MD5 idéntico a la solicitud (Submission) anterior.

GUÍA TERMINOLÓGICA DE QC

ÍNDICE

PROBLEMAS DE VIDEO (VIDEO ISSUES)

PROBLEMAS DE AUDIO(AUDIO ISSUES)

ATRIBUTOS TÉCNICOS CONT. (TECHNICAL ATTRIBUTES CONT’D)

PROBLEMAS DE VIDEO (VIDEO ISSUES)

Artefactos de compresión (Compression Artifacts)

Falla digital (Digital Hit)

Cambio cromático o de luminancia (Chroma or Luma Shift)

Desborde cromático (Chroma Bleed)

Ruido cromático (Chroma Noise)

Moiré

Píxel muerto (Dead Pixel)

Franjas negras (Blanking)

Información VBI visible (Visible VBI Information)

Cambios en las barras negras (Matte Shifts)

Aliasing

Fotogramas omitidos (Skipped Frames)​

Fotogramas duplicados (Duplicate Frames)

3:2 Pulldown / Telecine

Artefactos de entrelazado (Combing / Interlacing Artifacts)

Efecto de imagen fantasma / Superposición de fotogramas (Ghosting / Blended Frames)

Claqueta / Barras de color y tono (Slates / Bars & Tone)​

El inicio y final del video sin negro y silencio (P2P Formatting)

Presentación de los avisos de derechos de autor (Copyright Formatting)

Directrices y Restricciones de Apple Music (Apple Flags)

PROBLEMAS DE AUDIO (AUDIO ISSUES)

Mono Dual (Dual Mono)

Inversión de Fase (Inverse Phase)

Desbalance entre canales (Channel Imbalance)

Audios comprimidos con pérdida de calidad (Lossy Audio Compression)​

ATRIBUTOS TÉCNICOS (TECHNICAL ATTRIBUTES) – VIDEO

Códec de video (Video Codec)

Resolución (Frame Size)​

Relación de aspecto de la pantalla (Display Aspect Ratio-DAR)

Aumento de resolución de un video (Upscaling)

Velocidad de fotogramas (Frame Rate)

Tipo de escaneo / Entrelazado (Scan Type / Interlacing)

Colores Primarios (Color Primaries)

Video HDR vs SDR

Barras negras horizontales (Letterbox)

Barras negras verticales (Pillarbox)

Barras negras en todos los bordes (Windowbox)​

ATRIBUTOS TÉCNICOS (TECHNICAL ATTRIBUTES) – AUDIO

Configuración de audio (Audio Configuration)

Códec de audio (Audio Codec)

Frecuencia de muestreo en el audio / Profundidad de bits (Audio Sample Rate / Bit Depth)

ATRIBUTOS TÉCNICOS (TECHNICAL ATTRIBUTES) – DOLBY ATMOS AUDIO

¿Qué es Dolby Atmos? (What is Dolby Atmos?)

ADM BWF (Audio Definition Model Broadcast Wave Format)

FFOA Primer Cuadro de Acción (FFOA – First Frame Of Action)

Pistas base / Canales de cama (Bed Channels)

Pistas de Objeto / Canales de Objeto (Object Channels)

LFE o Efectos de Baja Frecuencia (Low Frequency Effects)

Modo 5.1 Downmix (5.1 Downmix Mode)

Controles de acortamiento/recorte (Trim controls)

Metadatos binaurales (Binaural Metadata)

Pico real (True Peak)

Volumen integrado (Integrated Loudness)

ATRIBUTOS TÉCNICOS (TECHNICAL ATTRIBUTES) – ARCHIVO (FILE)

Formato contenedor (File Container)​

Archivos corruptos (File Corruption)

Nomenclatura de archivos (File Naming)

MD5 Checksum

PROBLEMAS DE AUDIO
(AUDIO ISSUES)

Fotogramas omitidos (Skipped Frames)

Claqueta / Barras de color y tono (Slates / Bars & Tone)

Audios comprimidos con pérdida de calidad (Lossy Audio Compression)

Resolución (Frame Size)

Barras negras en todos los bordes (Windowbox)

Formato contenedor (File Container)