Portada del artículo 'Cómo resaltar la voz en la mezcla'

Cómo resaltar la voz en la mezcla

Por Jorge Rozas

- enero 02, 2026 - 11 minutos de lectura

Sin lugar a dudas la voz en la música popular es uno de los elementos más importantes, que los oyentes prestan más atención.

Por ese motivo es necesario tomar todos los recaudos para hacer que resalte y suene pulido siempre. En este artículo te vamos a mostrar algunas de las mejores formas de resaltar la voz en la mezcla.

Antes de comenzar

No se puede hablar de una buena mezcla de voces sin antes haber tenido una etapa de grabación de voces de alta calidad.

Dentro de los aspectos cruciales para obtener una grabación sólida de voces están los siguientes:

  • Elección del micrófono: de ser posible tenemos que elegir un micrófono que complemente el timbre y características armónicas de la voz a registrar. Si por ejemplo la voz tiene mucha carga de brillo y agudos es preferible usar un micrófono más opaco, que no resalte el brillo. De esta forma complementamos el timbre de la voz a la hora de captar y evitamos problemas luego.
  • Captación del sonido puro: al momento de grabar hay que recordar que el micrófono capta el sonido directo o puro de la voz y las reflexiones del sonido con las superficies de la sala. Es primordial procurar tener un balance mayoritario del sonido directo para evitar coloraciones indeseables en la captación.
  • Tratamiento acústico: de la mano con el anterior punto suele ser muy deseable trabajar en una sala con un buen tratamiento acústico para evitar ecos flotantes, reflexiones molestas y efecto peine, además de una reverberación excesiva.
  • Uso de accesorios: recuerda siempre usar un buen filtro anti pop y pie de micrófono para que la grabación sea lo más pura posible. Si el micrófono es de condensador piensa en usar los soportes anti vibratorios que suelen proveer los fabricantes, para evitar registrar vibraciones innecesarias.
  • Grabar tomas buenas: una buena grabación de voz requiere que el talento tenga buena capacidad de afinación, rítmica y técnica vocal. Por encima de las características técnicas recuerda siempre buscar captar una interpretación musical, que transmita emociones.

La previa a la mezcla: edición correctiva

Una vez tenemos una gran captación de voces es necesario pulir las aristas de lo que hayamos grabado con la llamada edición correctiva.

Cuando hablamos de esta etapa nos referimos a la corrección de defectos de la afinación y cualquier movimiento indeseable en el tiempo.

La diferencia entre una canción que fue editada correctamente y una que no es que la que fue editada suena como que ya ha sido mezclada.

  • Edición en el tiempo: un factor determinante para que las voces en una canción suenen pulidas y grandes es que a medida que apilamos tomas y voces, rítmicamente sean cohesivas. En el mundo de la música popular esto significa corregir cualquier desplazamiento grande al pulso ideal de la voz principal y cuadrar la rítmica de las voces de coro con la principal.
  • Afinación de voces: el estandard de las voces a nivel profesional tiene mucho que ver con una afinación perfecta, lo que se logra concretar con los programas de afinación como el Autotune o el Melodyne.

Imagen: plugin de afinación de voces Melodyne de la firma Celemony. Este tipo de herramientas permite retocar la afinación de las voces y otros parámetros como la modulación y la duración de notas. 

Una vez tenemos las voces editadas nos daremos cuenta que el sonido tiene características pulidas y un sonido más limpio en general, lo que hara que la ecualización sea tarea mucho más fácil.

Limpieza de frecuencias al mezclar voces

Armados con nuestra toma maestra vocal y con la pista pulida con edición podemos pasar a la siguiente etapa que es propiamente mezcla.

La mezcla de voces consiste en combinar las voces con el resto de elementos que tenga la producción de una forma coherente y armoniosa.

La forma idónea de aproximar la mezcla de voces es quitando todo lo que no aporta antes de agregar cosas, por ejemplo en el ámbito de la frecuencia.

  • Remover la basura: para lograr voces claras y limpias es necesario primeramente quitar aquellas frecuencias que no aporten al contexto de mezcla. En las voces lo más común es tener que acudir a un filtro pasa altos o High Pass Filter, donde cortamos frecuencias por encima de una frecuencia de corte. De forma simple vamos a ubicar la frecuencia de corte entre 80-100 Hz, de tal forma de dejar espacio al bajo, bombo, etc.
  • Ecualización de corrección: normalmente las voces tienen frecuencias que estorban para obtener un buen resultado. Ejemplo de esto es la zona de 200-400 Hz, donde se manifiesta un sonido turbio o la zona nasal entre 500-700 Hz. Revisa las zonas perjudiciales en la voz para atenuar aquellas frecuencias que estorban con ecualización sustractiva usando un ecualizador paramétrico.

Ya con la voz libre de ruidos de baja frecuencia y zonas espurias dentro del espectro se puede proceder a resaltar aquello que suena bien.

Imagen: ecualizador configurado como filtro pasa altos y con una curva de ecualización sustractiva en los medios bajos pensada en limpiar frecuencias.

Que no se pierda un instante

Además de hacer que la voz destaque limpiando frecuencias innecesarias, otra forma de obtener el resultado deseado es usando compresión.

El objetivo de la compresión es hacer que la interpretación vocal sea estable en el nivel, no se dispare o quede enterrada en la mezcla.

Para eso podemos usar más de una etapa de compresión con diferentes objetivos y ajustes.

  • Compresión de picos: es cuando el compresor actúa sobre los instantes de mayor intensidad de señal de forma rápida. Para ello se emplean constantes de tiempo rápidas, razón de compresión de 4:1 o mayor, modo hard knee y se ubica el umbral para que solo los picos encima de eso activen la compresión.
  • Compresión de balance: también llamada compresión RMS se logra cuando el compresor actúa sobre el promedio de la señal para conseguir un mejor balance o solidez interna en la interpretación. Para conseguirlo se debe ajustar el compresor con una razón baja 2:1 o menor, constantes de tiempo más lentas en torno a los 50-100 ms, modo soft knee y el umbral para que el compresor actúe más tiempo.

Imagen: compresor configurado para controlar picos de la voz, en formato compresión de picos.

Imagen: compresor configurado para dar más balance a la voz, en formato compresión RMS.

Resaltando lo bueno de la voz

Hay varias técnicas para lograr resaltar la voz dentro de una mezcla, ya sea trabajando el ámbito de la frecuencia, armónicos o incluso cediendo espacio en otros elementos que compiten.

Veamos algunas de las técnicas más usadas para conseguir realzar la voz en una producción.

Ecualización aditiva

Una vez tenemos un timbre de voz balanceado en la frecuencia, donde no hay frecuencias molestas, podemos buscar las zonas que suenan bien para realzarlas.

Si precisamos una voz con más peso o cuerpo, podemos agregar frecuencias en los graves, debajo de 160 Hz. Con ello conseguimos una voz más profunda. Para este fin se puede usar una curva shelving de bajos. 

Un lugar para realzar es la zona de los medios donde está la inteligibilidad de la palabra entre 3-6 kHz, para ello se puede usar ecualización con un ancho de banda más generoso para que suene de forma musical. 

Otra zona candidata para añadir un poco de condimento son las altas frecuencias por encima de 8 kHz, esta zona se suele conocer como aire.

Imagen: ecualizador configurado para dar realce a zonas estratégicas de la voz. En el ejemplo se uso una curva shelving de bajos para dar más cuerpo, una curva de medios campana para realzar la presencia y una curva de altas frecuencias shelving para realzar el aire a la voz.

Agregando armónicos

Otra manera de destacar la voz entre los demás elementos es mediante el agregado de armónicos via un saturador o distorsionador por ejemplo.

La idea es agregar frecuencias medias y agudas, sin alterar el cuerpo o los graves de la voz. Para lograr esto se debe configurar en paralelo o mediante el wet dry de un plugin que permita hacer esta operación.

Cuando configuramos el envío en paralelo se sugiere cargar un filtro pasa altos, para delimitar el contenido al que le agregamos distorsión.

Lo ideal en este punto es quitar los graves a la pista donde tenemos los armónicos y quedarse solo con el contenido en frecuencias medias altas y agudas.

Imagen: ejemplo de procesamiento en paralelo para destacar la voz. La cadena consiste en un filtro pasa altos configurado en 500 Hz y un distorsionador a continuación. El objetivo es agregar armónicos de manera selectiva en los medios y agudos.

Otras ideas para realzar la voz

Ya cubrimos algunos de los puntos esenciales para lograr una voz que resalte en la mezcla y se situe en un plano sonoro privilegiado en la producción.

Ahora es momento de poner sal y pimienta con otras ideas interesantes para conseguir un paso extra.

Generar espacio en elementos que compiten

La mezcla significa combinar numerosas fuentes sonoras, entre ellas la voz y otras que compiten contra la voz. Tal es el caso de teclados, guitarras, sintetizadores, entre otros. Para reducir el enmascaramiento podemos probar ecualizar quitando frecuencias que son esenciales para la voz en los elementos que compiten directamente.

Aplicar una pizca de ducking

El ducking es una técnica donde usamos un compresor donde vamos a atenuar una señal en función de otra. Por ejemplo atenuamos el bajo cuando aparece el bombo o las guitarras cuando está el tambor.

Si bien el uso tradicional del ducking es con los elementos antes mencionados se puede experimentar esta técnica atenuando los elementos que compiten contra la voz.

Un ejemplo sería colocar un compresor en el grupo de guitarras, donde las va a atenuar cada vez que aparece la voz. La clave está en que sea poca cantidad de atenuación y que las constantes de tiempo sean sutiles y no genere efecto de bombeo.

Cuida los efectos de tiempo

De nada sirve tener la voz cuidada en todos los aspectos anteriores si colocamos un baño de reverb y terminamos con una voz lejana, oscura y sin claridad.

Al momento de usar efectos de tiempo ten en cuenta de hacerlo en paralelo, para tener independencia entre la voz y el efecto.

Además si usas reverb cuida los parámetros de tiempo de decaimiento y sobre todo el pre-delay, para generar un espacio entre el sonido directo y la reverb, de tal forma de obtener un sonido claro en la voz y con la profundidad adecuada de la reverb.

Imagen: reverb configurado con un pre-delay generoso de 80 milisegundos y un corte en bajas frecuencias en 160 Hz, para evitar ensuciar la mezcla.

Conclusiones

La voz en muchas producciones es el elemento principal que el oyente escucha y le presta atención. Por ese motivo necesita de nuestra mayor atención.

Contrario a lo que uno podría pensar es necesario preparar desde la etapa inicial la manera en la que se graba, edita y prepara la voz para que pueda resaltar y combinar bien con el resto de instrumentos.

En el artículo abordamos las diferentes estrategias para destacar con: filtros, ecualización, distorsión en paralelo, ecualización complementaria y otros conceptos.

Lo más importante en todo esto es la experimentación para lograr el resultado deseado con las voces y hacer que destaquen en la mezcla.