Cómo obtener los mejores resultados con EVOC 20 PolySynth

Conseguir un gran efecto vocoder “clásico” requiere que las señales de análisis y síntesis sean de calidad excelente, y también requiere que se tenga cuidado con los parámetros de vocoder. Estas secciones ofrecen varios consejos que le ayudarán a lograr los mejores resultados posibles.

Cómo editar las señales de análisis y síntesis de EVOC 20 PolySynth

La siguiente sección describe cómo se pueden editar las señales de análisis y síntesis para mejorar la inteligibilidad del habla.

Cómo comprimir la señal de análisis de EVOC 20 PolySynth

Cuanto menos cambie el nivel, mejor será la inteligibilidad del vocoder. Consecuentemente, se debe comprimir la señal de análisis en la mayoría de los casos.

Amplificación de la energía de frecuencias altas

En cierto sentido, el vocoder genera siempre el punto de intersección de las señales de análisis y síntesis. si la señal de análisis no tiene agudos, la salida resultante del vocoder tampoco tendrá agudos. Lo mismo ocurre si la señal de síntesis presenta un elevado contenido de frecuencias altas. Puesto que esto es así para cada banda de frecuencia, el vocoder requiere un nivel estable en todas las bandas de frecuencia de ambas señales de entrada para obtener los mejores resultados.

Debido al funcionamiento del oído humano, la inteligibilidad del habla depende en gran medida de la presencia de contenido de frecuencias altas. Para que el habla sea clara, vale la pena usar la ecualización para amplificar o cortar determinadas frecuencias en las señales de análisis antes de procesarlas con vocoders.

Si la señal de análisis consta de voces o partes habladas, un sencillo filtro de shelving debería ser suficiente para realzar el intervalo alto-medio y el intervalo de agudos, que es muy importante para poder hablar de forma inteligible.

Si la señal de síntesis carece de energía de agudos, esta se puede generar con un efecto de distorsión. Overdrive de Logic Pro es el efecto ideal para conseguir este objetivo.

Cómo evitar los artefactos sónicos en EVOC 20 PolySynth

Un problema muy común con los sonidos de vocoder son las interrupciones de señal repentinas (sonidos distorsionados y entrecortados) y los sonidos accionados rápidamente durante las pausas del habla.

Uso eficaz de los parámetros Envelope en la sección Analysis

El parámetro Release define el tiempo necesario para que una banda de frecuencia de síntesis determinada puede bajar de nivel, si la señal de la banda de análisis correspondiente disminuye bruscamente. El sonido es más suave cuando los niveles de banda disminuyen lentamente. Para lograr esta mayor suavidad, se deben usar valores de Release altos en la sección análisis de la interfaz. No vaya demasiado lejos con este parámetro, porque unos tiempos de liberación excesivamente largos pueden producir un sonido “aguado”, menos distinguible.

Los valores de Attack cortos no representan ningún problema. De hecho, incluso pueden ser deseables si se desea una reacción rápida a señales de entrada.

Puertas y ruidos de fondo en la señal de análisis

Si se comprime la señal de análisis, tal como se recomienda, aumentará el nivel de respiración, rumores y ruido de fondo. Estas señales no deseadas pueden hacer que las bandas del vocoder se abran accidentalmente. Para eliminar estos artefactos, puede utilizar efecto “Noise Gate” antes de utilizar la compresión para realzar las frecuencias de agudos. Si se aplica una puerta a la señal de análisis de forma apropiada, es posible que se desee reducir el valor de Release (Analysis).

Al utilizar habla y voces con el módulo “Noise Gate” de Logic Pro, utilice Threshold para definir el nivel por encima del cual la puerta se abrirá y utilice Hysteresis para definir un nivel de Threshold inferior, por debajo del cual la puerta se cerrará. El valor de Hysteresis es relativo al nivel de Threshold.

La figura anterior muestra un ajuste de Threshold adecuado para la comprensión del habla. Los filtros de cadena lateral asignados a las puertas de ruido evitan los accionamientos indeseados provocados por ruidos de frecuencias altas o bajas. Los valores de Hold, Release e Hysteresis son adecuados para la mayor parte de las señales de voces y habla.

Cómo mejorar la inteligibilidad del habla en EVOC 20 PolySynth

Recuerde estas indicaciones cuando intente lograr la mayor inteligibilidad posible del habla:

Los espectros de las señales de análisis y síntesis deben superponerse prácticamente por completo. Las voces masculinas acopladas no funcionan bien con señales de síntesis en el intervalo de agudos.

La señal de síntesis debe sostenerse constantemente sin interrupciones. La señal de cadena lateral entrante debe tocarse o cantarse en legato, ya que las interrupciones en la señal de síntesis detendrán la salida del vocoder. Como alternativa, el parámetro Release de la señal de síntesis (no el tiempo de Release de la sección Analysis) puede ajustarse a un tiempo más largo. También se conseguirá un buen efecto si se usa una señal de reverberación como señal de síntesis. Hay que tener en cuenta que estos dos modelos pueden provocar la superposición de armónicos.

No se debe saturar el vocoder. Esto puede ocurrir con mucha facilidad y el resultado quedará distorsionado.

Pronuncie claramente si la grabación va a ser usada como señal de análisis. El texto hablado, con un tono relativamente bajo, funciona mejor que las voces cantadas, incluso si se desean crear coros de vocoder. Pronuncie bien las consonantes, tal y como se ejemplifica en la “R” fuerte de “We are the Robots”, de Kraftwerk, una pista de vocoder clásica. Esta pronunciación exagerada fue creada específicamente para cumplir con las exigencias del vocoder.

Experimente con toda libertad el ajuste de los parámetros Formant. La inteligibilidad del habla se ve sorprendentemente poco afectada por la modificación, expansión o compresión de los formantes. Incluso el número de bandas de frecuencia usadas tiene una influencia mínima en la calidad de la inteligibilidad del habla.

El motivo es nuestra capacidad para diferenciar intuitivamente las voces de niños, mujeres y hombres, cuyos cráneos y gargantas son muy distintos por naturaleza. Esas diferencias físicas causan variaciones en los formantes que crean sus voces. Nuestra percepción, o reconocimiento, del habla se basa en un análisis de las relaciones entre estos formantes. En los módulos de EVOC 20, estas relaciones permanecen intactas, incluso si se usan ajustes extremos de formantes.