Um einen guten "klassischen" Vocoder-Effekt zu erhalten, müssen sowohl das Analyse- als auch das Synthese-Signal von hervorragender Qualität sein. Zudem müssen die Vocoder-Parameter sorgfältig eingestellt werden. Der folgende Abschnitt enthält einige Tipps, die Ihnen beim Erzielen optimaler Ergebnisse helfen.
Bearbeiten des Analyse- und Synthesesignals im EVOC 20 PolySynth
Abrisse und Fehlauslösungen im EVOC 20 PolySynth
Oszillator-Parameter im FM-Modus des EVOC 20 PolySynth
Der folgende Abschnitt verdeutlicht, wie Sie die Analyse- und Synthesesignale für eine bessere Sprachverständlichkeit bearbeiten können.
Grundsätzlich ist die Sprachverständlichkeit umso besser, je weniger der Pegel schwankt. Deshalb empfiehlt es sich in den meisten Fällen, das Analysesignal zu komprimieren.
Der Vocoder erzeugt immer so etwas wie die Schnittmenge des Analyse- und Synthesesignals. Enthält das Analysesignal keine Höhen, werden diese nicht wiedergegeben, auch wenn das Synthesesignal reich an Höhen ist. Auch der umgekehrte Fall führt dazu, dass keine Höhen ausgegeben werden. Da dies für jeden Frequenzbereich gilt, wird von beiden Signalen grundsätzlich ein möglichst stabiler Pegel in allen Frequenzbereichen beider Input-Signale gefordert.
Aufgrund der Art und Weise, wie wir Menschen hören und verstehen, ist die Sprachverständlichkeit stark vom Höhenanteil abhängig. Um die Deutlichkeit der Aussprache zu erhöhen, kann es deshalb sinnvoll sein, die hohen Frequenzbereiche des Analysesignals anzuheben, bevor es den Vocoder durchläuft.
Wenn das Analysesignal Sprache oder Gesang ist, reicht ein einfaches Shelving-Filter aus, um die Höhen und hohen Mitten anzuheben, die für die Sprachverständlichkeit so wichtig sind.
Wenn das Synthesesignal arm an Obertönen ist, kann mithilfe eines Verzerrers leicht ein dichtes Spektrum erzeugt werden. Dazu bietet sich z. B. der Overdrive-Effekt in an.
Eine typische Störung des Vocoder-Sounds sind ruckartig abreißende Silben oder ein plötzliches Aufbrechen des Klangs in Sprachpausen.
Der Release-Parameter bestimmt, wie schnell der Pegel eines Synthesis-Frequenzbands abnimmt, wenn der Pegel des entsprechenden Analysesignals schlagartig abnimmt. In der Praxis ist das Klangbild ruhiger und ausgeglichener, wenn Synthesis-Bänder langsamer ausklingen. Wählen Sie hierfür höhere Release-Werte im Analysis-Bereich der Bedienungsoberfläche. Übertreiben Sie es aber nicht, denn zu lange Release-Werte führen zu einem konturlosen, verwaschenen Sound.
Kurze Werte für "Attack" sind unproblematisch. Für eine schnelle Reaktion auf eingehende Signale sind sie sogar erwünscht.
Wenn das Analysesignal wie empfohlen komprimiert wird, steigt auch der Pegel von Atem-, Rumpel- und Hintergrundgeräuschen. Diese Störsignale können die Frequenzbänder des Vocoders öffnen, obwohl dies nicht erwünscht ist. Um solche Artefakte zu minimieren, können Sie ein Noise Gate vor der Kompression und der Höhenanhebung einsetzen. Bei einem entsprechend gegateten Analysesignal können Sie u. U. auch die Release-Zeit wieder verkürzen.
Wenn Sie Sprache oder Gesang mit dem Noise-Gate-Plug-In in gaten, stellen Sie mit Threshold die Pegelschwelle ein, über der das Gate öffnet. Mit Hysteresis wählen Sie eine niedrigere Pegelschwelle, unter der das Gate schließt. Der Hysteresis-Wert ist relativ zum Threshold.
Die obige Abbildung zeigt eine Threshold-Einstellung, die für die Sprachkomprimierung geeignet ist. Fehlauslösungen durch tiefes oder hohes Frequenzrauschen werden durch das Side-Chain-Filter des Gate-Plug-Ins vermieden. Die Hold-, Release-, und Hysteresis-Werte eignen sich für die meisten Gesangs- und Sprachsignale.
Sie sollten auf die folgenden Punkte achten, um eine gute Sprachverständlichkeit zu gewährleisten:
Die Spektren der Analyse- und Synthesesignale müssen sich möglichst vollständig überlappen. Tiefe Männerstimmen mit hohen Synthesesignalen führen naturgemäß zu unbefriedigenden Resultaten.
Das Synthesesignal muss durchgehend klingen. Das eingespeiste Side-Chain-Signal sollte legato gespielt oder gesungen sein, da Lücken im Synthese-Signal auch zu Lücken im Ausgangssignal des Vocoders führen. Alternativ kann der Release-Parameter des Synthesesignals (nicht die Release-Zeit des Analysis-Bereichs) lang gewählt werden. Interessant ist auch die Verwendung eines Halls als Synthesesignal. Die beiden letzteren Verfahren führen allerdings zu harmonischen Überlappungen.
Achten Sie darauf, den Vocoder nicht zu übersteuern. Dies passiert relativ leicht und es treten Verzerrungen auf.
Achten Sie auf eine deutliche Aussprache, wenn die Aufnahme als Analysesignal verwendet werden soll! Das mit relativ tiefer Stimme gesprochene Wort führt zu besseren Resultaten als ein gesungenes Wort, selbst wenn Sie Vocoder-Chöre erzeugen möchten! Konsonanten sollten deutlich intoniert werden. Ein schönes Beispiel hierfür ist der Flatterlaut des gerollten "R" beim Vocoder-Titel "Wir sind die Roboter" der Gruppe Kraftwerk. Hier wurde Vocoder-gerecht gesprochen.
Große Freiheit herrscht bei den Formant-Parametern: Das Verschieben, Dehnen oder Komprimieren der Formanten hat einen erstaunlich geringen Effekt auf die Sprachverständlichkeit. Auch die Anzahl der Frequenzbänder wirkt sich überraschend wenig auf die Sprachverständlichkeit aus.
Der Grund hierfür liegt in unserer Fähigkeit, die Stimmen von Kindern, Frauen und Männern erkennen zu können, deren Schädelgrößen stark variieren. Entsprechend groß sind die Abweichungen der Formanten bei verschiedenen Sprecher/innen und Sänger/innen. Unsere Spracherkennung beruht auf der Analyse der relativen Beziehungen zwischen diesen Formanten. Diese Beziehungen bleiben auch bei extremen Einstellungen der EVOC 20 Plug-Ins noch gut erhalten.