Nyquist-Shannon-Abtasttheorem
Das Nyquist-Shannon-Abtasttheorem, auch nyquist-shannonsches Abtasttheorem und in neuerer Literatur auch WKS-Abtasttheorem (für Whittaker, Kotelnikow und Shannon) genannt, ist ein grundlegendes Theorem der Nachrichtentechnik, Signalverarbeitung und Informationstheorie. Wladimir Kotelnikow formulierte das Abtasttheorem 1933. Die Veröffentlichung in einem sowjetischen Konferenzbericht wurde im Osten seit den 1950er Jahren referenziert, blieb aber allgemein im Westen bis in die 1980er weitgehend unbekannt. Unabhängig von Kotelnikow formulierte Claude Elwood Shannon es 1948 als Ausgangspunkt seiner Theorie der maximalen Kanalkapazität, d. h. der maximalen Bitrate in einem frequenzbeschränkten, rauschbelasteten Übertragungskanal.[1]
Das Abtasttheorem besagt, dass ein auf bandbegrenztes Signal[2] aus einer Folge von äquidistanten Abtastwerten exakt rekonstruiert werden kann, wenn es mit einer Frequenz von größer abgetastet wurde.
Geschichtliche Entwicklung
Claude Shannon stützte sich auf Überlegungen von Harry Nyquist zur Übertragung endlicher Zahlenfolgen mittels trigonometrischer Polynome und auf die Theorie der Kardinalfunktionen von Edmund Taylor Whittaker (1915) und dessen Sohn John Macnaghten Whittaker (1928).[3] Zu ähnlichen Resultaten wie Nyquist kam Karl Küpfmüller 1928.[4]
Erst die Rechercheure der Eduard-Rhein-Stiftung haben die Priorität (1933) von Wladimir Alexandrowitsch Kotelnikow zweifelsfrei nachgewiesen. Dafür bekam er 1999 den Eduard-Rhein-Preis.
Unabhängig von Kotelnikow formulierte Herbert P. Raabe das Abtasttheorem 1939.[5]
Grundlagen
Das von Shannon formulierte Abtasttheorem besagt, dass eine Funktion, die keine Frequenzen höher als enthält, durch eine beliebige Reihe von Funktionswerten im Abstand eindeutig bestimmt ist. Eine hinreichende Bedingung dafür ist die Quadratintegrierbarkeit der Funktion.
Der Funktionsverlauf kann dann rekonstruiert werden, indem jeder Abtastwert durch eine sinc-Funktion mit gleicher Amplitude ersetzt und anschließend über alle k summiert wird.
In der Signalverarbeitung entspricht dies der Abtastung mit einer Abtastrate . Die so erhaltene Signaldarstellung wird Pulsamplitudenmodulation genannt. Zur Rekonstruktion wird dieses Signal durch einen idealen Tiefpass mit Grenzfrequenz gefiltert.
Bei Nicht-Basisband-Signalen, d. h. solchen mit minimaler Frequenz fmin größer als 0 Hz, gilt das Abtasttheorem in ähnlicher Form, da durch geeignete Wahl der Abtastfrequenz, das Bandpasssignal im Basisband nach der Abtastung erscheint. Die Abtastfrequenz muss dann lediglich größer als die doppelte Bandbreite sein (siehe auch Unterabtastung). Bei der Rekonstruktion wird hier statt eines idealen Tiefpasses ein idealer Bandpass verwendet.
Bei der Unterabtastung eines Bandpasssignals gilt:
In der Praxis wird ein Signal vor der Abtastung meist tiefpassgefiltert, damit die (Basis-)Bandbreite der Abtastrate genügt. Analog gilt das Abtasttheorem auch bei Bildern und Videos, wobei die Abtastfrequenz dann in Linien (bzw. Pixel) pro Längeneinheit bestimmt werden kann.
Anschauung
Wie im Artikel Abtastung (Signalverarbeitung) beschrieben ist, kann man das Abtasten eines Signals durch die Multiplikation mit einem Dirac-Kamm modellieren, wodurch man das abgetastete Signal erhält. Nach der Umkehrung des Faltungstheorems ergibt sich damit die Fouriertransformierte des abgetasteten Signals durch:
wobei periodisch mit der Periode ist und der Abstand zwischen 2 Abtastzeitpunkten ist. Unterschreitet man nun mit der Abtastfrequenz die Frequenz (für Basisbandsignale), so werden niedrigere und höhere Frequenzkomponenten im Frequenzraum überlagert und können anschließend nicht mehr getrennt werden.[6]
Die Dauer eines technischen Abtastpulses ist allerdings nicht beliebig kurz. Deswegen liegt in der Praxis das Frequenzspektrum einer Rechteckpulsfolge vor statt das einer Diracstoßfolge. (Der Diracstoß ist anschaulich eine Funktion, die nur an einer einzigen Stelle (t = 0) unendlich groß ist und an allen anderen Stellen verschwindet. Eine mathematisch saubere Definition erfolgt im Rahmen von Distributionen.)
Erklärung der Begriffe
Bandbeschränktes Signal
Ein in der Bandbreite beschränktes Signal x mit einer maximalen Frequenz F:=fmax ist eine Funktion, für welche die Fouriertransformierte existiert und diese Fouriertransformierte außerhalb des Intervalls Null ist. Dann kann umgekehrt das bandbeschränkte Signal durch die inverse Fouriertransformation der Frequenzdichte dargestellt werden:
- .
„Gute“, zulässige Funktionen für die Frequenzdichte X sind beispielsweise stückweise stetige Funktionen, für die in jedem Punkt beide der einseitigen Grenzwerte existieren. Allgemeiner sind Funktionen aus dem Funktionenraum zulässig.
Ist x reellwertig, so gilt . Wird X in Polarkoordinaten dargestellt, , so erhalten wir x mittels eines Integrals mit reellem Integranden,
- .
In der kartesischen Darstellung ergibt sich analog
- .
Abtasten mit der doppelten Frequenz
Abtasten mit der doppelten Frequenz bedeutet hier, dass Funktionswerte in gleichmäßigen Abständen genommen werden, wobei ein einfacher Abstand beträgt, d. h., aus x wird die Zahlenfolge konstruiert. Nach der Fourierdarstellung ergeben sich diese Werte aus der Frequenzdichte als
- .
Diese sind aber gerade die Koeffizienten in der Fourierreihenentwicklung
Somit ist die Frequenzdichte und damit das Signal schon durch die Werte der Abtastfolge vollständig determiniert.
Rekonstruieren ohne Informationsverlust
Rekonstruieren ohne Informationsverlust bedeutet, dass die Lagrange-Interpolation, ausgeweitet auf den Fall mit unendlich vielen, regelmäßig angeordneten Stützstellen, wieder das Ausgangssignal ergibt
- .
Man beachte, dass man mit diesen Formeln in der Mathematik zwar ausgezeichnet arbeiten kann, sie sich aber in realen Abtastsystemen so nicht realisieren lassen. Zur Bestimmung eines jeden Signalwertes wäre eine Summation über einen unendlichen Bereich notwendig. Außerdem müssten unendlich viele Takte abgewartet werden, bevor die Summation abgeschlossen werden kann. Weil das nicht möglich ist, entstehen in der Praxis unvermeidliche Fehler.
Die Funktion , der Sinus cardinalis (sinc), ist dabei der ideale Interpolationskern für ganzzahlige Stützstellen; es ist sinc(0)=1 und sinc(n)=0 für jedes weitere ganzzahlige n. Die interpolierende Reihe wird auch, nach Whittakers Notation, als Kardinalreihe bezeichnet, dabei bezieht sich die Vorsilbe kardinal auf die herausragende Rolle als „schwankungsärmste“ unter allen interpolierenden Funktionenreihen. Die sinc-Funktion hat, bis auf einen Faktor, die Rechteck-Funktion als Fourier-Transformierte, diese hat den Wert 1 auf dem Intervall , sonst den Wert Null. Sie ist also bandbeschränkt mit höchster Frequenz 1/2.
Die Entwicklung als Kardinalreihe ergibt sich nun ganz natürlich, indem die Fourierreihe der Frequenzdichte in die inverse Fouriertransformation eingesetzt wird,
Signal in Bandpasslage
Ein reelles Signal in Bandpasslage muss, um Abtastung durch Funktionswerte zu erlauben, eine nur für Frequenzen aus dem Intervall nicht verschwindende Fourier-Transformierte haben. Dann ist F die einseitige Bandbreite. Dieses kann auf Frequenzbänder beliebigen Zuschnitts verallgemeinert werden, allerdings ist dann das Abtasten nicht durch Funktionswerte, sondern durch Skalarprodukte zu definieren. Ein Beispiel dafür ist das Frequenzmultiplexverfahren, siehe auch OFDM.
Bemerkung: Kein endliches Signal, d. h., keine Funktion mit einem endlichen Träger erfüllt die Voraussetzungen an eine bandbeschränkte Funktion. Ebenso wenig fallen periodische Signale, wie zum Beispiel reine Sinusschwingungen, in den Bereich dieses Theorems; genauso wenig Signale mit Unstetigkeiten (Knicken oder Sprüngen im Verlauf). Es ist somit als ideale Aussage in einer idealen Situation zu betrachten. Dem Ideal am nächsten kommen modulierte Schwingungen, wie Musik- oder Sprachaufzeichnungen, die zur Weiterverarbeitung digitalisiert werden sollen. Für andere praktische Zwecke, z. B. digitale Bildbearbeitung, müssen Varianten des Abtasttheorems mit nicht ganz so starken Anforderungen gefunden werden, für die dieses Theorem dann Richtschnur ist.[7]
Mathematischer Hintergrund
Zu mathematischen Grundlagen siehe: Lebesgue-Integral, Lebesgue-Raum, Fourier-Transformation.
Durch Skalieren der Zeitabhängigkeit kann jedes bandbeschränkte Signal x(t) auf den Frequenzbereich [-½; ½], bzw. [-π; π] als Kreisfrequenzbereich, reduziert werden. Die Frequenzdichte g(f) muss eine Funktion beschränkter Variation sein, wie es zum Beispiel stückweise stetige Funktionen sind. Dann ist x(t) eine stetige, beliebig oft differenzierbare, absolut- und quadratintegrable Funktion, , und hat eine Fourier-Transformierte mit Träger .
Der Funktionswert x(t) an jedem beliebigen Punkt t ist unter diesen Voraussetzungen schon allein durch die Funktionswerte x(n) an allen ganzzahligen Punkten t=n festgelegt, es gilt:
- .
Diese Gleichung enthält zwei nichttriviale Aussagen: 1) Die unendliche Reihe konvergiert, und 2) der Grenzwert ist immer identisch mit dem Funktionswert x(t).
Die Identität einer bandbeschränkten Funktion mit ihrer oben angegebenen Kardinal-Reihe (nach Whittaker) ergibt sich aus der Poissonschen Summenformel, es gilt
woraus sich nach der Formel der Inversen Fourier-Transformation Durch geschickte Anwendung der allgemeinen Abtastformel kann man auch verallgemeinerte Kardinalreihenentwicklungen erhalten, zum Beispiel
d. h., die Abtastrate ist halbiert, dafür werden an jedem Abtastpunkt zwei Werte genommen, der Funktionswert und die erste Ableitung. Es wird gewissermaßen lokal linear entwickelt und die Entwicklungen mittels einer Zerlegung der Eins „zusammengeklebt“. Formeln mit Ableitungen höherer Ordnung erlauben keine so einfache Interpretation.[8] Ist f bandbeschränkt auf Kreisfrequenzen aus dem Intervall und sind paarweise verschiedene reelle Zahlen, so gilt Der erste Faktor im Summanden ist die Kernfunktion einer Zerlegung der Eins, der zweite Faktor ein Interpolationspolynom, das der Lagrange-Interpolation ähnlich sieht. Lässt man die ak simultan nach 0 laufen und ersetzt durch das Taylor-Polynom vom Grad N-1 oder größer, so ergeben sich beliebig komplexe differentielle Kardinalreihen. |
Tiefpass zur Verhinderung von Aliasing
Wird die Abtastfrequenz zu klein gewählt, treten im digitalisierten Signal Mehrdeutigkeiten auf. Diese nichtlinearen Verzerrungen sind auch unter dem Begriff Alias-Effekt bekannt. Bei Bildern treten eventuell phasenverschobene Schatten oder neue Strukturen auf, die im Original nicht enthalten sind.
Den unteren Grenzwert der Abtastfrequenz für ein analoges Signal der Bandbreite
nennt man auch Nyquist-Rate. Die höchste zu übertragende Frequenz muss demnach kleiner sein als die halbe Abtastfrequenz, sonst entstehen Aliasingfehler. Aus diesem Grund werden höhere Frequenzen aus dem analogen Signal mit einem Tiefpass herausgefiltert. Die Aliasingfehler sind Alias-Signale (Störsignale, Pseudosignale), die sich bei der Rekonstruktion als störende Frequenzanteile bemerkbar machen. Wird zum Beispiel ein Sinussignal, das eine Frequenz von 1600 Hz hat, mit einer Abtastfrequenz von 2000 Hz digitalisiert, erhält man ein 400-Hz-Alias-Signal (2000–1600 Hz). Bei einer Abtastfrequenz über 3200 Hz entsteht dagegen kein Alias-Signal. Eine Abtastfrequenz von bspw. 3300 Hz führt zu einem Differenzsignal von 1700 Hz (3300–1600 Hz). Dieses ist jedoch größer als die halbe Abtastrate und wird demnach bei der Rekonstruktion durch einen Tiefpass entfernt.
In der Praxis gibt es keinen idealen Tiefpass. Er hat immer einen gewissen Übergangsbereich zwischen praktisch keiner Dämpfung im Durchlassbereich und praktisch vollständiger Dämpfung im Sperrbereich. Daher verwendet man in der Praxis eine modifizierte Formel zur Bestimmung der Abtastfrequenz:
Beispiel:
Auf einer CD wird ein Signal gespeichert, das durch die Digitalisierung eines analogen Audiosignals mit Frequenzen bis 20 kHz erzeugt wird. Die Frequenz, mit der das analoge Audiosignal abgetastet wird, beträgt 44,1 kHz.
Der verwendete Faktor ist abhängig vom verwendeten Tiefpassfilter und von der benötigten Dämpfung der Alias-Signale. Andere gebräuchliche Faktoren sind 2,4 (DAT, DVD) und 2,56 (FFT-Analysatoren).
Überabtastung
Wenn man eine höhere Abtastfrequenz wählt, erhält man keine zusätzlichen Informationen. Der Aufwand für Verarbeitung, Speicherung und Übertragung steigt jedoch. Trotzdem wird Überabtastung (englisch oversampling) in der Praxis angewendet. Liegt nämlich die Nutzbandbreite B sehr nahe bei der halben Abtastfrequenz, so werden hohe Anforderungen an die Flankensteilheit des Tiefpassfilters gestellt. Mit höherer Abtastfrequenz erreicht man eine ausreichend hohe Dämpfung im Sperrbereich eines Tiefpasssystems einfacher als mit einem hochwertigen Filter. Die Bandbegrenzung kann dann auf ein Digitalfilter hoher Ordnung verlagert werden. In der Praxis wird häufig ein Überabtastungsfaktor M = 2 oder M = 4 gewählt. Somit braucht man weniger steile analoge Filter vor dem Abtasten. Nach der ersten Abtastung wird dann ein digitaler Filter vor der folgenden Abtastratenreduktion eingesetzt, womit die Abtastfrequenz nachträglich gesenkt wird. Dieses digitale Filter wird auch als Dezimationsfilter bezeichnet. Es kann beispielsweise in Form eines Cascaded-Integrator-Comb-Filters realisiert werden.
Mathematisch ausgedrückt hat ein idealer Tiefpassfilter als Übertragungsfunktion eine Rechteckfunktion. Diese Übertragungsfunktion schneidet das Spektrum im Frequenzraum perfekt ab und das gefilterte Signal kann perfekt aus den Abtastpunkten rekonstruiert werden. Allerdings lässt sich ein ideales Tiefpassfilter nicht praktisch realisieren, da es nicht kausal und unendlich lang ist.
Deswegen verwendet man analoge Tiefpassfilter, welche eine stetige, trapezähnliche Übertragungsfunktion aufweisen und deren Flanken mit kontinuierlicher, endlicher Steigung zu- bzw. abnehmen. Diese Filter können beispielsweise in Form von Butterworth-Filtern realisiert werden. Nach dem Abtasten erfolgt die digitale Glättung und das Heruntertakten auf die Nutzbandbreite. Die Flankensteilheit hat dabei einen Einfluss auf die Güte des rekonstruierten Signals.
Unterabtastung
Die Bedingung aus dem Abtasttheorem ist eine vereinfachte Darstellung, die allerdings sehr gebräuchlich und nützlich ist. Genau genommen muss anstelle von die Bandbreite stehen, die durch den Bereich zwischen niedrigster und höchster im Signal vorkommenden Frequenz definiert ist. Nur in Basisbandsignalen ist die Bandbreite mit identisch, Basisbandsignale sind Signale mit niederfrequenten Anteilen in der Nähe von 0 Hz.
Diese Erkenntnis führte zu einem Konzept namens Bandpassunterabtastung (oder sub-nyquist sampling), das zum Beispiel in digitaler Radiotechnik Verwendung findet. Angenommen, man möchte alle Radiosender empfangen, die zwischen 88 und 108 MHz senden. Interpretiert man das Abtasttheorem wie bisher beschrieben, so müsste die Abtastfrequenz über 216 MHz liegen. Tatsächlich wird aber durch die Technik der Unterabtastung nur eine Abtastfrequenz von etwas mehr als 40 MHz benötigt. Voraussetzung dafür ist, dass vor der Abtastung aus dem Signal mittels Bandpassfilter alle Frequenzen außerhalb des Frequenzbereichs von 88 bis 108 MHz entfernt werden. Die Abtastung erfolgt beispielsweise mit 44 MHz, ohne dass der relevante Bereich von einem analogen Mischer umgesetzt würde – das Ergebnis ist quasi ein Alias-Signal und entspricht dem Signal, das bei Abtastung eines per Mischer auf 0–22 MHz umgesetzten Bereichs entstünde.
Um in der Praxis die notwendige punktförmige Abtastung wenigstens näherungsweise realisieren zu können, muss die Abtast-Halte-Schaltung jedoch derart ausgelegt werden, dass das Ausleseintervall so eng wird, wie es für eine Abtastfrequenz von 220 MHz oder mehr vonnöten wäre. Zu vergleichen ist das mit einer Abtastung mit 220 MHz, von der nur jeder fünfte Wert weiterbenutzt wird, während die je vier dazwischenliegenden Abtastwerte verworfen werden.
Siehe auch
Literatur
- Harry Nyquist: Certain Topics in Telegraph Transmission Theory. In: Transactions of the American Institute of Electrical Engineers. Vol. 47, 1928, ISSN 0096-3860, S. 617–644 (Wiederabdruck in: Proceedings of the IEEE. Vol. 90, No. 2, 2002, ISSN 0018-9219, S. 617–644).
- J. R. Higgins: Five short stories about the cardinal series. In: Bulletin of the American Mathematical Society. NS Vol. 12, No. 1, 1985, S. 45–89.
- Michael Unser: Sampling – 50 Years after Shannon. In: Proceedings of the IEEE. Vol. 88, No. 4, 2000, S. 569–587, (online).
- Wolfgang Wunderlich: Digitales Fernsehen HDTV, HDV, AVCHD für Ein- und Umsteiger. Auberge-tv Verlag, Hohen Neuendorf 2007, ISBN 978-3-00-023484-2.
Weblinks
- Interaktive Darstellung der Abtastung und der Signalrückgewinnung in einer Webdemo Institut für Nachrichtenübertragung der Universität Stuttgart
Einzelnachweise
- ↑ Claude Elwood Shannon: Communication in the Presence of Noise (PDF; 301 kB). In: Proc. IRE. Vol. 37, No. 1, 1949 (Nachdruck in: Proc. IEEE. Vol. 86, No. 2, 1998)
- ↑ Algorithmic Information Theory: Mathematics of Digital Information Processing, Peter Seibt, Springer, 2006, ISBN 3-540-33219-7, S. 216 (eingeschränkte Vorschau in der Google-Buchsuche).
- ↑ J. M. Whittaker: The “Fourier” Theory of the Cardinal Function. In: Proceedings of the Edinburgh Mathematical Society (Series 2). Band 1, Nr. 03, 1928, S. 169–176, doi:10.1017/S0013091500013511.
- ↑ K. Küpfmüller: Über die Dynamik der selbsttätigen Verstärkungsregler. In: Elektrische Nachrichtentechnik. Bd. 5, Nr. 11, 1928, S. 459–467.
- ↑ Hans Dieter Lüke: The Origins of the Sampling Theorem, IEEE Communications Magazine, S. 106–108, April 1999. Online-Version (PDF; 53 kB).
- ↑ Thomas Görne: Tontechnik. Hanser Verlag, 2008, ISBN 3-446-41591-2, S. 153 (eingeschränkte Vorschau in der Google-Buchsuche).
- ↑ vgl. Michael Unser: Sampling – 50 Years after Shannon. In: Proceedings of the IEEE. Vol. 88, No. 4, 2000, S. 569–587.
- ↑ siehe J. R. Higgins: Five short stories about the cardinal series. In: Bulletin of the American Mathematical Society. NS Vol. 12, No. 1, 1985, S. 45–89.