Analogtechnik und Digitalisierung von Audio und Video Grundlagen
- Slides: 51
Analogtechnik und Digitalisierung von Audio und Video Grundlagen
Allgemein n Physikalische Größen n Schall, Helligkeit oder Temperatur Umwandlung in Spannungswerte die den physikalischen Größen proportional sind (analoge Signale). Diese analogen Signale müssen dann digitalisiert werden.
Audio n Der Begriff Audio stammt von dem lateinischen Wort audire (hören) und dient als Sammelbegriff für akustisch wahrnehmbare Signale.
Töne n n Es existieren viel mehr Töne, als wir hören können, aber wir nehmen nur ein Teil dieser Töne wirklich wahr. Was sind Töne und wie werden sie dargestellt und digitalisiert ?
Physikalische Grundlagen n n Wenn Luft schwingt, entstehen Schallwellen. Treffen diese Schallwellen auf unser Ohr, neben wir diese als Töne wahr
Physikalische Grundlagen n Tonquelle erzeugt Schallwellen n Schallwellen werden durch ein Medium transportiert (Luft, Wasser, Holz). n n Alle vibrierende Objekte erzeugen Schallwellen. Durch die Vibration wird das Medium stoßweise verdichtet. In Luft ist die Schallgeschwindigkeit: 330 m/s = 1188 km/h. Ohr wandelt diese in Abhängigkeit von Stärke und Häufigkeit in Töne durch das Trommelfell in Reize um. n Der hörbare Bereich eines Menschen liegt zw. 20 Hz und 20 k. Hz.
Physikalische Grundlagen n Transport von Schallwellen ist im Prinzip bei jedem Medium gleich n n n Moleküle sind normaler Weise gleichweit voneinander entfernt. Nachdem verdichten, versuchen sie alten Abstand wieder herzustellen. Dabei bewegen sie sich vorwärts und rückwärts und verdichten dabei das Gebiet ihrer Nachbarn usw.
Physikalische Grundlagen
Physikalische Grundlagen n n Ein einzelnes Molekül bewegt sich nur ein Stück vorwärts. Betrachtet man das Gebiet, der Komprimierung, sieht man eine sich fortbewegende Schallwelle.
Physikalische Grundlagen n Die einfachste Schwingung ist die Sinuskurve. n n Periodische Schwingungen sind alle Töne, die man als Klänge bezeichnen kann. n n Eine periodische Schwingung. Klavier, Glocke Nicht periodische Schwingungen erzeugen Geräusche n Wasserrauschen
Erzeugung von komplexeren Schwingungen n n Nur sehr wenige Töne sind periodisch. Jeder Ton kann aber zerlegt werden in eine Reihe von Sinuskurven und andersherum.
Frequenzspektrum n n Da jeder Ton zerlegt werden kann, existiert eine Möglichkeit ein Spektrum anzugeben, der einen Ton charakterisiert. Einfach gesagt bestimmt die stärkste Frequenz die Tonhöhe.
Zusammenhänge von Schwingungen und Tönen n Lautstärke und Amplitude n Dass wir Töne in verschiedenen Lautstärken wahrnehmen, liegt daran, dass die Druckwellen unterschiedlich stark auf das Ohr treffen. n Die Stärke der Schwingungen ist erkennbar an ihrer Amplitude. n Damit bestimmt die Amplitude einer Schwingung die Lautstärke eines Tones. n n Die Schallintensität wird definiert als Leistung/Fläche. Als Schallpegel bezeichnet man den 10 fachen dekadischen Logarithmus vom Verhältnis zweier Schallintensitäten. Er wird in Dezibel angegeben.
Umwandlung n Die Umwandlung von Schallwellen bzw. Druckwellen in elektrische Signale.
Umwandeln von Schallwellen in Elektrizität n n n Beim Auftreffen einer Druckwelle auf das Papier wird Spule je nach Stärke der Druckwelle in Richtung Magnet gedrückt. Dabei wird ein Impuls induziert. Je stärker die Druckwelle, desto stärker der Impuls.
Umwandeln von Elektrizität in Schallwellen n Andersherum funktioniert es ebenso. n n Durch Induzieren eines Stromes in der Spule, erzeugt die Vor- und Zurückbewegung des Blattes Schwingungen. Mikrophone und Lautsprecher funktionieren nach diesem Prinzip.
Digitalisierung n n So wie es möglich ist Schallwellen in elektrische Signale umzuwandeln, kann man diese auch in digitale Werte konvertieren: Zwei Prozesse: n Abtasten (Sampling) n n Periodisches Abtasten des kontinuierlichen analogen Signals Quantisierung n Das Runden der ermittelten unbegrenztgenauen Werte analogen Werten auf einen digitalen Wertebereich.
Digitalisierung
Umwandlung von elektrischen Signalen in digitale Signale n Dabei entstehen zwei Hauptprobleme, die für Informationsverlust sorgen: n n Die aufeinander folgenden digitalen Werte entsprechen einem bestimmten Intervall. Dieses Intervall hat eine bestimmte Breite. Digitale Werte sind diskrete, dass heißt, sie können nur einen bestimmten Wert annehmen.
Umwandlung von elektrischen Signalen in digitale Signale
Umwandlung von elektrischen Signalen in digitale Signale n n Diese beiden Probleme bestimmen den Hauptfehler digitaler Töne. Er kann kontrolliert werden durch die Änderung der Signalrepräsentation. Man kann den Fehler durch immer kleinere Intervalle verkleinern, aber niemals vollständig eliminieren. Faktoren wie Speicherplatz und Prozessorgeschwindigkeit setzen Grenzen. Daher ist es wichtig zu entscheiden, welche Fehler man tolerieren kann und welche Fehler verringert werden müssen - auf Kosten anderer Probleme.
Digitalisierung (technisch) n Möglichkeiten ein Tonsignal abzutasten n Pulsamplitudenmodulation ( PAM ) n Pulsbreitenmodulation (PWM) n Pulscodemodulation (PCM)
PAM n Die analoge Signale werden übermittelt durch einen Serie von Impulsen, deren Amplitude die Soundstärke repräsentieren.
PAM n Vorteil: n n Es ist einfach ein analoges Signal in ein PAM Signal zu umzuwandeln und anderes herum. Folge: n Die meisten ADCs und DACs benutzen PAM als ein Zwischenformat.
PWM n Die analoge Signale werden übermittelt durch einen Serie von Impulsen, deren Länge die Soundstärke repräsentieren.
PWM n Vorteil: n In der Praxis werden die Amplituden der Signale oft zerstört. Die Umwandlung eines analogen Signals vor dem Transport durch Kabel oder Radioverbindungen in PWM, vermindert die Schwächung des Signals.
PCM n Die analoge Signale werden übermittelt durch einen Serie von Impulsen, die den binären Daten des Samples entsprechen.
Sampling-Effekte n n Digitalisierte Daten werden charakterisiert durch die Abtastrate (Sampling-Rate ) Sampling-Rate n n Anzahl der Abtastungen/Messungen des analogen Signals / pro Sekunde Beispiele n n Audio – CDs : 44100 mal / pro Sekunde Telefonsysteme : 8000 mal / pro Sekunde
Sampling-Effekte n Wichtige Entdeckung n Harry Nyquist (1889 – 1976) n n Claude E. Shannon n n Ein analoges Signal kann exakt reproduziert werden, wenn die Abtastrate doppelt so hoch ist, wie die höchste Frequenz des analogen Signals. 1948/49 mathematischer Beweis, dass es wirklich so ist Die selben Entdeckungen ? n Nyquist-Limit, Abtasttheorem, Shannon-Theorem
Sampling-Effekte n Ist die Abtastrate nicht doppelt so hoch, wie die höchste Frequenz – kann es zu Nebeneffekten kommen: n n n Frequenz - Überlappungen (Aliasing) Quantisierungsrauschen Verzerrungen (Clipping)
Aliasing n Beispiel: n n Aufnahme mit einer Abtastrate von 8 k. Hz Das Nyquist-Limit liegt damit bei 4 k. Hz Versucht man nun ein Signal mit 5 k. Hz aufzunehmen, erhält man beim Abspielen nur ein Signal von 3 k. Hz. Dies führt zu einem der wichtigsten Probleme in der Arbeit mit digitalem Sound.
Aliasing n Das Problem: n Ein digitales Sample kann durch mehrere Sinuswellen repräsentiert werden. n Beim Abspielen kann es passieren, dass der DAC nicht das Signal auswählt, dass man gerne möchte. n Er wählt immer nur Signale unterhalb der Nyquest-Limits.
Quantisierungsrauschen n Quantisierung ist der Vorgang des Rundens von genauen analogen zu weniger genauen digitalen Werten. n n n Digitale Daten werden repräsentiert durch diskrete Werte ( 8 Bit Integer oder auch 16 Bit Integer ) Originale analoge Werte sind aber keine Integer-Werte. Als Quantisierungsrauschen bezeichnet man den Fehler der beim Runden entsteht. n Der entstehende Fehler ist zufällig und wird als eine Art des Rauschens wahrgenommen.
Quantisierungsrauschen n Wie laut ist dieses Rauschen? n n Die Amplitude des Rauschens wird als „noise floor“ bezeichnet. Je kleiner sie ist, desto leiser ist das Rauschen. Bei einem 8 Bit-Sample haben wir Werte zwischen +127 bis -128 und der Fehler ist max. 0, 5 ! Bei einem 16 Bit-Sample sind die Schritte wesentlich kleiner, dadurch wird das Rauschen leiser.
Quantisierungsrauschen n Noch wichtiger ist die Frage, wie laut ist das Rauchschen im Verhältnis zum eigentlichen Ton. n n Das Verhältnis bezeichnet man als „signalto-noise ratio“ ( SNR ) Je größer dieses Verhältnis ist, desto besser.
Beheben von Verzerrungen (Dithering) n Das menschliche Ohr nimmt Verzerrung eher als Rauschen. n Deshalb wird versucht, verschiedene Arten von Verzerrung in Hochfrequenzrauschen umzuwandeln. n Diesen Prozess nennt man Dithering. n Idee: n n „error – diffusion“ Wird beim Konvertieren von höher-auflösenden in niedrigerauflösende Signal angewandt. Man merkt sich den auftretenden Fehler und vermischt ihn mit den nachfolgenden Werten.
Clipping n Eine Art der Verzerrung n n n Die Spitzen der Sinuskurven werden abgeschnitten. Tritt auf, wenn Verstärkerschaltkreise gesättigt sind. In der Digitaltechnik, wenn es zu Variablenüberläufen kommt.
Video n Der Begriff Video stammt von dem lateinischen Begriff videre (sehen) und bezeichnet Sequenzen von bewegten Bildern, die zur Bildschirmausgabe geeignet sind.
Physikalische Grundlagen n Wie sieht der Mensch? n n n Die 3 -dimensionalen Welt wird auf die Netzhaut des Auges als ein 2 -dimensionales Bild projeziert. Fotorezeptoren registrieren Lichtwellen zwischen 400 nm und 700 nm. Wie speichert eine Kamera ein Bild? n n Der Film besteht aus einer dünnen Schicht kleinster Teilchen, die eine chemische reagiere, je nach dem mit welcher Lichtintensität sie bestrahlt werden. Je dichter die Teilchen angeordnet sind, desto besser kann das Original reproduziert werden.
Allgemeines Digitalisieren n Ein Bild aus der physikalischen Welt, wird in zwei Schritten digitalisiert. n Sampling n n n 2 -dimensionaler Raum wird in kleine diskrete Regionen (Pixel oder auch Pel) unterteilt. Auch hier gilt Nyquist-Theorem – die Abtastrate sollte mindestens doppelt so groß sein, wie die höchste räumliche Frequenzkomponente. Quantisierung n Jeder Region wird ein diskreter Wert zugewiesen, der Amplitude des Signals ( z. B. der Helligkeit und/oder dem Farbwert ) entspricht.
Was wird abgetastet? n Zweifarbtonbild (z. B. : Text in einem Buch): n n n Schwarzweißbild: n n n Es reicht ein Bit pro Pixel. Helligkeit und Farbe werden nicht verändert. Es wird nur der Luminanzwert zu jedem Pixel gespeichert. Die Farbe ist für das ganze Bild konstant, nur der Helligkeitswert wird abgespeicher. Farbbilder: n Zu jedem Pixel werden 3 Komponenten gespeichert.
Farbschemata n Licht ist die Mischung elektromagnetischer Wellen verschiedener Wellenlängen. n Theoretisch ist es möglich, jede beliebige Farbe unter Verwendung von drei Grundkomponenten darzustellen. n n Praktisch gibt es einige Einschränkungen, der Farbquellen. Gängige Farbschemata: n n n RGB ( Rot, Grün, Blau ) CMY ( Cyan, Magenta, Gelb ) YUV ( Luminanz, U und V sind Chrominanz-Komponenten ) YIQ ( ähnlich zu YUV ) HSV ( Hue (Farbton), Saturation (Sättigung), Value (Wert) )
Definitionen n Chroma Chrominanz, C, Cr, Cb, U, V n n n Farbanteil des Videosignals. Komponentensignale enthalten ein Signal für die Differenz weiss-rot (Cr oder U) und weiss-blau (Cb oder V). Luma Luminanz, Y n n n Helligkeitsanteil des Videosignals. Aus den drei Signalen RGB der Kamera wird ein gewichtetes Mittel berechnet, welches die Eigenschaften des menschlichen Auges berücksichtigt Grün 59%, Rot 30%, Blau 11%.
Sampling n Wie wird abgetastet? n n Videobilder werden horizontal, vertikal und temporal abgetastet. Ein Bild besteht aus einer bestimmten Anzahl von Zeilen. Fernsehbilder (PAL – Standard für Europa) bestehen z. B. aus 625 Zeilen, von denen aber nur ca. 580 sichtbar sind. Die restlichen Zeilen sind scanning-overhead. Er wird genutzt für Blanking-Intervalle und zur Synchronisierung des Signals.
Analoges Video n n Es gibt unterschiedliche Fernsehformate, die sich unter anderem in der Frequenz der Bildwiederholungen und der Anzahl der Zeilen eines Bildes unterscheiden. Die bekanntesten sind: n Pal / Secam n n Europa NTSC n USA
PAL / SECAM n 1966/67 Einführung in Deutschland n 25 Voll- bzw. 50 Halbbilder / Sekunde n PAL: QAM (Quadratur-Amplituden-Modulation) SECAM: FM (Frequenzmodulation) n Verwendet zusätzl. Synchronisation für Farbtreue n Dimension: n n n 625 Zeilen(580 sichtbar) Seitenverhältnis 4: 3 Bandbreite ist: 6. 5 MHz Abtastrate liegt bei: 13. 5 MHz
NTSC n 1954 Einführung in den USA (Kanada, Japan) n 30 Voll- bzw. 60 Halbbilder / Sekunde n QAM ( Quadratur-Amplituden-Modulation) n n n Dimension: n n „Nether the same color“ – Farbverfälschung durch unkorrigierte Übertragungsfehler z. B. Hautfarbe als Olivgrün oder Knallrosa. NTSC-Fernsehgeräte haben einen Regler, um entsprechende Korrekturen vorzunehmen 525 Zeilen(480 sichtbar) Seitenverhältnis 4: 3 Bandbreite: 5. 5 MHz
Digitalisierung n Im Gegensatz zu den Druckwellen eines akustischen Signals kann eine diskrete Folge von Einzelbildern als kontinuierliche Sequenz wahrgenommen werden. n n Die Grenzfrequenz liegt bei etwa 16 Hz. Allerdings entsteht bis etwa 50 Hz ein Flimmereffekt durch die unvollkommene Speicherwirkung des Auges für optische Reize. Bei Fernsehgeräten wird ein Vollbild in zwei zeilenweise ineinandergeschachtelte Halbbilder geteilt. Es wird jeweils ein Halbbild nach dem anderen im Zeilensprungverfahren übertragen (Interlace. Verfahren). n n Zuerst werden alle ungeraden Zeilen übertragen, dann die geraden. Jedes Halbbild wird 25 mal pro Sekunde dargestellt, also beträgt die Vertikalfrequenz eines Vollbildes 50 Hz, die Zeit zwischen zwei Halbbildern 20 msec.
Abtastmethoden n Verschiedene Abtastmethoden n 4: 1: 1 n n 4: 2: 0 n n das Farbsignal wird nur bei jedem zweiten Halbbild und nur in halber Auflösung abgetastet 4: 2: 2 n n das Farbsignal wird nur bei jedem vierten Pixel, dafür aber in beiden Halbbildern horizontal verschoben abgetastet. für professionelles digitales Video Jedes Pixel wird nach Luminanz (Y) und jedes zweite nach den Rot- und Blaudifferenzen (Cr und Cb) abgetastet. Dabei wird die Tatsache ausgenützt, dass das Auge weniger empfindlich auf die Farbe ist als auf die Helligkeit. 4: 4: 4 n n n Hochqualitatives digitales Format Jedes Pixel, sowohl in Luminanz wie in den Blau- und Rotdifferenzen wird abgetastet Wird nur in Effektgeräten verwendet
Quantisierung n n n Auch in der Videodigitalisierung werden kontinuierliche Signale in diskrete Werte umgewandelt. Für einpoliges Signal wie Luminanz, wird Quantisierung genutzt. Für ein zweipoliges Signal wie zum Beispiel die Farbdifferenz (Cb, Cr) wird mid-tread Quantisierung angewandt. Das sichert, dass der Nullwert nicht von Fehlern betroffen wird.
Sampling-Problems n Wie auch bei Abtasten von Audiosignalen kann es zu Fehlern kommen. n Noise ( Rauschen ), führt zu Verzerrungen des Bildes
- Analogtechnik grundlagen
- Digitalisierung hochschule
- Anne lipp
- Digitalisierung in der beruflichen bildung
- Digitalisierung in der pflege definition
- Audio video interleave
- Animation audio video
- Materi audio video
- Animation audio video
- Audio visual gif
- Animation audio video
- Audio vs video
- Audio web conferencing
- Bahan audio
- Erasmus von rotterdam beeinflusst von
- Kurshalter
- Grundlagen der elektrochemie
- Oszilloskop grundlagen
- Rechnung abgrenzen
- Theoretiker soziale arbeit
- Future continuous tense passive voice
- Schubkarre einseitiger hebel
- Server virtualisierung vor und nachteile
- Preisschwelle
- Uv vis spektroskopie grundlagen
- Kemper datenbanken
- Active directory grundlagen
- Gesetz kindeswohlgefährdung
- Grundlagen der systemtheorie
- Kompetenzmanagement grundlagen und praxisbeispiele
- Present tenses revision
- Entwicklungspsychologische grundlagen 0-3
- Garverfahren kochen definition
- Genetik grundlagen
- Paromed
- Englisch simple past
- Knx grundlagen
- Kaufvertrag grundlagen arbeitsblätter
- Beispiele
- Schnelllesetechnik
- Strukturiertes denken definition
- Bauphysik grundlagen
- Vlan ieee
- Biologiedidaktik grundlagen und methoden
- Yandex image search
- Video.search.yahoo.com search video
- Video.search.yahoo.com search video
- Digital media primer
- Examples of audio lingual method
- Arduino sound visualizer
- Audio definition model
- Audio super resolution using neural networks