Multimedie och kommunikationssystem lektion 13 14 Forts Kap

  • Slides: 43
Download presentation
Multimedie- och kommunikationssystem, lektion 13 -14 Forts. Kap 2: Signaler och Kvalitetsmått Kap 3

Multimedie- och kommunikationssystem, lektion 13 -14 Forts. Kap 2: Signaler och Kvalitetsmått Kap 3 -4: Ljud- och videokompression

PCM = Pulse Code Modulation = Digitalisering av analoga signaler och seriell överföring Sifferexempel

PCM = Pulse Code Modulation = Digitalisering av analoga signaler och seriell överföring Sifferexempel från PSTN = publika telefonnätet: 011011010001. . . 1 0 Antivikningsfilter Sampler AD-omvandlare med seriell utsignal DAomvandlare Interpolationsfilter Högtalare Mikrofon 8000 300 -3400 Hz bandpass- sampels filter. Spärrar per sek allt över 4000 Hz. 8 bit per sampel dvs 64000 bps per tfnsamtal 28 = 256 spänningsnivåer

Exempel En 6 sekunder lång ljudinspelning digitaliseras. Hur stor är inspelningens informationsmängd? a) 22000

Exempel En 6 sekunder lång ljudinspelning digitaliseras. Hur stor är inspelningens informationsmängd? a) 22000 sampels/sekund, 256 kvantiseringsnivåer. 22000 sampels * 6 s * 8 bit = 1056000 bit. b) 22000 sampels/sekund, 16 kvantiseringsnivåer. 22000 sampels * 6 s * 4 bit = 528000 bit. c) 5500 sampels/sekund, 256 kvantiseringsnivåer. 5500 sampels * 6 s * 8 bit = 264000 bit.

Vikningsdistorsion (aliasing) Inträffar om man inte filtrerar bort frekvenser som är högre än halva

Vikningsdistorsion (aliasing) Inträffar om man inte filtrerar bort frekvenser som är högre än halva samplingsfrekvensen. Exempel: En sinuston på 4 k. Hz som samplas med samplingsfrekvens 4 kilosampels/s viks ned till en ton på 2 k. Hz.

Example What sampling rate is needed for a signal with a bandwidth of 10,

Example What sampling rate is needed for a signal with a bandwidth of 10, 000 Hz (1000 to 11, 000 Hz)? Solution The sampling rate must be twice the highest frequency in the signal: Sampling rate = 2 x (11, 000) = 22, 000 samples/s

Samplingsteoremet f < fs/2 q Den högsta frekvens som kan samplas är halva samplingsfrekvensen.

Samplingsteoremet f < fs/2 q Den högsta frekvens som kan samplas är halva samplingsfrekvensen. q Om man samplar högre frekvens än fs/2 så byter signalen frekvens, dvs det uppstår vikningsdistorsion (aliasing). q För att undvika vikningsdistorsion så har man ett anti-vikningsfilter innan samplingen, som tar bort frekvenser över halva samplingsfrekvensen. q Interpolationsfiltret används vid rekonstruktion av den digitala signalen för att ”gissa” värden mellan samplen. q Ett ideal interpolationsfilter skulle kunna återskapa den samplade signalen perfekt om den uppfyller samplingsteoremet. I verkligheten finns inga ideala filter. q Följdregel: Nyqvist’s sats säger att max datahastighet = 2 B 2 log M, där M är antal nivåer, och B är signalens bandbredd, oftast lika med signalens övre gränsfrekvens.

Example 2. 1

Example 2. 1

Example 2. 4: PCM coding of speach and music

Example 2. 4: PCM coding of speach and music

Example 2. 7: Uncompressed video

Example 2. 7: Uncompressed video

Kvantiseringsdistorsion

Kvantiseringsdistorsion

Signal-to-quantization ratio (SQR)

Signal-to-quantization ratio (SQR)

Example 2. 2: Quantization distorsion

Example 2. 2: Quantization distorsion

Kvantiseringsdistorsion (kvantiseringsbrus) q Avrundningsfelet låter ofta som ett brus. q Svaga ljud avrundas bort,

Kvantiseringsdistorsion (kvantiseringsbrus) q Avrundningsfelet låter ofta som ett brus. q Svaga ljud avrundas bort, eller dränks i kvantiseringsbruset. q Varje extra bit upplösning ger dubbelt så många spänningsnivåer, vilket ger en halvering av kvantiseringsdistorsionens spänningsnivå, dvs en fjärdedels effekt, dvs en minskning med 6 d. B. q N bit upplösning ger ett signal-till-kvantiseringsbrusförhållande (SQR=Signal to quantization noise ratio) på i storleksordning N*6 d. B (det kan skilja några d. B beroende på hur man definierar max signalnivå. )

Kompressionsalgoritmer Kapitel 3 -4

Kompressionsalgoritmer Kapitel 3 -4

Shannons entropi-formel Entropi = informationsmängd per kodord, dvs minsta möjliga antal bit per kodord

Shannons entropi-formel Entropi = informationsmängd per kodord, dvs minsta möjliga antal bit per kodord efter datakompression.

Språkets entropi. Exempel: Om det engelska alfabetets 26 bokstäver vore lika vanliga blir entropin

Språkets entropi. Exempel: Om det engelska alfabetets 26 bokstäver vore lika vanliga blir entropin per bokstav: Men, den verkliga entropin i det engelska språket är 2. 62 bit/bokstav. Det går alltså att komprimera till den nivån, med hjälp av en variabellängd-kod, dvs en kod som har olika antal bit för olika tecken, t. ex. s. k. Huffmankodning.

Example 3. 1:

Example 3. 1:

Huffman decoding example

Huffman decoding example

Figure 3. 3 Huffman code tree construction: (a) final tree with codes; (b) tree

Figure 3. 3 Huffman code tree construction: (a) final tree with codes; (b) tree derivation.

Example 3. 2: A series of messages

Example 3. 2: A series of messages

Figure 3. 4 Huffman encoding example: (a) codeword generation; (b) Huffman code tree.

Figure 3. 4 Huffman encoding example: (a) codeword generation; (b) Huffman code tree.

Differentiell PCMkodning av ljud Det som överförs är skillnaden mellan nuvarande sampel och föregående

Differentiell PCMkodning av ljud Det som överförs är skillnaden mellan nuvarande sampel och föregående mottagen sampel (inkl kvantiseringsfel). DPCM möjliggör färre bitar per sampel än vid vanlig PCM. Vid tillräckligt hög samplingsfrekvens kan man använda s. k. enbitsteknik, dvs en bit per sampel.

Linear predictive coding (LPC) signal encoder and decoder schematic. Används vid kodning av mänskligt

Linear predictive coding (LPC) signal encoder and decoder schematic. Används vid kodning av mänskligt tal. Exempel: GSM: s talkodning komprimerar PCM: s ursprungliga 64 000 bps till 13 000 bps.

Delbandskodning (Sub-band coding) En CD-spelare kräver 16 bit per sampel x 44100 sampels per

Delbandskodning (Sub-band coding) En CD-spelare kräver 16 bit per sampel x 44100 sampels per sekund x 2 kanaler = 1, 4 Mbps (miljoner bit per sekund). I MPEG layer 2 (används vid DVD, DVB och digitalradio) komprimeras datamängden till mellan 32 Kbps och 384 kbps (tusen bit per sekund) per ljudkanal. Man utnyttjar då örats maskeringseffekt, som gör att starka ljud dränker svaga ljud på närliggande frekvenser. En filterbank delar upp signalen i delfrekvensband. Varje delband kvantiseras för sig. I delband där ljudet är starkt kan man ha högt kvantiseringsbrus (högt Vmax och därmed högt q) utan att det hörs. Spektrum Hörs ej Frekvens

Figure 3. 14: JPEG = Joint Photographic Experts Group

Figure 3. 14: JPEG = Joint Photographic Experts Group

DCT = Discrete Cosine Transform 2 D computation

DCT = Discrete Cosine Transform 2 D computation

Figure 3. 17 Example of DCT quantization.

Figure 3. 17 Example of DCT quantization.

Figure 3. 18 Vectoring using a zig-zag scan: (a) principle; (b) vector for example

Figure 3. 18 Vectoring using a zig-zag scan: (a) principle; (b) vector for example shown in Figure 3. 17.

Video compression standards H. 261, H. 263, MPEG 1 and MPEG 2 are all

Video compression standards H. 261, H. 263, MPEG 1 and MPEG 2 are all based on the following techniques: - Each frame is divided into blocks. - Transform coding of each block. (DCT coding, with quantization, zig-zag scanning and run-length coding. ) - Differential coding of the motion. - Motion prediction.

Figure 4. 11 Example frame sequences with: (a) I- and P-frames only; (b) I-,

Figure 4. 11 Example frame sequences with: (a) I- and P-frames only; (b) I-, P- and B-frames; (c) PB-frames. I = intracoded frame P = predicted/intercoded frame B = bidirectional interpolated frame

Figure 4. 20: MPEG-1 example frame structure I = intracoded frame P = predicted/intercoded

Figure 4. 20: MPEG-1 example frame structure I = intracoded frame P = predicted/intercoded frame B = bidirectional interpolated frame

Example 4. 1: MPEG-1

Example 4. 1: MPEG-1

Example 4. 2

Example 4. 2