Analiza LPC
Wprowadzenie |
Zastosowania |
Przykłady
Wprowadzenie
Zamiast wyrażać informację o kanale głosowym przy pomocy wygładzonego widma, możliwe jest uzyskanie tych informacji przez wyznaczenie parametrów modelu kanału głosowego. Ważną cechą charakterystyki częstotliwościowej kanału głosowego jest możliwość opisania jej za pomocą częstotliwości rezonansowych, które można przedstawić za pomocą biegunów transmitancji. Wiele ważnych właściwości transmitancji kanału głosowego można wyrazić za pomocą modelu zawierającego
tylko bieguny transmitancji H(z):
Odpowiedź impulsowa odpowiadająca powyższej transmitancji przyjmuje postać:
lub dla n>0:
Odpowiedź impulsowa v(n) dla n>0 jest zatem kombinacją liniową jej poprzednich p wartości. Jeśli dane modelowane odpowiadają dokładnie odpowiedzi impulsowej, to powyższa zależność jest spełniona dokładnie. W przeciwnym razie, liniowa kombinacja poprzednich wartości jest tylko aproksymacją odpowiedzi impulsowej v(n). Oznaczając tę aproksymację przez va(n) otrzymuje się:
a wynikający stąd błąd wynosi:
Przy wyborze współczynników predykcji ak ze względu na minimalizację wartości błędu średniokwadratowego, określa się je przez zbiór równań liniowych. Całkowity błąd średniokwadratowy określony jest zależnością:
gdzie górna granica sumowania N-1jest równa liczbie dostępnych wyrazów ciągu v(n). Parametry ak można wyznaczyć z równań:
które sprowadzają się do postaci:
przy czym:
W przypadku modelowania układu o transmitancji zawierającej tylko bieguny, konieczne jest wyznaczenie współczynników opisanych powyższą zależnością na podstawie sygnału mowy, będącego wynikiem splotu odpowiedzi impulsowej kanału głosowego i funkcji pobudzenia. W tym celu wykorzystuje się głównie dwie metody:
- autokowariancji,
- autokorelacji.
Metoda modelowania filtru o transmitancji zawierającej tylko bieguny, z zastosowaniem liniowej predykcji, dopasowuje pierwsze (p+1) współczynników autokorelacji odpowiedzi impulsowej tego filtru do współczynników autokorelacji ciągu v(n).
Przy znajomości parametrów układu predykcji, możliwe jest przekształcenie równania opisującego transmitancję H(z) do postaci umożliwiającej wyznaczenie charakterystyki częstotliwościowej dla zbioru dyskretnych częstotliwości. Próbki wielomianu mianownika transmitancji H(z) rozmieszczone w jednakowych odległościach na okręgu jednostkowym w płaszczyźnie zmiennej z można wyznaczyć, stosując szybkie przekształcenie Fouriera skończonego ciągu h-1(n), określonego zależnością:
Ciąg ten jest odpowiedzią impulsową odwrotności filtru o transmitancji zawierającej tylko bieguny, stąd:
Jeśli należy obliczyć N próbek transmitancji H(z) rozmieszczonych w jednakowych odległościach na okręgu jednostkowym płaszczyzny zmiennej z, ciąg h-1(n) o (p+1) punktach uzupełnia się (N-p-1) zerami.
Powrót
Zastosowania
Jednym z zastosowań liniowej predykcji sygnału mowy jest krótkookresowa analiza widma tego sygnału dla potrzeb uzyskania spektrogramu mowy. Innym zastosowaniem jest realizacja systemu analizy-syntezy mowy, co wynika z faktu, iż parametry predykcji liniowej określają parametry transmitancji kanału głosowego.
Predykcja liniowa, ze względu na swe właściwości, dostosowane do opisu w dziedzinie częstotliwości, zapewnia dobrą aproksymację obwiedni widma. Szczególnie dobre rezultaty daje ta metoda w analizie właściwości formantowych sygnału mowy.
Powrót
Przykłady
Przykłady analiz LPC wykonanych z wykorzystaniem programu KASM.
Widmo LPC fragmentu głoski ‘a’ (okno programu KASM):
- rząd modelu = 48,
- promień analizy = 1.0,
- model stabilny.
Widmo LPC fragmentu głoski ‘a’ (okno programu KASM):
- rząd modelu = 48,
- promień analizy = 0.978,
- model niestabilny.
Powrót