Sonogram

Skalowanie | Przykłady | Wybór fragmentu pliku


Skalowanie

Przejście do analizy sonograficznej sygnału mowy (najczęściej jest to cały wyraz) powoduje pojawienie się na ekranie poniższego okna:



Sonogram wyrazu 'dziewięć' (okno programu KASM).

Oś odciętych sonogramu reprezentuje czas w sekundach [s], natomiast oś rzędnych reprezentuje częstotliwość w kilohercach [kHz].

W przypadku analizy tego typu szczególnie istotne jest odpowiednie wyskalowanie sonogramu. Jak wiadomo, na sonogramie amplitudy poszczególnych składowych widma przedstawione są za pomocą kolorów.

W oknie sonogramu przedstawiony jest zakres kolorów służących identyfikacji względnych amplitud poszczególnych składowych widma, przy czym kolor żółty oznacza względnie małą wartość amplitudy a kolor szary oznacza względnie dużą wartość amplitudy.

Aby uzyskać odpowieni obraz sonogramu (taki, na którym możliwa jest identyfikacja poszczególnych głosek w wyrazie, np. dźwięcznych i bezdźwięcznych), należy go odpowiednio przeskalować, używając klawiszy kursorów:



Użycie klawiszy:



powoduje zmianę mnożnika, co umożliwia zwiększenie lub zmniejszenie zakresu poziomów składowych widmowych podlegających analizie (uszczegółowienie).

Użycie klawiszy:



umożliwia przesunięcie zakresu analizy w kierunku niższych lub wyższych poziomów składowych widmowych.

Powrót




Przykłady

Poniżej przedstawione zostały przykłady sonogramów wyrazu 'cztery' z poprawnym oraz błędnym wyskalowaniem sonogramu.



Sonogram wyrazu 'cztery' - skalowanie poprawne.



Sonogram wyrazu 'cztery' - skalowanie błędne, sonogram nieczytelny.



Sonogram wyrazu 'cztery' - skalowanie błędne, składowe odpowiadające bezdźwięcznej głosce 'cz' niewidoczne.

Powrót




Wybór fragmentu pliku

Wciśnięcie SPACJI lub ENTER, kiedy aktywne jest okno sonogramu, powoduje pojawienia się nad sonogramem symbolu okienka służącego do wyboru odpowiedniego fragmentu sygnału do dalszej analizy (możliwy jest wybór fragmentu sonogramu, odpowiadającego określonej głosce).

Wstępnego wyboru fragmentu pliku do analizy dokonuje się poprzez przesunięcie symbolu okna nad wykresem sonogramu sygnału mowy, przy użyciu klawiszy kursorów.



Użycie klawiszy góra/dół daje większy krok, natomiast klawisze lewo/prawo pozwalają na dokładniejsze określenie fragmentu pliku (mniejszy krok).
Po określeniu fragmentu pliku wejściowego należy wcisnąć klawisz ENTER, aby przejść do kolejnego okna, w którym zaprezentowany jest przebieg czasowy fragmentu dźwięku mowy wybranego do analizy.



W oknie czasowym dokonuje się dokładnego wyboru fragmentu zarejestrowanego przebiegu do analizy.
Również w tym przypadku, wyboru fragentu sygnału mowy dokonuje się z użyciem klawiszy kursorów:

góra/dół - wybór zgrubny (większy krok)

lewo/prawo - wybór dokładny (mniejszy krok)

Wciśnięcie klawisza ENTER, po wybraniu odpowiedniego fragmentu sygnału, powoduje przejście do analizy widmowej wybranego fragmentu sygnału mowy.

Uwaga!
Przy wyborze fragmentu sygnału mowy, zaleca się wybór fragmentu odpowiadającego stanowi ustalonemu sygnału.

Powrót