Momel - Momel - Wikipedia

Momel (Pztdelling melody), Daniel Hirst ve Robert Espesser tarafından geliştirilen bir algoritmadır. CNRS Laboratoire Parole et Langage,[1] Aix-en-Provence:[1] tonlama modellerinin analizi ve sentezi için.

Amaç

Ham analizi temel frekans tonlama çalışması için eğrilerin, hoparlörlerin aynı anda bir tonlama modeli ve parçalı telefonlardan oluşan bir dizi hece ürettikleri gerçeğini hesaba katması gerekir. Akustik olarak analiz edilebilen gerçek ham temel frekans eğrileri, bu iki bileşen arasındaki bir etkileşimin sonucudur ve bu, farklı segmental malzemelerle üretildiklerinde tonlama modellerini karşılaştırmayı zorlaştırır. Örneğin, ifadelerdeki tonlama kalıplarını karşılaştırın Bu baba için ve Bu anne için.

Algoritma

Momel algoritması, ham eğrileri iki bileşene çarparak bu sorunu çözmeye çalışır:

  • a makromelodik bileşen - olarak modellenmiştir ikinci dereceden spline işlevi . Bunun, küresel olana karşılık geldiği varsayılmaktadır. perde çevresi ve kurucu sesbirimlerinin doğasından bağımsızdır. Altta yatan hipotez, bu makromelodik bileşenin, ham temel frekans eğrilerinin aksine, sürekli ve pürüzsüz. Bir söz söylemek yerine mırıldanırsak, yaklaşık olarak ürettiğimiz şeye karşılık gelir.
  • a mikromelodik bileşen makromelodik eğriden sapmalardan oluşan - a mikromelodik profil. Bu artık eğrinin tamamen ifadenin segmental bileşenleri tarafından belirlendiği ve makromelodik bileşenden bağımsız olduğu varsayılır.

Makromelodik bileşeni modellemek için kullanılan ikinci dereceden eğri işlevi, bir hedef nokta dizisi ile tanımlanır (her bir çift, iki monotonik ile bağlanan çiftler parabolik ile eğriler spline düğüm iki hedef arasındaki orta noktada meydana gelir (varsayılan olarak). ilk türev bu şekilde tanımlanan eğrinin, her hedef noktasında sıfırdır ve iki parabol, eğri düğümde aynı değere ve aynı türeve sahiptir. Aslında bu, eğrilerin hem sürekli hem de pürüzsüz olduğu en basit matematiksel işlevi tanımlar.

Çıkarımlar

Bir yandan "Anne İçin!" ve "Babam için!" böylece aynı hedef noktalarla (dolayısıyla aynı makromelodik bileşen) modellenebilirken "Mama için mi?" ve "Babam için?" aynı hedef noktalara da sahip olacaktır, ancak bunlar muhtemelen ilk çiftinkilerden farklı olacaktır.

Öte yandan, "Anne İçin!" ve "Annem için?" aynı mikromelodik profille ancak farklı hedef noktasıyla modellenebilirken "Papa için!" ve "Babam için?" aynı mikromelodik profile sahip olacaktır, ancak bu ilk çiftinkinden farklı olacaktır.

Momel algoritması, yazarlarının dediği şeyi türetir. fonetik gösterim Bir üretim veya algı modelinden açıkça türetilmemesine rağmen, her iki işlemin modellerine girdi olarak kullanılmasına izin verecek yeterli bilgi içerdiğinden, konuşma üretimi ve konuşma algısı açısından nötr olan bir tonlama modelinin bir parçasıdır. Algoritmanın göreceli olarak kuramdan bağımsız doğası, algoritmanın aşağıdaki gibi temsillerin türetilmesinde bir ilk adım olarak kullanılmasına izin vermiştir. Fujisaki modeli (Mixdorff 1999), ToBI (Maghbouleh 1999, Wightman ve diğerleri 2000) veya INTSINT (Hirst & Espesser 1993, Hirst ve diğerleri 2000).

Referanslar

  • Hirst, Daniel & Robert Espesser 1993. İkinci dereceden bir eğri işlevi kullanarak temel frekansın otomatik modellemesi. Travaux de l'Institut de Phonétique d'Aix 15, 71-85.
  • Hirst, Daniel, Albert Di Cristo ve Robert Espesser 2000. Tonlama için temsil seviyeleri ve analiz seviyeleri. M. Horne (ed) içinde Aruz: Teori ve Deney. Kluwer Academic Publishers, Dordrecht. 51-87
  • Maghbouleh, A., 1998. ToBI vurgu tipi tanıma. İçinde: Bildiriler ICSLP 98.
  • Mixdorff, H., 1999. Fujisaki model parametrelerinin tam otomatik olarak çıkarılmasına yeni bir yaklaşım. İçinde Bildiriler ICASSP 1999.
  • Wightman, C. & Campbell, N., 1995. Aruzlu yapının geliştirilmiş etiketlemesi. IEEE Trans. Konuşma ve Ses İşleme hakkında.

Dış bağlantılar

Momel otomatik bilgi notu, SPPAS