Rozpoznawanie mowy za pomocą Fon — wyodrębnianie i dopasowywanie wzorców słów w czasie rzeczywistym
Zdjęcia
Fon to wielokrotnie nagradzane oprogramowanie analityczne, które było używane przez dziesiątki tysięcy ekspertów językowych na całym świecie do identyfikowania wzorców i relacji między językami. Fon zapewnia użytkownikom możliwość tworzenia i przechowywania niestandardowych wizualizacji spektrogramów lub generowania nowych niestandardowych wizualizacji na podstawie dużej liczby pól wejściowych. Narzędzia te zrewolucjonizowały sposób, w jaki badacze języków analizują języki, umożliwiając im badanie relacji między słowami, dźwiękami i znaczeniami. Ta umiejętność dała językoznawcom bezprecedensowy dostęp do struktury języków. Fon pozwala użytkownikom określić liczbę punktów czasowych, w których pojawia się słowo, i automatycznie tworzy widmo z powiązaną etykietą. Użytkownicy mogą również wybrać rodzaj relacji, którą są zainteresowani (np. bezwzględną lub względną) i przeglądać spektrogram w celu określenia rozkładu prawdopodobieństwa kształtu słowa, położenia w słowniku i kształtu jego występowania w wyrażeniu.
Oprócz zapewniania wysokiej jakości wizualizacji wzorców mowy, Fon zapewnia użytkownikom potężne możliwości analizy mowy. Narzędzia do rozpoznawania mowy, takie jak Fon, zapewniają ekspresyjny i precyzyjny sposób identyfikacji wzorców i relacji mowy oraz stanowią silną platformę do badania rozpoznawania mowy. Przy użyciu Fon opracowano kilka modeli rozpoznawania mowy. Projekt Fon odnotował ogromny wzrost dzięki wysiłkom tysięcy lingwistów na całym świecie.
Fon umożliwia skanowanie setek miliardów fraz dziennie. Technologia stojąca za tym przełomem opiera się na metodzie ekstrakcji i rozpoznawania. Gdy użytkownik wpisuje tekst w polu tekstowym, mechanizm rozpoznawania mowy Praat szybko skanuje tekst i szuka słów, które są poprawne gramatycznie, ale są błędnie napisane lub wyglądają na źle napisane. Wyodrębnione słowa są następnie wprowadzane do sieci neuronowej rozpoznawania mowy (RNN), która odnosi się do pary wstępnie wytrenowanych Convolutional Neural Networks (CNN), aby znaleźć podobieństwa w wyodrębnionej frazie i stworzyć silne powiązanie.