Wyniki wyszukiwania

Rozpoznawanie mowy, zamiana mowy na tekst na stronach internetowych

Nie dość, że cały ten post został podyktowany, to w dodatku możesz go odsłuchać dzięki automatycznej lektorce.

 

[responsivevoice_button voice="Polish Female" buttontext="Odsłuchaj ten post"]

 

Naturalnym sposobem komunikowania się ludzi między sobą jest mowa. Każdy człowiek posiada nadajnik w postaci strun głosowych, oraz odbiornik w postaci uszu. Nic zatem dziwnego, że w komunikacji z komputerem chcielibyśmy korzystać z tych samych narzędzi. Wszak on też ma nadajnik w postaci głośnika i odbiornik w postaci mikrofonu.

Dziś jeszcze niewiele osób zauważa, że te sposoby komunikacji już istnieją. Jednak już wkrótce komunikacja głosowa z komputerem stanie się powszechna, dlatego przedsiębiorcy powinni już teraz zacząć myśleć o dostosowaniu swoich kanałów komunikacji elektronicznej z klientami do tych nowych możliwości. Era komunikacji głosowej nastąpi szybciej niż wielu się spodziewa. Przecież już dziś ponad jedną piątą odbiorców Internetu stanowią osoby korzystające ze smartfonów. A ci odbiorcy bardzo chętnie wysłuchają treści jakie przekazuje strona internetowa, ponieważ takie wysłuchanie jest znacznie łatwiejsze niż czytanie tekstu na małym ekranie. 

Ale odbiór tekstów formie czytanej przez automatycznych lektorów to tylko jedna strona medalu.

Przedsiębiorcy równie wiele, albo wręcz jeszcze więcej mogą skorzystać na systemach umożliwiających zamianę mowy na tekst. Przecież w wielu firmach, wielu pracowników codziennie traci czas na pisanie różnego rodzaju raportów, ofert handlowych, listów. Wielu uważa, że czynności te można wykonywać jedynie wtedy gdy siedzi się przy komputerze. A przecież to nie jest prawda.

Jak napisałem* na wstępie, ten artykuł został w całości podyktowany komputerowi. 

Korzystanie z funkcji zamiany mowy na tekst daje wiele korzyści:

  • oszczędność czasu,
  • możliwość wprowadzenia dużych tekstów na urządzeniach nie posiadających klawiatury, lub posiadających małą klawiaturę tak jak smartfony,
  • możliwość uniknięcia błędów ortograficznych,
  • swobodę wyboru miejsca pracy w którym wcale nie musi znajdować się komputer,
  • możliwość korzystania z Internetu przez osoby z wadami wzroku.

Kilka przykładów sytuacji w których warto stosować możliwość wprowadzania treści za pomocą mowy:

dziennikarz może łatwiej wysyłać do redakcji reportaże z ważnych wydarzeń, pośrednik-agent nieruchomości może łatwiej i szybciej wprowadzać oferty, blogger zyskuje swobodę pracy itp.

Co jest potrzebne do zamiany tekstu na mowę lub mowy na tekst?

Od razu powiem, że zamiana tekstu na mowę jest znacznie lepiej rozwinięta pod względem programistycznym. Od lat istnieje wiele narzędzi, które potrafią składać literkę do literki, wyraz do wyrazu a automatyczni lektorzy działają coraz lepiej. Aby móc udostępnić użytkownikom swojego serwisu www możliwość odsłuchiwania treści zamieszczonych na stronie wystarczy po prostu zainstalować odpowiednią aplikację, a następnie zaznaczyć miejsca które mogą być czytane głosowo.

Trochę inaczej ma się sprawa z procesem odwrotnym, czyli zamianą mowy na tekst. Już na pierwszy rzut oka potrafimy się domyślić, że jest to proces trudniejszy chociażby dlatego że każdy człowiek posługujący się tym samym językiem mówi trochę inaczej - ma po prostu inną dykcję. Dodatkowo istnieją regionalne różnice w wymowie danego języka, co dotyczy nawet tak jednorodnego społeczeństwa jak polskie. Co więcej komputer nie zawsze jest w stanie pojąć naszą intonację, więc i z interpunkcją może mieć kłopoty. Aby sprawę dodatkowo skomplikować, z powodów naturalnej w życiu ludzkim konkurencji, istnieje wiele ośrodków zajmujących się zamianą mowy na tekst. W rezultacie powstało wiele rozwiązań część na poziomie sprzętowym, część na poziomie aplikacji część płatnych część bezpłatnych służący do tego celu. Tak duży wybór rozwiązań zmusza nas niestety do przetestowania kilku lub kilkunastu zanim wybierzemy to które najbardziej nam pasuje.

Niemniej jednak już dziś wyraźnie widać, że dyktowanie jest lepsze niż pisanie na klawiaturze. Ja już prawie nie pamiętam kiedy ostatni mail napisałem stukając w klawisze. 

Przypuszczam że następną rewolucją w korzystaniu z Internetu równą o tej, jaką było wprowadzenie smartfonów będzie właśnie powszechne wprowadzenie komunikacji głosowej z komputerem (zarówno na wejściu jak i na wyjściu). 

Na koniec dodam, że bardzo użyteczną sprawą jest podyktowanie artykułu komputerowi, a następnie - w celu jego sprawdzenia - odsłuchanie go za pomocą automatycznego lektora. Takie postępowanie jest po prostu mniej nudne niż sczytywanie zapisanego tekstu.

------

 *  Proszę jak człowiek ulega rutynie. Użyłem terminu "napisałem", chociaż powinienemzgodnie z prawdą posłużyć się terminem "podyktowałem".

 

Czcionka
Kontrast

Porównaj Oferty