Intel czyta z ruchu warg

Firma Intel udostępniła bezpłatnie kod źródłowy programu do rozpoznawania mowy na podstawie ruchu warg. Aplikacja Audio Visual Speech Recognition (AVSR) jest elementem biblioteki OpenCV, w której Intel umieszcza programy do analizy obrazu (m.in. identyfikacji osób na podstawie zdjęcia twarzy).


Firma Intel udostępniła bezpłatnie kod źródłowy programu do rozpoznawania mowy na podstawie ruchu warg. Aplikacja Audio Visual Speech Recognition (AVSR) jest elementem biblioteki OpenCV, w której Intel umieszcza programy do analizy obrazu (m.in. identyfikacji osób na podstawie zdjęcia twarzy).

Przedstawiciele Intela twierdzą, że efektywność AVSR jest znacznie wyższa niż w przypadku tradycyjnych algorytmów rozpoznawania mowy na podstawie zarejestrowanych dźwięków. Twórcy aplikacji polecają jednak komplementarne wykorzystywanie rozpoznawania obrazu i dźwięku. Szczególnie dobre efekty uzyskiwane są po spersonalizowaniu programu i dopasowaniu go do sposobu mówienia poszczególnych użytkowników (AVSR może współpracować ze wspomnianym modułem do rozpoznawania twarzy).

Intel bezpłatnie udostępnia niektóre aplikacje ze swoich laboratoriów, ponieważ liczy że nowe zastosowania komputerów skłonią użytkowników do wymiany sprzętu na nowszy. Firma chce stymulować rynek, a zaawansowane oprogramowanie do analizy obrazu wyśmienicie się do tego nadaje - wymaga bowiem szybkich procesorów.

Reklama

(4D)

INTERIA.PL
Dowiedz się więcej na temat: ANALIZY | mowy | firma | Intel
Reklama
Reklama
Reklama
Reklama
Reklama
Strona główna INTERIA.PL
Polecamy