Intel czyta z ruchu warg

Firma Intel udostępniła bezpłatnie kod źródłowy programu do rozpoznawania mowy na podstawie ruchu warg. Aplikacja Audio Visual Speech Recognition (AVSR) jest elementem biblioteki OpenCV, w której Intel umieszcza programy do analizy obrazu (m.in. identyfikacji osób na podstawie zdjęcia twarzy).

Przedstawiciele Intela twierdzą, że efektywność AVSR jest znacznie wyższa niż w przypadku tradycyjnych algorytmów rozpoznawania mowy na podstawie zarejestrowanych dźwięków. Twórcy aplikacji polecają jednak komplementarne wykorzystywanie rozpoznawania obrazu i dźwięku. Szczególnie dobre efekty uzyskiwane są po spersonalizowaniu programu i dopasowaniu go do sposobu mówienia poszczególnych użytkowników (AVSR może współpracować ze wspomnianym modułem do rozpoznawania twarzy).

Reklama

Intel bezpłatnie udostępnia niektóre aplikacje ze swoich laboratoriów, ponieważ liczy że nowe zastosowania komputerów skłonią użytkowników do wymiany sprzętu na nowszy. Firma chce stymulować rynek, a zaawansowane oprogramowanie do analizy obrazu wyśmienicie się do tego nadaje - wymaga bowiem szybkich procesorów.

(4D)

Dowiedz się więcej na temat: ANALIZY | mowy | firma | intel

Reklama

Najlepsze tematy

Reklama

Strona główna INTERIA.PL

Polecamy

Rekomendacje