Readings Newsletter
Become a Readings Member to make your shopping experience even easier.
Sign in or sign up for free!
You’re not far away from qualifying for FREE standard shipping within Australia
You’ve qualified for FREE standard shipping within Australia
The cart is loading…
L'analyse de visages est un sujet de recherche tres actif puisqu'il concerne de nombreux domaines d'application tels que la securite, la robotique (interaction homme machine, expression des emotions), le handicap (communication par le visage), etc. Dans ce cadre de recherches, nous avons mis en place un systeme de reconnaissance de visages parlants visant a ameliorer la robustesse du systeme de comprehension et d'interpretation pragmatique de la communication homme machine multimodale CHMM par l'introduction de visemes. Les signaux etudies sont des sequences monosyllabiques representant les 28 phonemes de la langue Arabe. Plusieurs classifieurs ont ete utilises et une evaluation des resultats est proposee. Notre analyse de la fusion serielle des parametres acoustiques, utilise les parametres MFCC/PLP et dans le cas du visuels les parametres DCT/DWT, on obtient ainsi des vecteurs audiovisuels, ces derniers servent comme vecteurs d'entree au classifieur neuronal MLP ou RBF pour realiser la reconnaissance audiovisuelle du locuteur dependant de syllabes Arabes. Nous avons montre que la modalite visuelle ameliore fortement les resultats de la reconnaissance acoustique.
$9.00 standard shipping within Australia
FREE standard shipping within Australia for orders over $100.00
Express & International shipping calculated at checkout
L'analyse de visages est un sujet de recherche tres actif puisqu'il concerne de nombreux domaines d'application tels que la securite, la robotique (interaction homme machine, expression des emotions), le handicap (communication par le visage), etc. Dans ce cadre de recherches, nous avons mis en place un systeme de reconnaissance de visages parlants visant a ameliorer la robustesse du systeme de comprehension et d'interpretation pragmatique de la communication homme machine multimodale CHMM par l'introduction de visemes. Les signaux etudies sont des sequences monosyllabiques representant les 28 phonemes de la langue Arabe. Plusieurs classifieurs ont ete utilises et une evaluation des resultats est proposee. Notre analyse de la fusion serielle des parametres acoustiques, utilise les parametres MFCC/PLP et dans le cas du visuels les parametres DCT/DWT, on obtient ainsi des vecteurs audiovisuels, ces derniers servent comme vecteurs d'entree au classifieur neuronal MLP ou RBF pour realiser la reconnaissance audiovisuelle du locuteur dependant de syllabes Arabes. Nous avons montre que la modalite visuelle ameliore fortement les resultats de la reconnaissance acoustique.