Le Centre des Technologies de la Parole de Saint-Pétersbourg vient d'achever la mise au point de Voice Digger, la première technologie de reconnaissance de mots-clés dans des données audio en langue russe. Il s'agit de la première réalisation commerciale en Russie dans ce domaine, connu également sous l'appellation d' "audio data mining".
Ce procédé permet de repérer automatiquement dans un document audio des mots-clés ou des groupes de mots, sans étude préalable du flux vocal. Il apporte ainsi une contribution irremplaçable au travail d'archivage et de veille dans le domaine audio. Voice Digger repose sur la reconnaissance en flux continu du discours réalisée sur la base des HMM (Modèles de Markov Cachés). Les mots-clés sont donnés sous la forme d'un texte ordinaire, pour lequel le système construit le modèle HMM de chaque mot à partir d'un modèle de fond (de discours général). Pour construire des modèles de mots-clés, on utilise un transcripteur de langue russe et des modèles acoustiques de fonds pour la langue russe. Le système est assez rapide puisqu'il ne dépend pas du lexique. La marge d'erreur ne dépasse pas les 8%. Les modèles créés sur la base de Voice Digger permettront de traiter des volumes importants d'enregistrements et toutes les données multimédias.
Le Centre des Technologies de la Parole est une société innovante de Saint-Pétersbourg qui élabore des solutions et produits high-tech dans le domaine des technologies de la parole, des enregistrements vocaux et du traitement informatique du son. Il fait partie de l'un des trois leaders technologiques mondiaux du traitement informatique de l'information vocale.
Contact :
Centre des Technologies de la Parole de Saint-Pétersbourg - http://www.speechpro.com - tél : +7 812 325 8848, fax : +7 812 327 92 97
Source : - Rosbalt - http://www.rosbalt.ru
- Novy Region - http://www.nr2.ru
Rédacteur : Ambassade de France en Russie - SSTE