Comprendre son interlocuteur et se faire comprendre est la base d’une bonne communication. Cela vaut pour tout type d’échange verbal, car par rapport aux gestes, aux expressions faciales et aux signes, le langage oral a un réel avantage, car il transmet plus clairement le sens de ce qui est dit : il suffit d’une légère pause avant un mot ou d’une intonation légèrement différente pour varier totalement le sens d’une affirmation.
Il est donc d’autant plus important de transmettre les voix au téléphone exactement telles qu’elles le sont, sans retard et sans distorsion. Dans le meilleur des cas, comme si les interlocuteurs étaient assis dans la même pièce. Mais comment y parvenir ? Dans un processus dans lequel l’analogique est converti en numérique et le numérique en analogique. Le signal est comprimé, emballé, puis déballé et reconverti, mais il en résulte quelque chose qui peut être identifié comme une « voix » individuelle. Une petite merveille.* En jetant un coup d’œil dans les coulisses, nous vous montrons ce qui est important pour une bonne qualité audio en téléphonie IP.
Les points de blocages ?
Dans la communication numérique, la parole est numérisée par certains codecs et comprimée en paquets de données. Mais le chemin que prennent les paquets de données (routage) est tout aussi important. Il est essentiel que tous les paquets de données arrivent dans le bon ordre et au bon moment. Si ce n’est pas le cas, il se produit une variation du temps d’exécution des paquets de données, perceptible comme une voix « cassée » ou « métallique ». Cela est particulièrement évident dans les canaux de téléphonie dits « gratuits », tels que Skype et autres, où aucune distinction n’est faite entre les fichiers de transmission vocale et les autres formats. Dans ce cas, les fichiers vocaux ne sont pas prioritaires et arrivent donc souvent au récepteur de manière incorrecte ou tardive.
Un autre problème survient lorsque la connexion Internet est trop faible : selon le codec utilisé, il faut entre 3 kbit/s – GSM – et 128 kbit/s – G711-G722 – pour une bonne transmission de la voix. En raison de la hiérarchisation de la voix, le réseau est initialement ralenti, mais vous passez ensuite à un codec avec une consommation minimale, ce qui peut également entraîner une perte de qualité.
La qualité n’est pas un hasard
Une fois ces obstacles surmontés, une bonne transmission vocale est loin d’être garantie, car un point crucial, potentiellement faible, entre en jeu : le terminal !
Tout commence par la conception initiale de l’appareil et le positionnement optimal des haut-parleurs et des microphones en fonction de leur domaine d’application, par exemple dans le combiné ou les unités mains libres. À l’étape suivante, il est nécessaire de coordonner le choix des composants matériels. Ici, il est également important d’évaluer la compatibilité entre les composants afin que les performances soient à la hauteur du codage et de l’envoi des données.
Chez Snom, le processus de vérification de la qualité audio d’un nouveau produit commence dès que le premier projet est disponible, puis il se poursuit et est optimisé par les premiers échantillons de moulage par injection plastique régulièrement tout au long du cycle de vie du produit. Au fil des ans, le fabricant berlinois a été en mesure d’améliorer constamment la qualité sonore de ses produits en combinant les derniers algorithmes DSP avec ses capacités VoIP, grâce à sa grande expérience et à son laboratoire audio. En particulier, Snom a réussi à résoudre plusieurs problèmes caractéristiques de la technologie VoIP, tels que les retards de traitement et de réseau, la perte de paquets de réseau et le bruit de fond.
C’est cette attention portée aux détails lors de la phase de conception qui caractérise les différences de qualité de la voix dans les téléphones. Les tests subjectifs sont tout aussi importants que les tests objectifs : un téléphone objectivement bien réglé peut offrir une qualité sonore médiocre dans la pratique. Pour Snom, un appareil audio bien réglé est celui qui est soumis à un cycle de réglages objectifs, suivi d’une période de sessions subjectives : ce n’est que lorsque les deux évaluations répondent aux exigences, tant en termes d’acoustique du combiné que de haut-parleur, qu’il est approuvé.
La plupart des utilisateurs ignorent cependant à quel point la technologie qui sous-tend la qualité audio est complexe et exigeante, si l’on en croit les expériences souvent médiocres avec les smartphones les plus sophistiqués ou les téléphones design. Ici, la différence est… audible !
Pour en savoir plus sur la transmission vocale numérique : https://www.snom.com/solutions/audio/