Un kit pour l'analyse et la synthèse des données

Comment créer une banque de données pour les formats .wav ou .mid

Dans cette page, je décris comment créer des banques, qui pourront servir pour l'analyse et la synthèse sonore.

Je me limite aux formats wav et midi, mais la démarche peut s'appliquer à beaucoup d'autres formats. On commencera par enregistrer un .wav ou un .mid, avec un outil standard. Vous pouvez aussi créer une source .wav, en y plaçant les unes à la suite des autres, les données de plusieurs .wav Pour cela, vous pouvez utiliser winkit.exe, qui permet de couper et de coller des .wav C'est un .exe pour dos, qui peut être facilement accessible aux aveugles, car toutes les actions s'obtiennent à partir du clavier, sans l'aide de la souris.

Les utilitaires wavind.exe et mciind.exe, pour associer des indications aux bases de données

Une fois que vous aurez construit une source .wav, vous devez lui associer un fichier texte .ind, qui contiendra le texte et les indications de portion, que vous voulez marquer.

Pour cela vous utiliserez les utilitaires wavind.exe ou mciind.exe

Utilisation de wavind.exe

Je commence par décrire comment utiliser wavind.exe, qui va vous permettre de construire très facilement, un fichier prv.ind, qui contiendra les indications de votre choix, pour les portions de votre choix, pour votre source .wav

Chaque utilitaire contient une aide en ligne, qui vous rappellera si besoin est, comment procéder.

Vous commencerez par rechercher votre source à traiter, en appuyant sur la touche r, puis en entrant son nom. Vous pourrez alors écouter le .wav en appuyant sur la touche p, mais l'objet est plutôt d'entendre le contenu, d'une portion que vous aller choisir.

Pour cela appuyez sur la touche c, puis choisissez le début (en octets) de la portion à couper, puis choisissez sa longueur (toujours en octets)

Si vous n'avez aucune idée des nombres qu'il faut entrer, vous pouvez au-paravent appuyer sur la touche a, pour analyser la longueur (en octets) du .wav

Attention : l'outil wavind.exe, ne peut pas traiter les fichiers .wav trop volumineux. Limitez vous à des .wav de quelques centaines de milliers d'octets, et diminuez le volume sonore de votre installation, pour éviter tout risque ! Si vous voulez traiter des données de longueur arbitraire, en toute sécurité, utilisez plutôt l'outil mciind, que je décrirai plus loin.

Quand vous avez coupé une portion correcte, vous entendez son contenu sonore, ce qui vous permet de recommencer l'opération, jusqu'à ce que vous soyez satisfait du résultat.

Il reste alors à affecter un texte, qui correspondra aux indications que vous voulez donner à cette portion, que vous venez de couper.

Pour cela, appuyez sur la touche e, puis entrez le texte que vous voulez enregistrer.

Voila, c'est fini !

Pour ajouter une autre indication, à la suite de celle que vous venez d'enregistrer, vous répéterez ce qui vient d'être fait, et ainsi de suite. Pour éviter toute erreur de manipulation, je vous interdit d'écrire une indication grâce à la touche d'enregistrement e, tant que vous n'avez pas re-sélectionné une nouvelle portion, grâce à la touche couper c.

Quand vous avez terminé le marquage des indications qui vous intéressent, quitter wavind, en appuyant sur la tou che f Je vous signale alors, que le fichier prv.ind a (éventuellement) été créé, dans le répertoire courant où se trouve wavind.exe Renommez ce fichier d'un nom de votre choix, avec un suffixe .ind, pour pouvoir l'utiliser plus tard, par les outils d'analyse et de synthèse.

Vous pouvez aussi, si vous le jugez utile, reprendre le contenu de prv.ind, avec un éditeur de texte ordinaire pour dos (comme edit, ou edlin...)

Vous pouvez aussi utiliser un éditeur pour windows, comme le bloc note, ou wordpad...

J'ai choisi d'écrire les contenus des fichiers d'indication .ind en code ASCI, plutot qu'en unicode, ou autre...) Ceci permet l'utilisation des 255 caractères ASCII imprimables, qui contiennent en particulier quelques signes grecs et mathématiques. Si vous utilisez un éditeur de texte pour windows, comme le blocnote ou wordpad... n'oubliez pas de décoder les caractères accentués ou codés sur 8 bits, au-delà de 127.

Utilisation de mciind.exe

Je commente maintenant l'utilisation de mciind.exe, qui est assez semblable à wavind, mais pour sélectionner des portions d'une source .wav ou .mid, qui servira pour une synthèse et pour une analyse evenementielle, avec les outils mci de windows.

Plus précisément, on choisira de couper des portions, en indiquant le nombre d'octets par seconde, que l'on enverra à la carte sonore. Mais la différence de fonctionnement évenementiels ou non, ne change pas la manière de travailler, si ce n'est que les nombres d'octets par seconde, seront différents des nombres d'octets, quand vous les choisirez grâce à la touche c.

Pour la différence de fonctionnement, vous n'y verrez pas grand chose, en tant qu'utilisateur, la difficulté étant laissée au programmeur !

Vous devez impérativement utiliser mciind.exe, plutôt que wavind.exe, pour des données volumineuses, car la gestion dynamique de la mémoire, nécessite des tableaux d'octets, que j'ai limité à 100000.

Les symboles d'indication

Pour que les programmes reconnaissent si les indications sont en octets par seconde ou en octets, j'ai convenu d'utiliser le symbole £ au lieu du symbole $, pour marquer le début d'une indication.

Les symboles d'indications, comme $, £,dièse,tilde... ont été choisis parmi des caractères ASCII peu utilisés dans les textes. Ceci est naturel, car il est interdit d'utiliser un séparateur dans le texte d'une indication.

L'utilitaire mciind.exe construira le fichier prv.ind comme le fait wavind.exe, mais vous constaterez que ce sont les symboles £, qui y remplaceront les symboles $.

Les outils d'analyse et de synthèse analmci.exe et synmci.exe

Il ne reste plus qu'à utiliser les données mci, ainsi que les .ind qui leur sont associées, avec des outils d'analyse et de synthèse, comme analmci.exe ou syntmci.exe

Ces outils pour windows, permettent de choisir le nom de la source mci, que l'on écrira dans le fichier prv.mci

Ensuite, on pourra écrire un texte descriptif pour cette source, dans le fichier prv.txt Les indications pour le traitement de cette source, seront dans les fichiers prv1_1.ind, prv1_2.ind...

Vous remarquerez que tous les fichiers utilitaires provisoires, portent un nom qui commence par le préfixe prv Ceci permet de les effacer si besoin est, par la commande DOS : erase prv*.*

Vous pourrez vous servir de ces outils, pour lire une phrase en utilisant la synthèse sonore ainsi constituée, ou inversement, utiliser l'analyse de la donnée sonore, pour donner des aides ou des explications, qui utiliseront les textes des indications.

Le lien suivant est destiné à l'aspect programmation. Il n'est pas indispensable, si vous voulez vous limiter à l'utilisation de dynakit, sans y apporter de modifications personnelles.

suivant : dynakit.cpp bibliothèque pour la programmation des outils d'analyse et de synthèse des données

retour au sommaire de la rubrique dynakit