Wiki source for Blog20151009TrierMaMusique
J'ai de l'ordre de 500 CD que j'ai quasi fini de passer en ogg vorbis, me reste à la trier, m'assurer que j'ai tout, la tagguer et faire des stats :-)
===Trier ma musique===
complétude / référence
~- liste des fichiers avec les critères permettant des comparaisons (md5sum)
~- rassembler les fichiers sur une référence : m'assurer qu'il n'y a pas de doublon ou d'oubli sur un disque dans ce que j'ai déjà converti
~- m'assurer qu'il n'y a pas de CD que j'aurais oublié de convertir (liste)
~- faire quelques stats
~- ajouter des tags grâce aux bons logiciels
===Ouils existant permettant d'aider à tout cataloguer===
https://linuxfr.org/news/katal-catalogue-de-fichiers cf. https://pypi.python.org/pypi/Katal
https://linuxfr.org/forums/general-cherche-logiciel/posts/je-cherche-logiciel-pour-comparer-les-photos digikam gqview + simpliste : ma méthode initiale avec md5sum, un peu trop limitée
https://linuxfr.org/forums/general-cherche-logiciel/posts/savoir-si-2-images-sont-identiques fdupes,
https://linuxfr.org/forums/general-cherche-logiciel/posts/identification-dimages-identiques imgSeek
https://linuxfr.org/forums/general-cherche-logiciel/posts/rep%C3%A9rer-et-supprimer-les-images-en-plusieurs-exemplaires-digika fdupes python3 script
===Démarche pour rassembler les fichiers===
Le tout est de recenser tout ce que j'ai dans un premier temps et de constituer un répertoire de référence, que je pourrai ensuite mettre au propre
~- passer sur chacun de mes ordis et identifier les fichiers de zik que j'aurais en plus
~- un md5sum peut permettre de trouver les fichier en plus,
~~- pour identifier les doublons cela fonctionne aussi (doublon exact : si même zik convertie par 2 fois, les meta-tags seront sans doute différent, autre méthode à trouver)
~- rationaliser le nommage (voir plus bas), déjà pour les répertoires
===Identification des fichiers en plus===
%%bash
md5sum repertoire_zik | sort > liste_fic_zik_reference.txt
md5sum repertoire2_zik | sort > liste_fic_zik.txt
gawk '{ print $1 }' liste_fic_zik_reference.txt > liste_md5_fic_zik_reference.txt # ne garde que les md5
gawk '{ print $1 }' liste_fic_zik.txt > liste_md5_fic_zik.txt # ne garde que les md5
diff -Naur liste_md5_fic_zik_reference.txt liste_md5_fic_zik.txt | grep -E "^+" > liste_fic_md5_zik_plus.txt # ne garde que les md5 des fichiers en plus
%%
Reste ensuite à retrouver les fichiers correspondant aux MD5 et à les recopier dans la référence, rejouer la procédure pour s'assurer qu'aucun fichier n'a été oublié :-)
===Rationalisation de la référence===
Il s'agit de ranger les albums d'un même artiste dans le même répertoire :-)
~- normaliser les répertoires utilisés, évitant la dispersion dans des arborescences différentes d'un même artiste (pour Iggy Pop, je vais un peu ramer...)
~- choisir tout en minuscule avec des tirets ou conserver un nommage lisible (je suis plutôt pour le premier, ça me facilitera souvent la tâche pour identifier visuellement les ajouts)
~- virer les doublons au besoin
===Tagguer correctement les fichiers===
Regarder les tags qui ont été mis au cours du temps, commencer par des statistiques
~- identifier les artistes pouvant être facilement corrigés
~- voir la complétude des tags, leur pertinence, les styles majoritaires, les écarts de style pour un même artiste, les écarts de nommage de l'artiste (faire des choix)
~- voir les infos supplémentaires (taux de compression...) pour identifier s'il faudrait ré-encoder certains titres (à garder pour ensuite)
===Identification de logiciels pour tagguer correctement===
Retrouver les demandes régulières sur LinuxFr.org (tag id3_tag je crois)
~-
~-
Le faire, au besoin en attribuant des notes.
===Statistiques de tags===
voir ce qu'il est possible de faire comme statistiques
~- type de musique / nb groupes / nb albums
~- groupes / nb albums / nb chansons / durée ?
~- un peu de big data, de deep drilling toussa, de qualité de la donnée pour revenir ci-dessus
===Conversion de ce qui manque===
C'est plutôt à garder une fois que tout ce qui a déjà été converti aura été rassemblé dans une référence et que le nommage permettra de retrouver facilement un titre.
~- par rapport aux listes : à rationaliser au préalable : artiste + album
~- convertir avec les dernières versions d'oggenc (revoir les paramètres au besoin, actuellement je suis passé à sound juicer et je laisse les paramètres par défaut (il utilise oggenc je crois, en ogg vorbis donc, sans doute vers 386 kb/s ou autres paramètres...)
===Transfert===
pour 140 Go, annoncé à 1h, ça prend plutôt 1h30 à 30 Mo/s
----
CategoryHobby
===Trier ma musique===
complétude / référence
~- liste des fichiers avec les critères permettant des comparaisons (md5sum)
~- rassembler les fichiers sur une référence : m'assurer qu'il n'y a pas de doublon ou d'oubli sur un disque dans ce que j'ai déjà converti
~- m'assurer qu'il n'y a pas de CD que j'aurais oublié de convertir (liste)
~- faire quelques stats
~- ajouter des tags grâce aux bons logiciels
===Ouils existant permettant d'aider à tout cataloguer===
https://linuxfr.org/news/katal-catalogue-de-fichiers cf. https://pypi.python.org/pypi/Katal
https://linuxfr.org/forums/general-cherche-logiciel/posts/je-cherche-logiciel-pour-comparer-les-photos digikam gqview + simpliste : ma méthode initiale avec md5sum, un peu trop limitée
https://linuxfr.org/forums/general-cherche-logiciel/posts/savoir-si-2-images-sont-identiques fdupes,
https://linuxfr.org/forums/general-cherche-logiciel/posts/identification-dimages-identiques imgSeek
https://linuxfr.org/forums/general-cherche-logiciel/posts/rep%C3%A9rer-et-supprimer-les-images-en-plusieurs-exemplaires-digika fdupes python3 script
===Démarche pour rassembler les fichiers===
Le tout est de recenser tout ce que j'ai dans un premier temps et de constituer un répertoire de référence, que je pourrai ensuite mettre au propre
~- passer sur chacun de mes ordis et identifier les fichiers de zik que j'aurais en plus
~- un md5sum peut permettre de trouver les fichier en plus,
~~- pour identifier les doublons cela fonctionne aussi (doublon exact : si même zik convertie par 2 fois, les meta-tags seront sans doute différent, autre méthode à trouver)
~- rationaliser le nommage (voir plus bas), déjà pour les répertoires
===Identification des fichiers en plus===
%%bash
md5sum repertoire_zik | sort > liste_fic_zik_reference.txt
md5sum repertoire2_zik | sort > liste_fic_zik.txt
gawk '{ print $1 }' liste_fic_zik_reference.txt > liste_md5_fic_zik_reference.txt # ne garde que les md5
gawk '{ print $1 }' liste_fic_zik.txt > liste_md5_fic_zik.txt # ne garde que les md5
diff -Naur liste_md5_fic_zik_reference.txt liste_md5_fic_zik.txt | grep -E "^+" > liste_fic_md5_zik_plus.txt # ne garde que les md5 des fichiers en plus
%%
Reste ensuite à retrouver les fichiers correspondant aux MD5 et à les recopier dans la référence, rejouer la procédure pour s'assurer qu'aucun fichier n'a été oublié :-)
===Rationalisation de la référence===
Il s'agit de ranger les albums d'un même artiste dans le même répertoire :-)
~- normaliser les répertoires utilisés, évitant la dispersion dans des arborescences différentes d'un même artiste (pour Iggy Pop, je vais un peu ramer...)
~- choisir tout en minuscule avec des tirets ou conserver un nommage lisible (je suis plutôt pour le premier, ça me facilitera souvent la tâche pour identifier visuellement les ajouts)
~- virer les doublons au besoin
===Tagguer correctement les fichiers===
Regarder les tags qui ont été mis au cours du temps, commencer par des statistiques
~- identifier les artistes pouvant être facilement corrigés
~- voir la complétude des tags, leur pertinence, les styles majoritaires, les écarts de style pour un même artiste, les écarts de nommage de l'artiste (faire des choix)
~- voir les infos supplémentaires (taux de compression...) pour identifier s'il faudrait ré-encoder certains titres (à garder pour ensuite)
===Identification de logiciels pour tagguer correctement===
Retrouver les demandes régulières sur LinuxFr.org (tag id3_tag je crois)
~-
~-
Le faire, au besoin en attribuant des notes.
===Statistiques de tags===
voir ce qu'il est possible de faire comme statistiques
~- type de musique / nb groupes / nb albums
~- groupes / nb albums / nb chansons / durée ?
~- un peu de big data, de deep drilling toussa, de qualité de la donnée pour revenir ci-dessus
===Conversion de ce qui manque===
C'est plutôt à garder une fois que tout ce qui a déjà été converti aura été rassemblé dans une référence et que le nommage permettra de retrouver facilement un titre.
~- par rapport aux listes : à rationaliser au préalable : artiste + album
~- convertir avec les dernières versions d'oggenc (revoir les paramètres au besoin, actuellement je suis passé à sound juicer et je laisse les paramètres par défaut (il utilise oggenc je crois, en ogg vorbis donc, sans doute vers 386 kb/s ou autres paramètres...)
===Transfert===
pour 140 Go, annoncé à 1h, ça prend plutôt 1h30 à 30 Mo/s
----
CategoryHobby