HomeProductsDownloadOrderSupportSearch
  
 
 Myriad Blog 1.3.0 Thursday, Mar 28th, 2024 at 09:41pm 

Thursday, Jan 14th, 2010 at 05:13pm
Recherche de séquence mélodique ? (Partie 2)

 
Nous sommes en train de mettre en place des versions spartiates du système de balayage de sites et de conversion des partitions en code permettant les recherches mélodiques.
 
Outre la mélodie, il devrait également être possible d'effectuer des recherches textuelles sur toutes les informations contenues dans le fichier : commentaires, titre et compositeur, paroles, et pourquoi pas la grille d'accord si celle-ci est disponible. Cela permettrait ainsi de rechercher rapidement toutes les versions d'un morceau connu (ex Chaconne de Bach), dans tous les formats de fichiers reconnus par nos logiciels (MIDI, KAR, MUS, MYR, ENC, ABC, TAB, RHP, MOD, etc, etc, y compris en PDF).
 
Reste le problème de l'étendue de la recherche.  
 
Pour les fichiers de MUSL, aucun problème ni technique ni juridique.  
 
Etendre la recherche à un pannel de sites connus, qui autorisent les moteurs d'indexation et qui proposent des partitions libres de droit, nous ne voyons pas de problème non plus.
 
Reste la possibilité d'étendre la recherche au contenu complet d'Internet. Techniquement, cela peut poser des problèmes de stockage, mais ça, c'est notre problème. Légalement, on pourrait nous reprocher de proposer des liens vers des contenus illégaux.  Pourtant, le rapprochement avec Google paraitrait naturel. Il ne s'agirait ni plus ni moins qu'un Google qui traiterait la musique au lieu de traiter les textes. Mais il arrive que ce qui paraît évident au technicien échappe au juriste.  
 
S'il est incontestable qu'un accès centralisé à toutes les sources de partitions musicales en ligne pourrait être d'une grande utilité à de nombreuses personnes, cela vaut-il la peine de prendre un risque sur le plan juridique?
 
Nous nous interrogeons. Vraiment.
by Olivier Guillion
Comments

Comment from CRI-CRI Thursday, Jan 14th, 2010 at 06:06pm
Prise de risque
J'ai déjà réfléchi à la question dans mon coin lors de la mise en place de MUSL, et avant à l'occasion d'un certain Concours (par contre, j'ai oublié lequel)
 
Ma réponse si j'étais en position d'avoir à faire un tel choix serait : non à la recherche tous azimuts : trop dangereux et surtout, incontrôlable, si d'aventure la machine se prenait à choper le hoquet juridique
 
Comme le codage "Domaine public / Copyright" n'est pas homogène d'un pays à l'autre, et le Net étant sans frontière, il vaudrait peut-être mieux opérer effectivement :
 
1 - entre nous à titre expérimental (Espace MUSL)
 
2 - ensuite, et en cas de test satisfaisant, étendre l'expérience à quelques sites francophones (listés limitativement) dont on puisse être certain que la mention "Domaine public" revête une acception compatible avec la jurisprudence des affaires de cette catégorie traitées dans l'Union Européenne
 
Prendre un conseil d'avocat serait hautement recommandé dans un tel domaine  
 
Sous ces réserves de bon sens, l'idée reste intéressante, mais je ne suis pas convaincu que cette réflexion séduisante de prime abord puisse justifier en dernière analyse une telle prise de risque
 
Cordialement  

Comment from Olivier Thursday, Jan 14th, 2010 at 06:35pm
Petite précision
A noter cependant que si, avec MUSL, les oeuvres postées, bien que sous la responsabilité de leur auteur, sont stockées sur nos serveurs (nous sommes alors hébergeurs), dans le cas de la recherche Web ils ne le sont pas.
 
Le moteur de recherche se contenterait de proposer des liens sur des pages ou des fichiers, qui sont déjà trouvables avec Google par exemple.
On n'a jamais vu Google attaqué parce que l'extrait de texte qu'il présente dans les résultats de recherche enfreint le copyright ou toute autre loi...

Comment from Mick Thursday, Jan 14th, 2010 at 06:36pm
(No subject)
Bonjour,
 
http://fr.musipedia.org/index.php?id=1&L=1
 
voici un lien sur un site que vous connaissez peut-être?
 
Cordialement.
Mick

Comment from CRI-CRI Thursday, Jan 14th, 2010 at 07:32pm
Un oranger sur le sol irlandais
On n'a jamais vu Google attaqué parce que l'extrait de texte qu'il présente dans les résultats de recherche enfreint le copyright ou toute autre loi...  
 
Je suis d'accord si l'on en reste aux extraits (la jurisprudence admet les courtes citations a des fins d'étude), que le copyright, s'il existe, est bien mentionné en tête de l'extrait, et que le bidule est présenté comme un moteur de recherche dont la requête de lancement est une saisie de l'utilisateur (ce qui définit sa responsabilité), ce que prend bien soin de faire Musipedia : en fait, celui-ci sert assez restrictivement à trouver une référence dont on a égaré le titre, à partir duquel etc... (direction les souterrains du château...  )
 
Dernière remarque : le jamais vu, c'est le pain béni des plaideurs, croyez-moi  
 
 
 
 
 

Comment from Mick Thursday, Jan 14th, 2010 at 10:05pm
Musipedia
Désolé de ne pas avoir retenu votre première phrase dans le message d'hier mercredi 13 janvier, citant le site de "Musipedia".
 
Cordialement.

Comment from Pascal Peyremorte Friday, Jan 15th, 2010 at 11:39am
Autorisations d'indexation
Bonjour,
 
Il y a plusieurs sites de recheches sur Internet, dont au moins un qui propose même des recherches dans les flux P2P pirates, et à priori légalement, au moins en suède.
 
Même si je trouve inacceptable la forme utilisée par ses gestionnaires dans leurs réponses  (provoc virulente et souvent grossière), je suis forcé de reconnaitre que leur argument est difficilement attaquable :
 
- nous ne faisons qu'un catalogue de ce qui se trouve sur l'internet. En aucun cas le contenu catalogué ne nous appartient pas plus que nous ne l'hébergeons.
 
C'est un peu comme si un catalogue d'œuvres d'art n'avait pas le droit de répertorier une œuvre volée sous le prétexte que le vol est illégal, ou une œuvre accessible dans un musée ou chez un particulier sous prétexte que ce serait une incitation au vol.
 
Il me semble clair que c'est celui qui héberge et met à disposition du public un contenu illégal qui est en tort. Ces moteurs de recherches les affichent au grand jour. (Et peuvent être des outil au service des autorités !!!).
 
 
En tout état de cause, quasiment tous les sites ont un lien "webmaster", "contact" ou équivalent. On peut imaginer qu'un robot qui parcourrait l'internet puisse essayer de contacter le titulaire du site pour obtenir une autorisation d'indexage.  
De la même façon, il est possible d'autoriser un utilisateur à soumettre son site pour indexage sous sa responsabilité, le bouche à oreille faisant alors son travail. Les "gros" sites de partitions et musiques gratuits ne sont pas en quantité infinie, et encore plus les site commerciaux se feront sûrement une joie d'apparaitre dans un tel outil.  
 
Pascal

Comment from Jean-Armand Moroni Friday, Jan 15th, 2010 at 11:26pm
Recherche de partitions
C'est amusant, j'ai eu la même idée (moteur de recherche de partition) il y a trois mois !! En pensant aux partitions en PDF et à votre logiciel PDFToMusic.
 
Pour ce qui concerne le moteur de recherche proprement dit, vous avez intérêt à regarder un code open-source comme celui de Lucene. L'industrie informatique a maintenant dix ans d'expérience dans la conception de moteurs de recherche, et tout le monde (Google, Autonomy, Exalead, Lucene...) utilise à peu près la même technologie d'indexation et recherche ; voir l'article "MapReduce" de Wikipedia.
 
Il y a toutefois, entre l'indexation de mots et celle de musique, plusieurs grosses différences qui pourraient justifier que vous implémentiez votre propre solution :
- Un texte est un flux discontinu (les mots sont séparés les uns des autres) tandis que la musique est un flux continu de notes : quoi indexer dans ce flux ?
- Un texte est linéaire tandis que la musique est à deux dimensions car il y a plusieurs voix. Faut-il indexer chaque voix séparément, ou bien les accords, ou une combinaison des deux ?
- Un thème peut présenter des différences d'écriture importantes, tout en continuant à être ressenti de la même façon par l'auditeur. On peut le transposer, multiplier ou diviser les valeurs des notes par une quantité fixe, répéter des notes, ajouter des notes de passage, broderies, appoggiatures... l'auditeur continue d'entendre le même thème.
 
Point à noter, la SACEM dispose d'un outil interne permettant la recherche de morceaux de musique directement dans les mp3, ceci afin de détecter des plagiats et des publications non autorisées sur Internet. Il paraît que ça marche plutôt mieux que ce à quoi on pourrait s'attendre.

Comment from Sylvain Machefert Saturday, Jan 16th, 2010 at 04:21pm
durée et transposition
pour les durées, je les ai tout simplement ignorées... il faudrait que j'indexe les rythmes, et je vois pas trop comment pour le moment.
 
les apoggiatures, mordants... sont ignorés aussi
 
la transposition, les codes Parsons permettent de s'affranchir de ce problème, ils indique juste "ça monte", "ça descend", "c'est la même note". On perd même la notion d'intervalle entre les notes.
 
Pour l'instant, je fais 4 recherches dans l'ordre suivant, les "scores" des résultats vont décroissant
- les intervalles (au clair de la lune = +0+0+2+2-2-2+4-2+0-2)
- les codes parsons (RRUUDDUDRD)
- les codes parsons sans les notes répétés (UUDDUDD)
- les codes parsons simplifiés (RUDUDRD) => si ya une note de transition dans une montée/une descente... on retrouve quand même
 
(peut-être j'ai inversé les 2 derniers, j'ai pas l'algo sous la main)

Comment from CRI-CRI) Saturday, Jan 16th, 2010 at 07:00pm
Indexation du rythme
Le code Parson (rigolo : son nom est Parsons  ) ne peut-il pas analyser un rythme de manière analogue à ce qu'il fait pour la mélodie ?
 
Si j'ai bien compris, ce que ce codage stocke, ce sont les inflexions, il ne s'intéresse pas aux périodicités de ces inflexions, en rythme, les inflexions, ce sont des fluctuations de durée des notes
 
Durée plus courte
Durée plus longue
Durée égale
Accessoirement : durée de la première note de la mesure
 
Si on l'utilise comme critère secondaire optionnel, isoler la répétition périodique des cellules rythmiques ne devrait pas être plus indispensable à l'indexation que ne l'est l'analyse des cadences pour les mélodies (bon, là, je m'avance un peu, j'en conviens)
 
Mais il se peut que je me trompe de A à Z
 
Promis, je ne recommencerai plus  
 
Cordialement  

Comment from Sylvain Machefert Saturday, Jan 16th, 2010 at 11:40pm
(No subject)
bonne idée !
 
Les codes Parsons permettent de coder les changement de hauteur U=up, D=down, R=euh? Repeat?... très bonne idée, reste plus qu'à faire le même avec S=shorter, L=longer, E=equals...
 
mais après pour rentrer une mélodie à recherche, ça se complexifie... faut que je pirate entièrement le script de musipedia

Comment from CRI-CRI Sunday, Jan 17th, 2010 at 05:52pm
Bonne idée (suite)
Il me semble qu'un bon moyen de s'en tirer serait de définir dans la requête de départ la priorité : soit la première extraction se fait sur le rythme, soit sur la mélodie, le critère prioritaire définissant a contrario le critère secondaire, qui s'applique ensuite pour affiner la première sélection obtenue
 
Exemple tiré du chapeau, pour illustrer : si je donne la priorité à l'analyse / recherche par le rythme, la cellule "Oum-pa-pa oum pa pa", 4 ou 5 fois répétée, va livrer aussi sec une première sélection du million de valses à trois temps qui traînent sur le net, et le deuxième codage se chargera d'extraire ensuite de ce magma les mélodies qui se ressemblent plus ou moins : on aura bien isolé l'intersection de ces deux catégories de musique (conditions 1 et 2 vraies)
 
Plus sérieusement, les rythmes irréguliers (aksak par exemple) devraient être assez typés pour pouvoir les débusquer facilement, non ?
 
Inversement, pour une musique pas rythmée du tout, il faudrait pouvoir sélectionner la recherche mélodique comme seul critère
 
En résumé : les quatre options M suivi de R, R suivi de M, M seul et R seul devraient permettre de s'adapter à la plupart des contextes
 
C'est tout pour le moment  
 
Cordialement  

Comment from Sylvain Machefert Sunday, Jan 17th, 2010 at 06:20pm
Aksak... de patates
rythme irrégulier ou pas, c'est la succession des notes écrites sur la portée, pas les temps forts.
 
la symphonie 40 de Mozart est du 4/4, mais la recherche rythmique devra repérer croche croche noire, croche croche noire... (mib ré ré, mib ré ré)
 
On peut préciser la recherche en indiquant la mesure (je cherche une valse = 3 temps, un lesnoto = 7 temps), ou encore le mode (majeur, locrien...)


Most recent first
Oldest first

Top of page
Legal information Cookies Last update:  (c) Myriad