« WikiLex:Changements sur les données » : différence entre les versions
m mise en page |
màj: +2 tâches, 1 en grande partie effectuée et désormais en attente d’une autre |
||
Ligne 1 : | Ligne 1 : | ||
== Ajout de données == | == Ajout de données == | ||
=== Ajout de | === Ajout de la base JORF === | ||
La base JORF contient environ 1M de textes alors que la base LEGI contient 1,1K textes. Les textes actuellement manquants dans WikiLex sont probablement des lois anciennes peu importantes (car non-consolidées) et des textes de rang inférieur de toutes dates plutôt abrogés que réécrits (arrêtés). | |||
=== Types de lois === | |||
Recenser les types de lois spécifiques et récurrents (lois de finances, lois de financement de la Sécurité sociale, lois de programmation, lois de programme…) et tagger cela dans une propriété à définir. | |||
Tenter, autant que faire se peut, de reconnaître automatiquement les différents types afin de disposer de ces règles pour l’avenir (art 2 CC :). Peut-être avec une approche par regex. Bonus : ajouter ces règles à metslesliens. | |||
=== [en attente de JORF] Ajout de eli:amends aux textes dont le titre comporte "modifiant la loi n° XX-XX" === | |||
Au 9 décembre 2019, il y a 7585 telles lois selon [https://query.wikilex.seb35.fr/#PREFIX%20wl%3A%20%3Chttp%3A%2F%2Fwikilex.seb35.fr%2Fentity%2F%3E%0APREFIX%20wlt%3A%20%3Chttp%3A%2F%2Fwikilex.seb35.fr%2Fprop%2Fdirect%2F%3E%0A%0ASELECT%20%3FitemLabel%0AWHERE%20%7B%0A%20%20%3Fnature%20wlt%3AP2%20wl%3AQ2%20.%0A%20%20%3Fitem%20wlt%3AP1%20%3Fnature%20.%0A%0A%20%20%3Fnature%20rdfs%3Alabel%20%3FnatureLabel%20.%0A%20%20%3Fitem%20rdfs%3Alabel%20%3FitemLabel%20.%0A%0A%20%20FILTER%28LANG%28%3FnatureLabel%29%20%3D%20%22fr%22%29%0A%20%20FILTER%28%20REGEX%28%20%3FitemLabel%2C%20%22%5E%28loi%28%3F%3A%20%2Bconstitutionnelle%7C%20%2Borganique%29%3F%7Cordonnance%7Cd%5Be%C3%A9%5Dcret%28%3F%3A-loi%29%3F%7Carr%5Be%C3%AA%5Dt%5Be%C3%A9%5D%29%28%3F%3A%20%2Bn%C2%B0%20%2a%28%5B0-9-%5D%2B%29%29%3F%20%2Bdu%20%2B%28%5B0-9%5D%2Be%3Fr%3F%20%2B%5Ba-z%C3%BB%C3%A9%5D%2B%20%2B%5B0-9IVXLCDM%5D%2B%29%20%2Bmodifiant%20%2B%28%3F%3Al%E2%80%99%7Cla%20%7Cle%20%29%20%2a%28loi%28%3F%3A%20%2Bconstitutionnelle%7C%20%2Borganique%29%3F%7Cordonnance%7Cd%5Be%C3%A9%5Dcret%28%3F%3A-loi%29%3F%7Carr%5Be%C3%AA%5Dt%5Be%C3%A9%5D%29%28%3F%3A%20%2B%5Ba-z%27%5D%2B%29%3F%20%2Bn%C2%B0%20%2a%28%5B0-9-%5D%2B%29%28%3F%3A%20%2Bdu%20%2B%28%5B0-9%5D%2Be%3Fr%3F%20%2B%5Ba-z%C3%BB%C3%A9%5D%2B%20%2B%5B0-9IVXLCDM%5D%2B%29%29%3F%22%2C%20%22i%22%20%29%20%29%20.%0A%7D%0AORDER%20BY%20%3FitemLabel la requête SPARQL correspondant à la regex codée dans le script wikilex-sync] et 7353 avec la propriété eli:amends [https://query.wikilex.seb35.fr/#PREFIX%20wl%3A%20%3Chttp%3A%2F%2Fwikilex.seb35.fr%2Fentity%2F%3E%0APREFIX%20wlt%3A%20%3Chttp%3A%2F%2Fwikilex.seb35.fr%2Fprop%2Fdirect%2F%3E%0A%0ASELECT%20%3Fitem%20%3FitemLabel%20%3FeliAmends%20%3FeliAmendsLabel%0AWHERE%20%7B%0A%20%20%3Fitem%20wlt%3AP1%20%5B%20wlt%3AP2%20wl%3AQ2%20%5D%20.%0A%20%20%3Fitem%20wlt%3AP40%20%3FeliAmends%20.%0A%0A%20%20OPTIONAL%20%7B%20%3Fitem%20rdfs%3Alabel%20%3FitemLabel%20FILTER%28LANG%28%3FitemLabel%29%20%3D%20%22fr%22%20%29%20%7D%20.%0A%20%20OPTIONAL%20%7B%20%3FeliAmends%20rdfs%3Alabel%20%3FeliAmendsLabel%20FILTER%28LANG%28%3FeliAmendsLabel%29%20%3D%20%22fr%22%20%29%20%7D%20.%0A%7D%0AORDER%20BY%20%3FitemLabel]. La différence de [https://query.wikilex.seb35.fr/#PREFIX%20wl%3A%20%3Chttp%3A%2F%2Fwikilex.seb35.fr%2Fentity%2F%3E%0APREFIX%20wlt%3A%20%3Chttp%3A%2F%2Fwikilex.seb35.fr%2Fprop%2Fdirect%2F%3E%0A%0ASELECT%20%3Fitem%20%3FitemLabel%0AWHERE%20%7B%0A%20%20%3Fnature%20wlt%3AP2%20wl%3AQ2%20.%0A%20%20%3Fitem%20wlt%3AP1%20%3Fnature%20.%0A%0A%20%20%3Fnature%20rdfs%3Alabel%20%3FnatureLabel%20.%0A%20%20%3Fitem%20rdfs%3Alabel%20%3FitemLabel%20.%0A%0A%20%20FILTER%28LANG%28%3FnatureLabel%29%20%3D%20%22fr%22%29%0A%20%20FILTER%28%20REGEX%28%20%3FitemLabel%2C%20%22%5E%28loi%28%3F%3A%20%2Bconstitutionnelle%7C%20%2Borganique%29%3F%7Cordonnance%7Cd%5Be%C3%A9%5Dcret%28%3F%3A-loi%29%3F%7Carr%5Be%C3%AA%5Dt%5Be%C3%A9%5D%29%28%3F%3A%20%2Bn%C2%B0%20%2a%28%5B0-9-%5D%2B%29%29%3F%20%2Bdu%20%2B%28%5B0-9%5D%2Be%3Fr%3F%20%2B%5Ba-z%C3%BB%C3%A9%5D%2B%20%2B%5B0-9IVXLCDM%5D%2B%29%20%2Bmodifiant%20%2B%28%3F%3Al%E2%80%99%7Cla%20%7Cle%20%29%20%2a%28loi%28%3F%3A%20%2Bconstitutionnelle%7C%20%2Borganique%29%3F%7Cordonnance%7Cd%5Be%C3%A9%5Dcret%28%3F%3A-loi%29%3F%7Carr%5Be%C3%AA%5Dt%5Be%C3%A9%5D%29%28%3F%3A%20%2B%5Ba-z%27%5D%2B%29%3F%20%2Bn%C2%B0%20%2a%28%5B0-9-%5D%2B%29%28%3F%3A%20%2Bdu%20%2B%28%5B0-9%5D%2Be%3Fr%3F%20%2B%5Ba-z%C3%BB%C3%A9%5D%2B%20%2B%5B0-9IVXLCDM%5D%2B%29%29%3F%22%2C%20%22i%22%20%29%20%29%20.%0A%20%20FILTER%20NOT%20EXISTS%20%7B%20%3Fitem%20wlt%3AP40%20%5B%5D%20%7D%20.%0A%7D%0AORDER%20BY%20%3FitemLabel 232 textes] semble être des textes de la base JORF. | |||
Refaire tourner le script sur ces 232 candidats une fois la base JORF ajoutée, il ne devrait alors plus y avoir de tels textes sans correspondance. | |||
=== [en attente de JORF] Ajout de eli:amends aux textes dont le titre comporte "modifiant la loi du JJ MM AAAA" === | |||
Écrire un moteur permettant de rapprocher les textes "modifiant la loi du JJ MM AAAA" en recherchant (espérant) les lois de même type le jour dit, voire en faisant un diff sur le titre des textes. Au 9 décembre 2019, il y a que [https://query.wikilex.seb35.fr/#PREFIX%20wl%3A%20%3Chttp%3A%2F%2Fwikilex.seb35.fr%2Fentity%2F%3E%0APREFIX%20wlt%3A%20%3Chttp%3A%2F%2Fwikilex.seb35.fr%2Fprop%2Fdirect%2F%3E%0A%0ASELECT%20%3Fitem%20%3FnatureLabel%20%3FitemLabel%0A%23SELECT%20%3FnatureLabel%20%28COUNT%28%3Fitem%29%20AS%20%3Fn%29%0AWHERE%20%7B%0A%20%20%3Fnature%20wlt%3AP2%20wl%3AQ2%20.%0A%20%20%3Fitem%20wlt%3AP1%20%3Fnature%20.%0A%0A%20%20%3Fnature%20rdfs%3Alabel%20%3FnatureLabel%20.%0A%20%20%3Fitem%20rdfs%3Alabel%20%3FitemLabel%20.%0A%0A%20%20FILTER%28LANG%28%3FnatureLabel%29%20%3D%20%22fr%22%29%0A%20%20FILTER%28%20REGEX%28%20%3FitemLabel%2C%20%22%5E%28loi%28%3F%3A%20%2Bconstitutionnelle%7C%20%2Borganique%29%3F%7Cordonnance%7Cd%5Be%C3%A9%5Dcret%28%3F%3A-loi%29%3F%7Carr%5Be%C3%AA%5Dt%5Be%C3%A9%5D%29%28%3F%3A%20%2Bn%C2%B0%20%2a%28%5B0-9-%5D%2B%29%29%3F%28%20%2Bdu%20%2B%28%5B0-9%5D%2Be%3Fr%3F%20%2B%5Ba-z%C3%BB%C3%A9%5D%2B%20%2B%5B0-9IVXLCDM%5D%2B%29%3F%29%20%2Bmodifiant%20%2B%28%3F%3Al%E2%80%99%7Cla%20%7Cle%20%29%20%2a%28loi%28%3F%3A%20%2Bconstitutionnelle%7C%20%2Borganique%29%3F%7Cordonnance%7Cd%5Be%C3%A9%5Dcret%28%3F%3A-loi%29%3F%7Carr%5Be%C3%AA%5Dt%5Be%C3%A9%5D%29%28%3F%3A%20%2B%5Ba-z%27%5D%2B%29%3F%20%2Bdu%20%2B%28%5B0-9%5D%2Be%3Fr%3F%20%2B%5Ba-z%C3%BB%C3%A9%5D%2B%20%2B%5B0-9IVXLCDM%5D%2B%29%22%2C%20%22i%22%20%29%20%29%20.%0A%7D%0AORDER%20BY%20%3FitemLabel%0A%23GROUP%20BY%20%3FnatureLabel 260 tels textes dans la base LEGI] (241 décrets, 9 arrêtés, 7 lois, 3 ordonnances. Il est toutefois probable que l’ordre de grandeur soit plus important une fois JORF ajoutée, des arrêtés non-consolidés pouvant modifier des arrêtés consolidés. | |||
== [à vérifier+discuter] Items ayant des doubles rangs préférés == | == [à vérifier+discuter] Items ayant des doubles rangs préférés == | ||
[[Q6776|Q6776 <small>(arrêté du 19 mars 1987 fixant les modalités d'élection des représentants des régions et des départements et les modalités de désignation des représentants des communes aux comités de bassin)</small>]] a deux enregistrements dans la base LEGI mais les deux sont abrogés, donc en conséquence certaines propriétés (par ex eli:title) ont deux déclarations de rang préféré. D’habitude (à confirmer), dans ces cas-là, le plus vieux enregistrement a un statut 'modifié', ce qui se traduit par un rang normal pour cet enregistrement. | [[Q6776|Q6776 <small>(arrêté du 19 mars 1987 fixant les modalités d'élection des représentants des régions et des départements et les modalités de désignation des représentants des communes aux comités de bassin)</small>]] a deux enregistrements dans la base LEGI mais les deux sont abrogés, donc en conséquence certaines propriétés (par ex eli:title) ont deux déclarations de rang préféré. D’habitude (à confirmer), dans ces cas-là, le plus vieux enregistrement a un statut 'modifié', ce qui se traduit par un rang normal pour cet enregistrement. |
Version du 22 décembre 2019 à 10:39
Ajout de données
Ajout de la base JORF
La base JORF contient environ 1M de textes alors que la base LEGI contient 1,1K textes. Les textes actuellement manquants dans WikiLex sont probablement des lois anciennes peu importantes (car non-consolidées) et des textes de rang inférieur de toutes dates plutôt abrogés que réécrits (arrêtés).
Types de lois
Recenser les types de lois spécifiques et récurrents (lois de finances, lois de financement de la Sécurité sociale, lois de programmation, lois de programme…) et tagger cela dans une propriété à définir.
Tenter, autant que faire se peut, de reconnaître automatiquement les différents types afin de disposer de ces règles pour l’avenir (art 2 CC :). Peut-être avec une approche par regex. Bonus : ajouter ces règles à metslesliens.
[en attente de JORF] Ajout de eli:amends aux textes dont le titre comporte "modifiant la loi n° XX-XX"
Au 9 décembre 2019, il y a 7585 telles lois selon la requête SPARQL correspondant à la regex codée dans le script wikilex-sync et 7353 avec la propriété eli:amends [1]. La différence de 232 textes semble être des textes de la base JORF.
Refaire tourner le script sur ces 232 candidats une fois la base JORF ajoutée, il ne devrait alors plus y avoir de tels textes sans correspondance.
[en attente de JORF] Ajout de eli:amends aux textes dont le titre comporte "modifiant la loi du JJ MM AAAA"
Écrire un moteur permettant de rapprocher les textes "modifiant la loi du JJ MM AAAA" en recherchant (espérant) les lois de même type le jour dit, voire en faisant un diff sur le titre des textes. Au 9 décembre 2019, il y a que 260 tels textes dans la base LEGI (241 décrets, 9 arrêtés, 7 lois, 3 ordonnances. Il est toutefois probable que l’ordre de grandeur soit plus important une fois JORF ajoutée, des arrêtés non-consolidés pouvant modifier des arrêtés consolidés.
[à vérifier+discuter] Items ayant des doubles rangs préférés
Q6776 (arrêté du 19 mars 1987 fixant les modalités d'élection des représentants des régions et des départements et les modalités de désignation des représentants des communes aux comités de bassin) a deux enregistrements dans la base LEGI mais les deux sont abrogés, donc en conséquence certaines propriétés (par ex eli:title) ont deux déclarations de rang préféré. D’habitude (à confirmer), dans ces cas-là, le plus vieux enregistrement a un statut 'modifié', ce qui se traduit par un rang normal pour cet enregistrement.