Wikisource:Scriptorium/Mai 2010

La bibliothèque libre.
Wikisource:Scriptorium
Aller à : navigation, rechercher
Questions
Raccourci [+]
WS:S

Questions éditoriales

Contenu des livres, mise en page, typographie, etc.


Questions techniques

Utilisation de Wikisource, de la syntaxe d'édition, de l'interface.



Questions légales

Droits d'auteurs sur les livres et questions juridiques.




Questions sur les Glyphes & caractères

Codage et représentation des glyphes et caractères.


Scriptorium
(Mois en cours, Archives, discussion générale en anglais)

Pour laisser un message qui ne concerne pas les cas cités.

Communauté : Annonces - Projets communautaires (2016) - Actualités - Newsletter technique

Mai 2010[modifier]

Modèle:Utilisateur Vector skin[modifier]

Modèle:Utilisateur Vector skin J'ai le plaisir de vous annoncer la naissance de ce modèle (Pompé sur le Wiktionnaire, mais c'est moi l'auteur, pas de pb.)

Pour les catégorisations ici sur Wikisource, je ne suis pas très au fait des usages ici, alors de l'aide serait bienvenue. Merci d'avance. --ArséniureDeGallium 1 mai 2010 à 04:17 (UTC)

Grand merci, Arséniure ! Il faudrait que je me crée un modèle (provisoire, je l’espère) : « cet utilisateur adore l’habillage Vector mais n’a pas réussi à y adapter l’affichage de la grande barre d’outils de Wikisource ». De l’aide serait ici aussi bienvenue ! --Zyephyrus 1 mai 2010 à 07:16 (UTC)

Lettre Ouverte d'un Auteur à la Junte Argentine, de Rodolfo Walsh[modifier]

Le texte en question a été créé vers le 21 mai 2009 et supprimé le 8 avril 2010 après une très brève discussion. L'auteur, Rodolfo Walsh, journaliste d'investigation en Argentine au temps de la Junte militaire, a été assassiné en 1977, peu de temps après avoir diffusé son texte.

L'original est sur Wikisource en espagnol et une traduction complète sur Wikisource en anglais. Une traduction partielle en français a été publiée en mars 2007 par la revue Cultures et conflits; voir aussi le texte d'introduction à la même date.

Depuis sa suppression, une IP d'Argentine proteste sur la page de discussion que la raison invoquée (droit d'auteur) n'est pas valable, ce texte étant une lettre ouverte d'un militant, destinée à être diffusée.

Je suis du même avis, et je trouve dommage que ce texte, qui a eu un très grand retentissement dans les pays hispanophones (voir le sondage sur une phrase significative), ne soit pas sur Wikisource en français. la revue Culture et conflits a publié sa traduction partielle sous creative commons sans se soucier d'ayant-droit, d'ailleurs difficile à identifier.

Il est certain, à mon avis, que l'intention de l'auteur était la même que celle de Giono (mort en 1970) pour L'homme qui plantait des arbres (page créée en 2006, supprimée en mars 2010 suite à la revendication de Gallimard) qui avait écrit sa nouvelle pour qu'elle soit répandue partout. J'ai vérifié avec Kipmaster que le texte n'était pas celui de Culture et conflits. Cette suppression me semble fondée sur une application puriste du droit d'auteur. La solution de Wikipedia anglais, qui souligne qu'il y a un problème sur l'original, et met la traduction sous licence libre, me parait équilibrée. Je propose donc que le texte soit rétabli, avec un commentaire adéquat. --Wuyouyuan - discuter 3 mai 2010 à 09:54 (UTC)

La licence de ce texte est floue et cela me gêne de la mettre sous Commons (déjà que cela me gêne un peu de mettre Victor Hugo sous CC alors qu’il est DP, mais passons).
Le texte est présent sur deux autres wikisource dont celle de la langue originale. De plus, une traduction libre existe.
Je ne me souviens plus des détails, mais je me souviens que l’Argentine a une politique différent sur le droit d’auteur (genre 20 après la première publication et 25 ans après la création ou un truc comme ça, mais je me souviens plus si cela concerne tout ou bien juste les photos. Si quelqu‘un a le temps de lire la loi du 28/09/1933…).
La protection de droit commun en Argentine est de 70 ans après le 1e janvier de l'année qui suit la mort de l'auteur (article 5 de la loi; le texte en ligne a été rajeuni avec les lois récentes); ça ne change rien. --Wuyouyuan - discuter 4 mai 2010 à 05:13 (UTC)
La volonté de l’auteur est assez claire mais trop imprécise pour pouvoir appliquer une licence (pourquoi CC-BY-SA et pas CC-BY-NC par exemple ?). Le problème est le même avec Giono…
Pour info, cette personne a eu (au moins) une fille qui est donc l’ayant-droit. Il serait peut-être bon de la contacter pour avoir son avis.
Si le texte est rétabli (je ne m’y oppose pas, mais je n’y participerais pas), il faudrait un gros bandeau bien voyant en haut de la page.
Cdlt, VIGNERON * discut. 3 mai 2010 à 16:23 (UTC)
Parti à la recherche d'arguments, je tombe sur la lettre de Guy Moquet, texte historique disponible partout mais non publiable sur Wikisource parce que son auteur n'est pas mort depuis assez longtemps. Je crois que je vais abandonner; j'avais fait erreur sur la vocation de Wikisource. Pour mon enrichissement personnel, y a-t-il moyen de me faire parvenir le texte de la traduction par email ? --Wuyouyuan - discuter 4 mai 2010 à 05:47 (UTC)

Pas de portails ?[modifier]

Bonjour,

Je rêve ou bien il n’existe pas de véritables portails sur la Wikisource ?

En effet, je naviguais dans les espaces de noms quand j’ai eu la mauvaise surprise de remarquer qu’il n’y avait apparemment pas d’espace de noms pour les portails. Quelqu’un pourrait-il me confirmer cela et éventuellement y remédier ? (via bugzilla ??).

Cdlt, VIGNERON * discut. 3 mai 2010 à 17:14 (UTC)

Tu rêves ;-) Wikisource:Portails -; Catégorie:Portails -Zyephyrus 3 mai 2010 à 17:29 (UTC)
Non il ne rêve pas, il manque bien l'espace de nom "Portail" en tant que tel, et en effet il faut le demander sur bugzilla (par exemple [1], [2]).
Je veux bien faire la demande, mais je pense qu'il vont demander un truc qui ressemble à un vote avant de l'activer. --Kip 3 mai 2010 à 17:34 (UTC)
Êtes-vous pour ou contre la création d’un espace dédié aux portails ? Qui est pour ? Qui est contre ? Arguments de part et d’autre ? --Zyephyrus 3 mai 2010 à 20:50 (UTC)

vote[modifier]

  • Pour Pour, je ne vois pas tellement d’arguments contre, étant donné que les pages sont déjà nommées avec le préfixe « Portail: », il me semble que ça ne peut être que bénéfique.Zaran (Discuter) 3 mai 2010 à 23:39 (UTC)
  • Pour Pour l’activation, il s’agit juste d’entériner une situation existante. Accessoirement, cela évitera que les portails soient comptés comme des pages ;) Cdlt, VIGNERON * discut. 4 mai 2010 à 06:42 (UTC)
  • Pour Pour (pardon Zaran & VIGNERON pour avoir modifié un peu votre mise en page) andre 4 mai 2010 à 07:12 (UTC)
  • Pour Pour --Kip 4 mai 2010 à 07:26 (UTC)
  • Pour Pour Même si je ne comprends pas de quoi on parle, je ne vais pas faire le malin, ("fais pas le malin, fais pas le malin, fais pas le malin", il à dit) et me faire remarquer en m'opposant à cette proposition.--Le ciel est par dessus le toit 4 mai 2010 à 07:46 (UTC)
  • Pour Pour Effectivement, cela peut permettre à des utilisateurs de s’y retrouver plus facilement s’ils ont des intérêts particuliers. --Camelinat 4 mai 2010 à 08:49 (UTC)
  • Pour Pour ThomasV 4 mai 2010 à 12:07 (UTC)

demande sur Bugzilla[modifier]

J'ai déposé la demande . --Kip 5 mai 2010 à 09:40 (UTC)

Merci Kip. --Zyephyrus 5 mai 2010 à 21:39 (UTC)
C’est fait ici. Zaran (Discuter) 8 mai 2010 à 20:51 (UTC)
Sauf que je ne vois toujours pas l'espace de nom "Portail" dans les listes. Quelqu'un d'autre peut-il vérifier ? --Kip 9 mai 2010 à 10:38 (UTC)
Effectivement, je me suis réjoui un peu vite. Je ne vois pas non plus l’espace de nom "Portail" dans la liste déroulante pour les recherches. Zaran (Discuter) 9 mai 2010 à 13:16 (UTC)
Ok, j'ai protesté sur bugzilla, et ça marche maintenant. :-) --Kip 10 mai 2010 à 11:10 (UTC)
Bizarre, je vois un nouveau namespace (n° 106, et n°107 pour son espace de discussion associé) mais quand je vais sur Spécial:Toutes les pages, il ne trouve aucune page dans cette espace ! En fait, je n’arrive à retrouver aucun des portails dans Catégorie:Portails. Très bizarre, je suppose que c’est du à une mise à jour et que le problème est temporaire. dlt, VIGNERON * discut. 10 mai 2010 à 11:15 (UTC)
Les liens rouges sur la page d’accueil sont du plus beau effet…andre 10 mai 2010 à 12:31 (UTC)
Hmm pourtant je leur avait dit de faire attention à cela. On peut attendre un jour voir si c'est une histoire de synchro, puis râler encore. Y a-t-il un volontaire, histoire que ça ne soit pas toujours le même qui se plaigne ? ;-) (sinon je veux bien le faire aussi) --Kip 10 mai 2010 à 12:46 (UTC)


Oh oui, sois ambassadeur des Wikisourciens, nous t’en remercions beaucoup, si personne ne s’y oppose. Que dire aux visiteurs ? J’ai mis une petite phrase d’avertissement sur la page d’accueil :

Les portails sont en cours de transition vers un nouvel espace qui leur sera réservé sur Wikisource, d’où une série de liens devenus momentanément rouges : la transition peut demander quelques heures ou quelques jours.

Pensez-vous qu’elle convienne sous cette forme ? --Zyephyrus 10 mai 2010 à 19:33 (UTC)

La phrase d’avertissement me paraît bonne. Sinon Kipmaster, je trouve que tu t’y prends très bien pour les rapports de bug, donc autant continuer Clin d'œil. Zaran (Discuter) 10 mai 2010 à 21:42 (UTC)
Ok, j'ai reopenifié (réouvert?) le bug. Ils vont me haïr :D --Kip 11 mai 2010 à 08:18 (UTC)
Si je peux me permettre, il y a des méthodes à suivre pour créer un nouvel espace : Dealing with existing pages. Somerset 11 mai 2010 à 08:58 (UTC)
Oui, tu peux te permettre, merci :-). Comme il faut être un dev dans les trois cas, j'ai rajouté le lien sur la demande bugzilla. --Kip 11 mai 2010 à 09:38 (UTC)
ça avance, les portails sont là, mais les pages de discussions n'ont pas été déplacées... Je pense que c'est un peu plus complexe car le nom doit être changé. À suivre. --Kip 11 mai 2010 à 11:24 (UTC)
Merci, Somerset, et merci, Kip ! J’ai sauvé tout ce que j’ai pu retrouver dans les caches de Google : environ 80% du total (il y a quelques pages que je n’ai pas pu récupérer car elles n’avaient pas de caches) ; espérons quand même que cette précaution n’aura pas à servir. --Zyephyrus 11 mai 2010 à 12:08 (UTC)
Les pages de discussion n’ont toujours pas été déplacées. Le « Done now » de Kattouw sur Bugzilla porte à croire que les développeurs pensent avoir fini le travail. Il s’agit donc sans doute encore d’un oubli. Peut-être faudrait-il que Kip intervienne un dernière fois Clin d'œil.
J’ai collé ce que j’ai pu récupérer, croyant ces pages perdues : c’était trop tôt ? Faut-il les supprimer ? --Zyephyrus 12 mai 2010 à 14:49 (UTC)
Hmm, j'ai pas eu le temps de m'en occuper jusque là. La liste des pages manquantes est là [3] (note: le "Discussion:Portail:bla" devient maintenant "Discussion Portail:bla"). Tu penses en avoir récupéré beaucoup ? Je pense que ça va poser problème dans la base de donnée pour les pages que tu as recréées, même si tu les effaces, donc laisse-les. Je vais essayer de tchatter avec Kattouw sur IRC, ils ne sont pas très causants sur bugzilla... --Kip 12 mai 2010 à 21:34 (UTC)
Heu, voici la liste :

11 mai 2010 à 17:01 (diff | hist) N Discussion Portail:Politique ‎ (texte récupéré) (dernière)
11 mai 2010 à 16:51 (diff | hist) N Discussion Portail:Sciences humaines ‎ (texte récupéré) (dernière)
11 mai 2010 à 16:45 (diff | hist) N Discussion Portail:Littérature russe ‎ (texte récupéré)
11 mai 2010 à 16:39 (diff | hist) N Discussion Portail:Religions et Croyances ‎ (texte récupéré) (dernière)
11 mai 2010 à 16:32 (diff | hist) N Discussion Portail:Textes médiévaux ‎ (texte récupéré) (dernière)
11 mai 2010 à 16:29 (diff | hist) N Discussion Portail:Littérature de langue anglaise ‎ (texte récupéré) (dernière)
11 mai 2010 à 16:16 (diff | hist) N Discussion Portail:Romantisme ‎ (texte récupéré) (dernière)
11 mai 2010 à 16:13 (diff | hist) N Discussion Portail:Les Lumières ‎ (texte récupéré) (dernière)
11 mai 2010 à 16:08 (diff | hist) N Discussion Portail:Le Baroque ‎ (texte récupéré) (dernière)
11 mai 2010 à 16:03 (diff | hist) N Discussion Portail:Le Classicisme ‎ (texte récupéré) (dernière)
11 mai 2010 à 15:59 (diff | hist) N Discussion Portail:La Renaissance ‎ (texte récupéré) (dernière)

...mais ce que j’ai récupéré est moins joli (adresses des images au lieu des images elles-mêmes) et il n’y a plus d’historique. Ce serait bien s’il y avait moyen de faire mieux. --Zyephyrus 13 mai 2010 à 00:14 (UTC)

Ma tentative d'IRC et de contact direct par e-mail n'ont rien donné de concret, j'ai donc réouvert encore une fois le bug zilla. --Kip 17 mai 2010 à 14:13 (UTC)
Je suis tombé sur des incompétents, ils ne savent pas faire et ne prennent même pas le temps de lire ce que je dis en entier. --Kip 18 mai 2010 à 06:36 (UTC)
Ah non, l'affaire n'est pas fini, il y a une "investigation" en cours pour réparer le problème (le bug a été réouvert...). Moi qui pensais que ça prendrait 5 minutes... --Kip 18 mai 2010 à 18:10 (UTC)
« Patience et longueur de temps… » Tu as obtenu qu’ils essaient, je trouve que c’est déjà très bien ; ils y arriveront peut-être. --Zyephyrus 18 mai 2010 à 18:32 (UTC)
Ok, c'est fait. Pour les pages de discussions déjà créées, ils n'ont pas pu, mais ils les ont renommé en "Discussion Portail:blabla--DUP", donc on peut les déplacer à la main. Cf. les pages Discussion Portail. --Kip 18 mai 2010 à 21:02 (UTC)
Fait Yes check.svg andre 19 mai 2010 à 08:09 (UTC)
Merci !merci à tous les sauveteurs ! --Zyephyrus 19 mai 2010 à 09:41 (UTC)

Aux bonnes âmes de wikisource[modifier]

J'ai commencé le correction du Journal d’un écrivain de Dostoïevski (les 70 premières pages environ) mais je commence aussi à me lasser... ainsi pour me redonner du peps quelques contributeurs pourraient-ils relire ce que j'ai fais et valider les pages corrigées, ce qui me permettrait de constater les erreurs que je fais en typographie, de mise en page, entre autres, et ainsi apprendre à mieux maitriser les outil de wikisource. Merci par avance.

PS : Depuis que j'utilise la bêta, je ne me repère plus, comment fait-on pour mettre des liens interne par exemple.--Le ciel est par dessus le toit 4 mai 2010 à 09:21 (UTC)

Pour insérer un lien, tu cliques sur l’icône qui représente une double chaîne : elle ouvre une boîte de dialogue avec des cases à cocher proposant au choix lien interne ou lien externe. --Zyephyrus 5 mai 2010 à 21:37 (UTC)
J'ai regardé quelques pages, et j'ai noté que certaines ont été validées sans correction de l'apostrophe courbe (’) ni des majuscules accentuées. Yann 8 mai 2010 à 12:31 (UTC)
J'ai également constaté l'absence de transformation des points de suspension ... --Pilpilip 17 mai 2010 à 11:02 (UTC)
J'ai regardé une page validée (Page:Journal d un ecrivain.djvu/7)et j'ai trouvé 8 erreurs de transcription du texte (pluriels manquant, ...). Loïc Mottier (d)

Documentation de pagelist[modifier]

Bonjour,

Je n’ai pas pu mettre la main sur une documentation précise de la commande pagelist. Quelqu’un pourrait-il me l’indiquer si elle existe, ou le cas échéant expliciter chacun de ses paramètres (j'avoue être un peu perdu avec des pagelist 7=1 23=1 1to6=- 7to21="roman" 22to22=- 391to396=- / …).

C’est dans le cadre du partenariat BNF.

Merci d’avance, Jean-Fred 5 mai 2010 à 21:09 (UTC)

Le message original de ThomasV est ici : Wikisource:Scriptorium/Février_2008#fonction_pagelist. Je précise un peu
  • from et to pour indiquer l’intervalle des pages à lister
  • ensuite on peut modifier la numérotation des pages :
  • par exemple 7=1 signifie que la page 7 du document sera numérotée 1, et les suivantes seront numérotées à partir de celle-ci : c’est à dire 8 sera numérotée 2, 9 sera numérotée 3…
  • on peut aussi changer le style d’un intervalle de page, par exemple 1to6="-" signifie que les pages 1 à 6 seront numérotées avec un tiret (donc sans numéros). "roman" signifie que l’intervalle sera numéroté en chiffres romains. "highroman" pour les chiffres romains majuscule.

En espérant avoir été clair. Zaran (Discuter) 5 mai 2010 à 21:25 (UTC)

Comme d’hab, c’est une fois qu’on a demandé qu’on trouve ! Merci pour l’explication, avec ces deux sources on devrait s’en sortir :-) Jean-Fred 5 mai 2010 à 21:35 (UTC)

Demande de rectification[modifier]

...dois je demander cette rectification ? je ne sais ! je suis assez mal à l'aise avec le language internet encore et je n'ai pas une grande intelligence ,comme un débutant ,d'ou mes maladresses bien que je ne demande qu'à mieux comprendre .Je n'ai pas encore fait l'inscription à ce que vous appelez "un compte" mais je me presente comme vous me le demandez :

Je suis maintenant à la retraite ,je m'appele A... F... ,adresse email: foullonmathy_at_aol_dot_com ,et sans etre un professionnel dans la partie puisque j'etais dans une profession de santé ,j'avais débuté une généalogie pour ma fille (issue de vieilles familles):Tableaux fait à l'ancienne ,à la main (papiers ou ordi.).vous me demandez si j'ai une adresse IP (si vous parlez d'un site ou des WWW...)je n'en ai pas sauf mon adresse Email ;j'ai été dans des bibliothèques et sur internet et j'ai recolté des renseignements avec lesquels j'ai fait syntheses et compilations ,d'ou mes listes dont je n'ai pas toujours relevé les ref.que je peux retrouver ,mais je n'ai rien inventé :c'est avec le plus de serieux possible que je les ai faites sans ometre rien car la mémoire du passé ,énigmatique ,légendaire ou mythologique est ce qu'elle est mais avant tout :patrimoine de l'humanité, et si on a l'esprit un tant soit peu scientifique ,on ne doit rien mépriser pour le seul fait que ça n'est pas évident ,mais au contraire on doit consigner dans l'etat pour transmettre ce qui est arrivé jusqu' à nous et aussi ,car derriere les legendes il y a toujours une tres grande part de vérité ;verité que je tente de mettre au jour .En cherchant ,on a cité votre site comme un ébergement et je me suis precipité ,peut etre un peu trop vite et spontanément en me disant qu' en contribuant avec mes listes cela pourraient interesser ,mais apparement j'ai fait des bétises de procedures et j'ai mis la charue avant les boeufs ou bien je me suis trompé du tout au tout en m'adressant à vous ...toujours est il que ça a tres mal débuté :rejets ,bloccages , éffacements de mes données,accusations à mon égard ,impossibilité de vous écrire ! n'en jettez plus ! je n'en méritais pas tant !vous ai je fait si peur ? ...mais si d'avoir le courage de converser avec moi vous prend , je suis toujours pret à etre initié aux procédés compliqués de votre site !(ils le sont si on ne les connais pas je suppose! ).J'ai un doute :je ne sais si je fais bien de venir m'éberger chez vous et si ma démarche est adéquate ;ce serait à vous de me le dire en me repondant par email!...apres des années de recherches , que quelqu'un me traite d'un nom d'oiseau et vienne éffacer mes données sans me laisser le temps de défendre ou de justifier mon travail par ce qu'il n'est pas d'accord ,on ne sait pourquoi , sans respect aucun pour mon travail (si je me suis trompé j'ai toujours su le reconnaitre ,mais qu'on me laisse le temps de faire des recherches dans un sens ou dans un autre pour confirmer ou rectifier le tir sans condamner tout mon travail et l'injurier ! n'est ce pas frappé au coin du bon sens ?)Cet arbitraire ,je l'avoue me fait peur et à mon age , me battre sur des dualités toujours illusoires et stériles ne m'interesse guere !je sais d'éxperience que meme si on a le bon sens de son coté ,de toutes façons on a quand meme tord pour l'autre qui a l'impression de perdre la face s'il reconnait s'etre trompé ,ce qui est éxactement le contraire en fait et cela n'est vivable pour personne ce genre de bloccage. Toute ma vie a été dirigée de part mon métier dans le sens du respect et de l'attention pour les autres et si c'est l'inverse que vous me proposez ,je ne crois pas que je pourrais m'y faire et dans ce cas ,ayant par avance la peur au ventre pour l'épée de Damoclès des reactions intempestives et d'un petit clic fatal des dieux de l'olympe !pourquoi alors m'inscrire si c'est pour apres en faire l'annulation ? ecrivez moi librement pour me dire ce que vous en pensez;je ne juge personne et n'ai fait que de me poser des questions tout haut sur les reactions tres négatives que j'ai pu provoquer sans le savoir ! A l'inverse du petit renard pour le petit Prince ,je ne suis rien pour vous actuelement et suis sans importance pour ce monde !tout site comme le votre doit etre une aventure vécu par ses membres ,fraternellement liés ,naviguant comme l'Arche de Noé dans les tempètes ,mais vous etes des gens d'importance et non comme Noé qui avait acceuilli toute la création et j'ai conscience que vous n'etes pas obligé de faire de meme et qu'un vieux chien mouillé comme moi ça ne doit pas etre votre tasse de thé !Je joint ci dessous le petit mot que je vous ai écrit hier:

le 06-05-10

Je suis vraiment désolé ,j' ai cafouillé ,et je n' ai pas réalisé qu'il fallait s'inscrire ;j'ai été embalé par votre site et j'ai voulu y mettre le fruit de mes recherches qui contrairement a ce qu' a cru un de vos administrateur n' a rien de faux ! je peux prouver nom apres nom tout ce que j' ai découvert , recherché d'ailleurs pour une petite part sur votre site ,mais mes listes généalogiques (les trois que j'ai pu mettre)ont tout de suite été bloquées et suprimées sans aucune éxplication et il m'était de plus impossible de vous écrire et de vous éxpliquer que je n'avais aucune intention mauvaise mais que je voulais vous faire partager mes travaux généalogiques ,je fus maladroit et je m'en éxcuse humblement ,je ne suis pas tres habitué à l'ordinateur,tant pis pour moi ;la ref.du bloccage intempestif est Zeyephyrus N°84-102-217-205 blocage 12O3 ;J'avais plus besoin d'éxplications pour procéder que ce refus à mon avis ! il y a un probleme : le nouveau venu n'a aucun moyen de vous poser des questions et de vous parler ,si ce sont des personnes qui s'averaient apres tres interessantes pour vous vous perdez ainsi beaucoup d'opportunités à enrichir votre site ! mais ça n'est peut etre pas votre but ! ce que j'en dit ! ,c'est pour vous .Mon adresse email est:foullonmathy_at_aol_dot_com (repondez moi) ; bien à vous ,A... F....

Bonjour, les recherches généalogiques motivent beaucoup de gens et sont un travail en soi, qui peut intéresser tout un chacun à une période de sa vie ou de manière permanente, c'est donc un travail respectable et qui jusqu'ici demande souvent des inscriptions à des "associations", des échanges de points, des logiciels à télécharger.... et je n'ai pas jusqu'ici trouvé l'équivalent d'une communauté ouverte de wiki qui le permette. Je précise que je n'ai pas non plus investi beaucoup de temps sur le sujet étant plutôt une passionnée de romans. Néanmoins wikisource est là pour déposer des livres "publiés" par un éditeur et ne prend pas de recherche originale, déjà des conflits de frontières existent sur la traduction d'oeuvres publiées… . Chaque wiki a des limites et Wikisource n'a pas vocation à accueillir des recherches généalogiques (cf. les conditions d'utilisation en lien et pointées par Zephyrus). Il existe des wikis qui semblent dédiés à ce type de travail, comme http://fr.rodovid.org/wk?title=Accueil mais il a sans doute ses contraintes (fiches, listes ??....) qu'il s'agira de découvrir mais comme le besoin des autres utilisateurs sera le même que le votre vous devriez y trouver un meilleur accueil[1]. Sapcal22 7 mai 2010 à 17:44 (UTC)

Ah!enfin un etre vivant ,quelqu'un d'humain qui me repond !(c'est une qualité superieure d'etre humain et non pas une faiblesse comme certains le pense ,ou alors la faiblesse est superieure à tout ! un bébé le prouve!il ne suffit pas de faire des travaux intelectuels ,si le reste est mort ça ne sert à rien et le travail est vain !)...enfin une parole un peu humaine "dans ce monde de bruts" (de l'informatique ),MERCI cher SAPCAL 22 !en passant je vous souhaite tous mes voeux de réussites pour vos éxamens ,et merci pour le tuyau ,je vais tenter ma chance ...(écrivez moi si vous avez d'autres idées à mon adresse email ,car ici c'est difficile pour moi de retrouver ou les pages se trouvent :c'est le labyrinthe antique pour moi ,ou l'on clique toujours au mauvais endrois ,un nouveau travail d'Ercule en quelque sorte !vous vous protégez sous des pseudo d'anonymat et je le comprend ,à notre époque !mais il est difficile pour moi de ne pas vivre avec une certaine confiance en l'autre ,je suis d'une autre époque ;Merci encore de votre reponse , bien à vous ,Alain Foullon

Bonjour, Vous devriez regarder http://fr.rodovid.org/wk/Accueil : un wiki sur la généalogie. Cordialement, Yann 8 mai 2010 à 12:50 (UTC)

  1. NB : j'ai lu votre texte en diagonale car ilest un peu long et il faut que j'aille faire à manger :-).

Chapitres avec liens[modifier]

Je travaille sur Page:Dickens_-_Olivier_Twist.djvu/423 pour mettre le livre en mode page. Mais comment fait-on pour couper un lien sur 2 pages et qu'il soit ensuite correctement interprété lors de l'import sur la page ? Merci. Sebdelprat 8 mai 2010 à 19:11 (UTC)

En s’amusant avec les balises noinclude et includeonly. Il y a plus simple… ne mettre le lien que sur le numéro du chapitre et non sur tout le titre. andre 8 mai 2010 à 20:27 (UTC)

Livraison BnF : tout a-t-il sa place chez nous ?[modifier]

Profitant d’un dimanche après-midi maussade, je me suis mis à vérifier la liste des textes fournis par la BnF. En parcourant d’un regard distrait la liste des ouvrages, je suis tombé sur les Scritti vari de Roberto Ardigò, un ouvrage entièrement rédigé et annoté en italien ([4]). Quand le fichier DJVU aura été chargé sur Commons, je pense que ce n’est pas à la Wikisource francophone d’accueillir cet ouvrage mais plutôt à nos cousins transalpins. Du coup, il serait peut-être bon de créer quelque part une page pour signaler les ouvrages provenant de la BnF mais placés dans d’autres Wikisources ?

Pymouss |Parlons-en| 9 mai 2010 à 15:19 (UTC)

Créer une page ou des modèles qui classeraient les textes concernés dans des catégories ad hoc ? --Zyephyrus 10 mai 2010 à 10:27 (UTC)
Pour une page méta ou même commons (puisque les scans sont sur commons, et que commons est plus visité) Otourly 11 mai 2010 à 08:43 (UTC)

FYI, j’ai crée Catégorie:Ouvrages issus du partenariat avec la BnF (qui ne contient pour le moment que les fichiers tests). Cdlt, VIGNERON * discut. 11 mai 2010 à 14:30 (UTC)

Je viens aussi de laisser un message sur it:Wikisource:Bar. Cdlt, VIGNERON * discut. 12 mai 2010 à 13:25 (UTC)

Candidature au poste d’administrateur[modifier]

Bonjour,

Je viens de postuler : Wikisource:Administrateurs/VIGNERON. Vos avis sont les bienvenues.

Cdlt, VIGNERON * discut. 10 mai 2010 à 18:48 (UTC)

Pour voter, c’est par ici ! --Zyephyrus 11 mai 2010 à 12:25 (UTC)
Merci à tous ceux qui ont voté pour moi. Cdlt, VIGNERON * discut. 16 mai 2010 à 09:32 (UTC)

Le Vicaire de Wakefield[modifier]

Bonjour,
Il reste 3 pages à valider, que je ne peux valider moi-même ; pour la page de titre, j'ai un souci avec l'image, qui semble ne pas exister, et que je ne sais comment faire apparaître. Quelqu'un peut-il m'aider ? Merci d'avance, --Acélan 11 mai 2010 à 05:56 (UTC)

Miracle ? Au moment de tenter de m’en occuper je découvre qu’elle est là…  ;-) (Merci, Philippe Remacle !)--Zyephyrus 11 mai 2010 à 12:11 (UTC)
Merci à Remacle, Zyephyrus et Somerset, le texte est désormais complètement validé. --Acélan 11 mai 2010 à 13:26 (UTC)

Modèles d'édition de théâtre[modifier]

Je me demande, pour cette page, si le modèle d'édition de théâtre est bien pertinent. A propos de ces modèles, d'ailleurs, quelle est leur fonction ? en général, on essaie d'effectuer une mise en page qui ressemble à celle du texte d'origine ; dans ce cas-là seulement, la mise en page diffère beaucoup. Merci pour vos avis éclairés. --Acélan 11 mai 2010 à 16:54 (UTC)

Toujours plus: sertir la réplique et la didascalie dans un modèle:Centré, et ainsi réconcilier les modèles théâtraux et la mise en page. Pour les gens qui aiment les modèles, bien sûr. Je me suis permis d'en faire la démonstration sur la même page. Pour le modèle:Acteurs, ça semble sans espoir; choix incompatible de l'italique. --Wuyouyuan - discuter 12 mai 2010 à 04:45 (UTC)
Les modèles sont des outils, ils font gagner du temps. (Illustration : le modèle {{copyvio}} peut orienter cinquante contributeurs différents vers l’explication de ce qu’est une violation de copyright, plutôt que de laisser cinquante wikisourciens le réexpliquer à cinquante newbies, multipliant par cinquante le temps passé pour le même résultat). Nous avons donc à nous poser d’abord la question de nos objectifs, ce que nous voulons obtenir ; la réalisation des modèles vient ensuite.
La position de Wikisource jusqu’à présent a été simple, que ce soit sur la présentation des textes de théâtre ou sur d’autres choix d’importance comparable : accepter tout travail sérieux offrant un texte complet, lisible et respecté, quels qu’en aient été les choix éditoriaux (c’est pourquoi les contributeurs qui commencent à travailler sur un texte remplissent le modèle {{choixEd}} pour accorder les choix éditoriaux, parce que justement ils ont le choix) ; or, les motivations des contributeurs et le résultat qu’ils veulent obtenir peuvent être d’une grande variété. Le consensus sur Wikisource tend à servir cette variété le plus possible, et à exclure le moins possible de contributeurs. (Cela ne veut pas dire qu’on laisse écrire n’importe quoi. L’objectif du mode page est de donner à tout contributeur et à tout lecteur le moyen de contrôler la fidélité au texte).
La fidélité au texte n’est pas la même chose que la fidélité à une mise en page quand celle-ci n’est pas de l’auteur ; par contre, il est raisonnable de s’appuyer sur le savoir-faire des techniciens de la mise en page dont nous reprenons les travaux. Ma réponse sera d’autant plus nuancée que je pense qu’il faudra un jour ou l’autre poursuivre le travail de wikistylisme commencé par Philippe et nous faire des modèles aussi neutres et discrets, mais aussi jolis, que ce qui a été fait sur l’habillage Vector : ces modèles existeront pour le théâtre aussi, mais je pense qu’il y aura un long chemin à parcourir pour les créer, la simplicité n’étant pas un premier jet mais le résultat d’un long travail. C’est pourquoi il me semble que chacun d’entre nous est assez bien placé pour évaluer ce qu’il réussira personnellement le mieux entre les différents choix possibles, et de quelle façon il croit pouvoir le mieux servir les générations futures ; j’essaie en ce qui me concerne de laisser l’éventail de ces choix aussi ouverts qu’il m’est possible.
Je t’ai résumé de mon mieux ce qui me paraît être le consensus actuel, et je remercierai les autres wikisourciens de compléter ce qui manque. --Zyephyrus 12 mai 2010 à 08:30 (UTC)
Qu’on me pardonne mes visions utilitaristes héritées d’un usage excessif de LaTeX, mais je suis persuadé qu’un des avantages de la numérisation est de rajouter des informations dans un texte ; pour cela, il faut entre autres séparer fond et forme. L’utilisation de modèles est un moyen efficace pour cela, a fortiori si on y gagne en cohérence de présentation. Les modèles facilitent la réutilisation, car il suffit de remplacer l’implémentation effective de la représentation du modèle (= son code) pour changer l’apparence d’un document en trois lignes de code. En ce sens, les modèles font partie du wiki sémantique dont il a été question précédemment. À mon sens, un document sémantique vaut beaucoup plus qu’un texte nu (particulièrement pour les documents techniques comme les dictionnaires). Une fonction dont j’ai toujours rêvé pour Wikisource serait de pouvoir définir des modèles locaux à une œuvre, ou alors à pouvoir redéfinir localement des modèles globaux (ce qui serait la solution optimale ici). Pmx 12 mai 2010 à 10:55 (UTC)
Merci, Pmx, de ta contribution à l’« intelligence collective », pour moi ce que tu dis apporte un autre éclairage dont je n’avais pas trop conscience et que je trouve très précieux. --Zyephyrus 12 mai 2010 à 15:04 (UTC)
Merci à tous trois pour vos réponses. D'accord avec toi, Pmx, sur l'utilité d'un document sémantique ; et quelles que soient les réserves que j'ai envers ces modèles, d'un point de vue purement formel, je les ai utilisés pour le théâtre ; le fait d'avoir un document qui se présente formellement comme une pièce, mais qui n'en est pas une au sens strict, m'a amenée à me poser ces questions sur leur utilisation. Quant aux fonctions dont tu rêves, ce serait l'idéal, en effet. --Acélan 12 mai 2010 à 16:01 (UTC)
Sans que ce soit exactement la situation rêvée par Pmx (rêve auquel je souscrit), il est toujours possible d’ajouter des paramètres à un modèle pour le rendre plus souple d’utilisation. Cdlt, VIGNERON * discut. 12 mai 2010 à 17:38 (UTC)
Oui ; je ne remercierai jamais assez Thomas des outils qu’il a inventés, surtout celui qui permet d’accéder à la fois au texte original nu de La Fontaine, à l’orthographe modernisée pour le comprendre, puis à nouveau au texte original nu ; et aussi le mode page, qui permet de basculer du texte physique au texte logique et vice-versa, là encore, d’un seul clic. Il a réussi à faire tout cela sans jamais déformer aucun texte. Les futurs enfants de la terre (et des autres planètes ?) pourront recevoir de nous, si rien ne les écrase en route, des trésors intacts  :) --Zyephyrus 12 mai 2010 à 18:43 (UTC)

Le Revizor[modifier]

Gogol's Le Revizor seems blank, but there are Le Révizor/1, Le Révizor/2 etc. Should be renamed Le Revizor to Le Révizor? -- Sergey kudryavtsev 13 mai 2010 à 09:19 (UTC)

MediaWiki:Newarticletext[modifier]

Cette page devrait proposer nos modèles ou catégories pour accélérer les créations de pages. Par exemple en:wikt:MediaWiki:Newarticletext apparait en fonction du namespace (comme dans cette page vide). Alors je propose d'afficher une boite déroulante contenant une sélection de nos modèles. JackPotte ($) 13 mai 2010 à 17:06 (UTC)

Euh… pardon ? quels modèles ? (j’ai un doute : tu t’es pas trompé de projet et confondu WS et WT ? sur WT ce serait une bonne idée si tu parles des modèles patrons, par contre sur WS, je vois pas) Cdlt, VIGNERON * discut. 13 mai 2010 à 19:21 (UTC)
Je ne suis pas sûr d’avoir bien compris, mais il me semble que JackPotte parle de pré-remplir automatiquement les pages dans les différents espaces de noms avec les modèles adéquats. Par exemple mettre automatiquement le modèle auteur quand on crée une page dans l’espace auteur, le modèle ChoixEd dans l’espace Discussion Livre… Même si ce n’est pas ce dont parlait JackPotte, cela pourrait être relativement utile. Je dis « relativement » car ce n’est pas tellement plus long de cliquer sur le lien situé sous la fenêtre d’édition pour insérer le modèle Auteur. Zaran (Discuter) 13 mai 2010 à 19:42 (UTC)
Vu l’utilisation du « nos », je pense plutôt pour une confusion WS/WT. Ceci dit, en y repensant une deuxième fois et malgré la confusion, pourquoi pas effectivement (au fait Zaran, quand est-ce que tu lance le nouveau modèle auteur ?). Cdlt, VIGNERON * discut. 13 mai 2010 à 19:46 (UTC)
Après la confusion (probable) entre WT et WS, il y a maintenant la confusion entre Faager et moi-même Clin d'œil. C’est en effet Faager qui avait proposé de nouveaux modèles. Malheureusement, il ne montre plus de signes de vie depuis quelques temps. C’est dommage car les wikisourciens semblaient globalement pour ces nouveaux modèles. Pour rappel, la discussion se trouve ici. Zaran (Discuter) 13 mai 2010 à 21:12 (UTC)
Pour en revenir à la proposition de JackPotte, de préremplir les espaces avec les modèles les plus utiles, et à la remarque de Zaran, que cliquer sur un modèle dans l’edittools (certains, dont moi, préféreraient peut-être remplacer certains boutons peu utilisés de la barre d'outils par de nouveaux boutons insérant ces modèles), cela fait me semble-t-il trois possibilités :
  • 1. Modèles insérés automatiquement lors de la création de la page ;
  • 2. Modèles ajoutés à l’edittools sous la fenêtre d’édition, en en retirant peut-être d’autres qui servent moins ;
  • 3. Modèles ajoutés à la barre d’outils, éventuellement en allégeant celle-ci.
Qu’en pensez-vous ? Et avez-vous d’autres propositions ? --Zyephyrus 14 mai 2010 à 07:50 (UTC)
PS A propos de barre d’outils, qui a réussi à intégrer des boutons via son monobook dans le nouvel habillage Vector ? Quelqu’un peut-il expliquer la marche à suivre ? --Zyephyrus 14 mai 2010 à 08:00 (UTC)
J'y ai passé des heures sans succès (remarque je ne savais pas le faire sous monobook). JackPotte 15 mai 2010 à 08:39 (UTC)
Pour vector, les modifs ça passe par Spécial:Ma Page/vector.js et Spécial:Ma Page/vector.css, c'est pour ça que ça ne marchait pas ;)(j'ai eu le même problème sur wp)--Y▬Spirine@causer 15 mai 2010 à 12:00 (UTC)
Finalement j'ai créé un gadget pour ajouter certains boutons quelque soit l'apparence. JackPotte 15 mai 2010 à 18:38 (UTC)

Wikimania 2010[modifier]

English: Wikimania 2010, this year's global event devoted to Wikimedia projects around the globe, is accepting submissions for presentations, workshops, panels, and tutorials related to the Wikimedia projects or free content topics in general. The conference will be held from July 9-11, 2010 in Gdansk, Poland. For more information, check the official Call for Participation. Az1568 3 mai 2010 à 19:33 (UTC)

français: Wikimania 2010, c'est un évènement global annuel dédié aux projets Wikimédia dans le monde, elle accepte les inscriptions pour les présentations, boutiques, panneaux, et tutoriels relatifs aux projets Wikimedia ou aux contenus libres en général. La conférence se tiendra du 9 au 11 juillet 2010 à Gdansk, Pologne. Pour plus d'informations voir la page officielle. JackPotte 3 mai 2010 à 20:16 (UTC)

Tri des livres[modifier]

Bonjour à tous,

J'aime bien aller sur Wikisource et j'apprécie d'avoir la bibliothèque à portée de main... Mais le truc c'est que pour trouver un livre intéressant il faut déjà le connaitre... On peut certes chercher par époques, mais si je veux un livre sur la littérature classique que je n'ai pas lu, je crois que j'ai pas beaucoup de solution de recherche malheureusement... Otourly 14 mai 2010 à 09:30 (UTC)

Ce n’est peut-être pas parfait mais il existe aussi les portails : Portail:Le Classicisme par exemple (ils ont un petit problème de changement d’espace de nom en ce moment mais cela devrait être réglé bientôt). Je ne crois pas qu’il existe de catégorie, cela pourrait être une piste à améliorer. Cdlt, VIGNERON * discut. 14 mai 2010 à 12:22 (UTC)

Dimitri Roudine by Turgenev[modifier]

Hello! Please, check Dimitri Roudine translation, it has a stange chapters divisions: the Russian original has 12 chapters and Epilog, but french translation has 13 chapters and Epilog. So Dimitri Roudine/13 textually corresponds to Рудин (Тургенев)/Глава 12. -- Sergey kudryavtsev 17 mai 2010 à 07:57 (UTC)



Publier sur Wikisource une traduction originale signée, est-ce possible ?[modifier]


Source : Discussion utilisateur:Alain.delorme

Cas des traductions[modifier]

Bonjour à tous

Tout cela me semble un peu embrouillé. Essayons d'être clair :

1) Oui ou non, peut-on publier sur Wikisources des textes originaux non édités? 2) Je comprends bien que Wikisources ne puisse pas accepter de publier n'importe quoi les yeux fermés. Mais un texte ne peut-il pas être admis après examen ? j'ai la faiblesse de penser que mon texte de Dante en octosyllabes rimés ou assonancés a quelque valeur littéraire et s'écarte un peu des sentiers (de traductions) battus. 3) Les notes font partie du texte et en sont indissociables. Pourquoi faudrait-il les publier ailleurs ? 4) J'accepte que Wikisource prenne cette traduction à son compte, mais je veux voir mon nom ou, mieux, mon adresse e-mail apparaître quelque part. Je ne veux pas que mon texte soit modifié sans mon accord.

Amicalement —Ce commentaire non signé a été déposé par Alain.delorme (d) 17 mai 2010 à 07:10

Je me permets de publier ton message sur le scriptorium de Wikisource, afin que l’ensemble des contributeurs et administrateurs puisse te répondre. --Zyephyrus 17 mai 2010 à 09:57 (UTC)


Il me semble que ce que demande Alain Delorme, quelle que soit la valeur littéraire de sa traduction, n’est pas possible : en effet, les wikisourciens ont une mission qui leur prend déjà beaucoup d’énergie et de temps, et assez difficile pour en faire un travail qu’ils ne peuvent faire seuls et qui exige un effort collectif : sauver les textes de la destruction, en vérifier la conformité aux éditions papier. Leur donner à évaluer la pertinence ou non de telle ou telle publication ou traduction, c’est leur donner un travail supplémentaire qui mord sur le temps déjà restreint qu’ils peuvent consacrer à la mission essentielle qu’ils se sont choisie. C’est pourquoi je suis d’accord avec la proposition de Thomas de ne pas publier dorénavant ce genre de texte. Il me paraît très souhaitable qu’un autre projet de la Wikimedia Foundation les prenne en charge. Vos avis ? --Zyephyrus 17 mai 2010 à 10:08 (UTC)
1) globalement non et surtout pas n’importe quel texte originaux. Une production complètement original est inacceptable, il y a Wikipen et tout l’Internet pour cela. Par contre, pour un traduction personnelle, là plutôt oui (mais la communauté n’a pas encore vraiment statué sur ce point, pour le moment elles sont plutôt « juste tolérées »).
2) là encore plutôt non, on n’a ni le temps ni les compétences pour examiner et juger de la valeur d’un texte (d’ailleurs qui peut vraiment juger d’une œuvre, même la Joconde -à l’époque de sa création- n’était pas particulièrement appréciée). Tant qu’il n’y a pas d’erreurs grossière, pour moi, c’est bon. Donc votre traduction de Dante me semble acceptable.
3) il ne faut pas les publier ailleurs (pourquoi le faudrait-il ?). Sauf si par « ailleurs » on parle des balises et des modèles de mise en forme ad hoc (mais ce n’est pas « ailleurs » au contraire, je dirais plutôt « autrement »).
4) là cela ne va pas du tout et surtout cela ne correspond pas à la philosophie des projets Wiki. En ce qui concerne la paternité (BY), elle est inaliénable est droit français donc le nom de l’auteur doit forcément être disponible (donc ok sur sur ce point). Par contre, tout texte publiée doit pouvoir être améliorer par n’importe qui et ce sans l’accord explicite de l’auteur primaire (ou plus précisément, tout auteur de texte publié sur la Wikisource le fait sous la licence CC-BY-SA qui contient l’accord de modifier a priori).
Digression : on dispose déjà de texte de Dante, celui ci apporte-t-il vraiment un plus ?
Cdlt, VIGNERON * discut. 17 mai 2010 à 11:28 (UTC)

Changement de typographie en cours de route[modifier]

Bonjour, Je me suis attaqué à la validation de Boule_de_Suif depuis un certain temps maintenant. J'ai constaté que l'édition de référence change de typographie à partir de la page 41 : Mme et Mlle deviennent Mme et Mlle. A mon sens, il s'agit d'une erreur typographique de l'éditeur. Par soucis d'homogénéité, j'ai continué d'écrire Mme et Mlle à chaque occurrence de Mme ou de Mlle. Ai-je fait le bon choix ? Si oui, dois-je indiquer ce parti pris quelque part ?

D'autre part, la version que je corrige étant un recueil de nouvelles, les termes de Mme et de Mlle réapparaissent dans d'autres nouvelles (écrits Mme et Mlle). Il m'a également paru plus pertinent de les modifier (j'ai considéré l'homogénéité de l'œuvre dans sa globalité et non les nouvelles au cas par cas). Ma décision vous paraît-elle appropriée ? --Pilpilip 17 mai 2010 à 10:34 (UTC)

Je ne sais pas si c’est la meilleur solution mais cela me parait logique en tout cas.
Quand on effectue la validation, on a souvent des choix à faire (modernisation ou non, respectée au plus près ou non, ſ ou s, etc.). Pour moi, le plus important n’est pas tant de faire le choix que de l’indiquer sur Discussion Livre:Maupassant - Boule de suif.djvu (pour que les autres personnes sachent à quoi s’en tenir et évite de recorriger les corrections).
Cdlt, VIGNERON * discut. 17 mai 2010 à 11:16 (UTC)
Le conseil me paraît juste et j'ai donc créé la page de discussion. Merci d'avoir été si prompt à répondre. --Pilpilip 17 mai 2010 à 19:09 (UTC)

Utilisateur:BnFBoT[modifier]

Bonjour,

Je viens de créer ce gentil bot (basé sur Pywikipedia, c'est Plyd qui créé le code spécifique) qui servira à initialiser les pages de l'espace Livre: pour les livres fournis par la BnF (essentiellement auteur, titre, année, lien djvu, pagelist). Je ferai quelques tests cette après-midi si j'ai le temps ou d'ici ce week-end.

Sinon, les djvu comporteront la couche texte issue de l'OCR de la BnF, mais on a la possibilité aussi d'initialiser également les pages correspondantes de l'espace Page: avec du texte mieux formaté que celui inclus dans la couche texte. J'indique ci-dessous les avantages et inconvénients que je vois à une telle initialisation :

  • Pour :
    • ça évite de devoir traiter tous les retours à la ligne (d'un même paragraphe) et les césures d'une même page (exemple de page non initialisée
    • les entêtes seraient déjà correctement formatés (inclus dans des noinclude)
    • on sera pas référencé sur google si on initialise pas les pages
    • (ou contre?) ça va faire bondir le compteur de pages (espace Page:) de 500 000+ pages
  • Contre :
    • ça crée des liens bleus - plus difficile de suivre les pages non vérifiées (à moins de trouver un autre système - pageQuality?)

Kèskevouzendites ?
~ Seb35 [^_^] 19 mai 2010 à 13:21 (UTC)

Pour Pour évidemment (par contre, pourquoi est-ce que je ne peux pas m’empêcher de penser aux wikisourciers germanophones Clin d'œil). Cdlt, VIGNERON * discut. 19 mai 2010 à 13:37 (UTC)
Pour Pour utilité manifeste. Pymouss |Parlons-en| 19 mai 2010 à 13:42 (UTC)
{{ben vaut voir}}. D’abord, il serait souhaitable de faire une demande ici et que le vote y ait lieu. Ensuite je ne suis pas encore convaincu de l’utilité de charger un demi million de pages surtout si la qualité de l’ocr n’est pas très bonne. Les deux premiers points cités sont des optionnels (à part la césure mais ne pourrait-elle pas être directement corrigée au niveau de la couche texte du djvu ?). Le référencement google sur les pages O_o. Franchement … le compteur ? je ne suis pas un taxi … J’aimerais voir un exemple dans le meilleur et le pire des cas pour pouvoir juger.
Par contre, le chargement des livres dans l’espace du même nom n’est pas trivial. Tous les champs seront remplis convenablement ? Le décalage entre pagination réelle et pagination djvu sera-t-il pris en compte ? etc. andre 19 mai 2010 à 14:05 (UTC)
Pour un exemple, cela devrait arriver dans les heures/jours à venir (on a déjà Raoul de Cambrai mais on a pas utilisé la couche texte BnF je crois).
Le nombre de pages cela m’importe assez peu aussi (mais ce n’est pas un point négatif non plus. Pour le référencement, je suis assez neutre aussi, par contre pour la BnF ou la Wikisource en général, ça peut être une bonne chose.
Le pagelist est généré à partir des données BnF et prend donc en compte la pagination en chiffre arabe ou romain, les pages non paginées (ça je sais). On a vérifier quelques livres, les données BnF semblent être toutes bonnes.
Les champs sont remplies au mieux avec les données BnF qui ne sont pas toujours toutes présentes mais selon moi tout est bon à prendre.
Je suis pas chaud pour passer par un vote 1. parce que ça prend du temps et que l’import est prêt (ou presque), et les serveurs ça coute de l’argent, donc qui dit plus de temps dit plus d’argent… 2. parce que le « botage » est temporaire, dans un mois, ce bot ne servira plus à rien.
Cdlt, VIGNERON * discut. 19 mai 2010 à 14:25 (UTC)
Le vote malheureusement me semble inévitable. Les accords entre wikimedia-france et bnf sont une chose, les règles internes à wikisource une autre. Il fallait faire la demande avec un peu d’avance. Et puis il suffit de faire un peu de pub pour éviter que le vote ne dure trop longtemps. Je veux savoir aussi ce que pensent les utilisateurs confirmés de cette opération. Pour ma part, si la qualité des pages est similaire à ceci, je suis contre le chargement massif de ces pages sur wikisource. andre 19 mai 2010 à 14:41 (UTC)
Ok (voir infra).
Si tu regardes Wikisource:Dialogue BnF/Liste de textes fournis, tu remarqueras que le taux n’est que de 88.47 %. Vu que ce texte est en ancien français ceci explique cela, ce n’est pas un exemple représentatif. De toute façon, la couche texte présente n’est pas celle de la BnF mais celle de Zaran (à l’époque la couche n’avait pas encore été intégrée). Donc c’est définitivement un mauvais exemple. Cdlt, VIGNERON * discut. 19 mai 2010 à 15:30 (UTC)
D'après ce que j'ai pu voir, la qualité de l'OCR est en général pas trop mauvaise, sauf pour quelques livres. Pour les césures, ce n'est pas possible de le mettre dans le DjVu, qui contient strictement l'OCR (~= texte). Pour le remplissage des métadonnées livre, c'est strictement ce que donne la BnF, ça peut être à revoir légèrement mais ça fait toujours une base initiale (donc pas à refaire/réinventer). ~ Seb35 [^_^] 19 mai 2010 à 16:19 (UTC)
Ce que vous faites avec ce projet est vraiment trop vague et vous avez un gros problème de communication. Qu’est ce que cela veut dire en général ? utilisez vous le scan bnf (dans ce cas 33,51% des livres ont un taux inférieur ou égal à ce que donne le livre cité plus haut) ou bien autre chose (tesseract ??) ? Dans ce cas comment mesurez vous la qualité de ce nouvel ocr ? Si les pages sont de mauvaises qualités, Combien de temps cela prendra-t-il à la minuscule communauté wikisource-fr pour corriger ce demi million de pages ? Nous aurons donc en ligne des centaines de milliers de pages dans un état lamentable pour pas mal de temps. Ceci ne fera pas ni de la pub pour wikisource, ni pour la bnf. andre 19 mai 2010 à 16:32 (UTC)
Je suis désolé de ne pas avoir fait de statistiques précises sur la qualité de l'OCR, j'ai autre chose à faire (pour info par exemple j'ai pris une journée de congé aujourd'hui pour me consacrer à ce projet, et je crois que j'ai encore à boire et à manger pour ce week-end). Quand je dis en général, c'est que en parcourant les livres pour diverses tâches, je n'ai pas souvent vu de grosses fautes d'OCR -- de la BnF -- (après, je n'ai effectivement pas tout regardé). Sinon, que les pages soient initialisées ou non par le bot, le texte sera le même que dans la couche texte, mis à part pour les césures/fin de lignes/entêtes, ça fera juste un peu plus de travail par page que ce soit un humain qui s'occupe des césures/fins de lignes/entêtes. ~ Seb35 [^_^] 19 mai 2010 à 17:01 (UTC)
@andre : désolé, mais on avait vraiment autre chose à faire que des compte-rendus sur nos avancées à la communauté WS. On a trimé pendant un mois, là on arrive à une échéance, on présente des résultats préliminaires et demande à la communauté WS les moyens d’aller vite pour pouvoir terminer dans nos temps. La communauté s’y oppose. Soit. Pas la peine de crier au scandale, on aurait bien évidemment pas lancé un bot sur 500 000 pages sans vous demander votre avis. On a toujours voulu faire un test upload de cinq-dix bouquins, pour vous permettre de juger sur du concret. Jean-Fred 19 mai 2010 à 22:17 (UTC)
Je ne suis pas contre la présence des livres associés au projet BNF, au contraire. Je suis seulement très sceptique quant à l’utilité d’initialiser toutes les pages des livres chargés avec l’ocr contenu dans la couche texte du djvu. On ne le fait pas en général et je ne comprends pas pourquoi il faudrait le faire automatiquement avec les livres du projet bnf. Les arguments de Vigneron, de seb35 et de Jean-Fred ne me convainquent pas. Je serais d’accord dans le cas d’un ocr de très bonne qualité mais je suis certain que tesseract ne donnera pas un bon résultat sur tous les livres. Donc, le chargement dans l’espace page doit se faire en fonction des cas et non de manière massive.
Quand au problème de communication, je suis désolé si vous vous sentez offensé par mon accueil mais je répète : Wikisource n’est pas wikimedia-france. Les obligations que vous avez pris sont envers wikimedia-fr et la bnf. Wikisource, au sens de sa communauté, n’a pas été consultée. Il fallait prendre le temps de le faire et cela aurait du, à mon avis, faire partie de votre table de marche. Mais il n’est jamais trop tard pour y remédier…
Au moins maintenant je sais que vous voulez faire un test upload de cinq-dix bouquins, pour vous permettre de juger sur du concret. De quels livres s’agit-il ? quels sont vos critères de choix ? andre 20 mai 2010 à 08:02 (UTC)
Quelques petites corrections :
BnFBot ne fait pas que créer la page avec la couche texte, il met en forme et utilise quelques données des serveurs BnF.
Inutile de parler de Tesseract, il n’intervient à aucun moment dans cette affaire (sauf peut-être pour le fichier test créer par Zaran pour Raoul de Cambrai mais c’était disons une « erreur »). Les OCR sont uniquement ceux fournis par la BnF.
Wikimedia France n’a pris aucun engagement *ferme* avec la BnF (dans l’accord du partenariat, on retrouve beaucoup de formules du genre « sous réserve d’acceptation par la communauté etc. »).
Si tu as des préférences pour les fichiers tests, n’hésite pas à les formuler. Sinon, je propose de simplement prendre les quelques fichiers sélectionnés par la communauté (et éventuellement, quelques fichiers extrêmes pour tester les limites du processus).
Cdlt, VIGNERON * discut. 20 mai 2010 à 14:37 (UTC)
Mea culpa pour Tesserac. J’estime avoir le droit de me tromper vu que je suis obligé de deviner ce que vous voulez faire. J’attends toujours des explications précises sur ce qui va être fait avec ce bot. « BnFBot ne fait pas que créer la page avec la couche texte ». Ce qui veut dire ? Il va créer les 1400 pages dans l’espace livre et puis ? J’aimerais le savoir par avance. J’ai mis sur la page que j’avais prise en exemple (ici) l’ocr bnf. Il est vrai que je l’ai choisie complètement au hasard mais supposons qu’elle soit représentative de la qualité ocr déclarée, cela veut dire que plus cent cinquante mille des page-textes ocr que vous voulez importer sont de qualité inférieure ou au mieux égale à celle-ci.
Pour les essais il est selon moi impératif d’échantillonner la dispersion sur la qualité pour décider d’un seuil au cas où la communauté décide d’effectivement charger les textes ocr dans l’espace page. Il y a sûrement aussi des critères liés à l’espace livre, mais comme on ne sait pas ce que vous faites, on ne peut pas vous aider… Seulement commenter après coup en espérant ne pas avoir à passer la serpillière. andre 20 mai 2010 à 17:58 (UTC)
Errare humanum est, cela vaut pour tout le monde, toi comme nous.
Pour les explications précises, demande à Plyd et Seb35 (il devrait même pouvoir te fournir le code si besoin, moi je ne suis que « conseiller Wikisource » dans l’affaire). En gros, le script prend l’OCR BnF et y applique quelques détails de mise en forme (cf. supra). Pas grand’chose mais toujours ça de moins à faire pour les humains.
Tu remarqueras que l’OCR BnF est supérieur à celui de Tesseract (d’ailleurs il faudrait mettre à jour Tesseract sur le Toolserver, mais c’est un autre sujet).
Fourni une liste si tu veux être sur que cela te convienne. On peut effectivement choisir de ne créer que les pages dont le taux est supérieur à X %. Ceci dit, je te laisse définir ledit seuil (selon moi tout texte est bon à prendre et sera de toute façon, in fine pris).
Autant pour les pages, je peux concevoir tes réticences (sans y adhérer) mais je ne vois pas le problème à créer les livres (ce ne sont que 1400 pages et on a déjà de nombreux index « vides» ).
Si il y a besoin de « passer la serpillière » je pourrais aider Clin d'œil.
Cdlt, VIGNERON * discut. 20 mai 2010 à 18:26 (UTC)
Bon, on va pas se disputer là-dessus, mais rapidement : je pense que nous avons procédé comme il fallait. La question n’était pas tant "Qu’est-ce que WS veut que nous fassions avec les bouquins BNF" que "Qu’est-il possible de faire avec les bouquins BNF" (malheureusement, pour WS comme pour Wm-Fr). Nous avons étudié les données dont nous disposions grâce à la BnF, et avons travaillé à en tirer le maximum (et nous avons dialogué avec la communauté WS, Seb Plyd et moi-même, ici sur le Scriptorium, sur IRC ou ailleurs). Maintenant qu’on sait ce qui est possible, on vous consulte (c’est là tout l’objet de cette section) : on propose, tu disposes. A te lire, on a l’impression qu’on vous met un couteau sous la gorge et qu’on vous force la main avec les Pages ; alors que le but de cette section est justement que vous vous prononciez à ce sujet…
Après, je veux bien croire qu’on s’explique pas forcément hyper bien, mais suffit de nous demander, et on se ré-explique. Le message initial de Seb n’était pas un communiqué de presse auquel il fallait dire Amen, mais une invitation à la discussion… Jean-Fred 20 mai 2010 à 20:20 (UTC)
J’ai lancé le vote, merci d’y participer : Wikisource:Bots#Utilisateur:BnFBoT. Cdlt, VIGNERON * discut. 19 mai 2010 à 15:30 (UTC)
Pour Pour avec pagequality level="1" / ~ Seb35 [^_^] 19 mai 2010 à 16:19 (UTC)
Je confirme ce que dit Vigneron plus haut, l’exemple de Raoul de Cambrai n’est pas du tout représentatif, car c’est de l’ancien français. Je m’étais occupé de découper les marges de ce djvu et d’ajouter la couche texte. De plus, je crois que c’était avec une ancienne version de tesseract (la version de développement actuelle est bien meilleure). Voir Wikisource:Bots#Utilisateur:BnFBoT pour mon avis sur le BnFBoT. Zaran (Discuter) 19 mai 2010 à 16:24 (UTC)
{{pour}} A propos de pourcentages de reconnaissance de caractères : parfois l’OCR ou l’image sont médiocres mais si la source est irremplaçable je pense qu’il ne faut pas la jeter. Dans le même ordre d’idées, nous offrirons certaines versions plus modernes ou plus lisibles de certains textes, mais en prenant bien garde à ne pas jeter pour autant les éditions originales ou les manuscrits moyen-âgeux auxquels on peut se reporter pour vérification. Donc je préfère les 98,5 % aux 87,3 %, mais je préfère dans certains cas les 87,3 % à une absence de référence, lorsqu’il s’agit de contribuer à éclairer des cas litigieux. --Zyephyrus 19 mai 2010 à 16:36 (UTC)
{{contre}} après l'avis de ThomasV : si la création de pages empêche toute amélioration ultérieure de la qualité de l'OCR, n'est-il pas souhaitable d'océriser les pages au fur et à mesure des besoins plutôt que de le faire à l'avance ? Seb35, est-il possible d’adapter ton gentil Bot pour qu’il traite les pages à la demande ? --Zyephyrus 20 mai 2010 à 19:13 (UTC)
Ce n’est pas ce que je comprends de l’avis de ThomasV : il dit que les versions "améliorées" spécial Page sont à mettre dans les DjVu. Il aurait raison, si ces améliorations ne tenaient pas uniquement de la mise en page WS, qu’il n’est pas possible ni souhaitable de mettre dans un DjVu.
Par ailleurs, je ne comprends pas ce que tu veux dire par « empêcher toute amélioration ultérieure de la qualité de l'OCR » : les pages de WS pourront bien sûr être améliorées (c’est le but, non ? Clin d'œil) ; quant aux DjVu, il ne sera pas possible d’y réinjecter les pages corrigées de WS sans perdre toutes les informations de localisation du texte.
D'ailleurs, question là-dessus : généralement, les DjVu sur lesquels vous vous basez ne sont pas mis à jour sur Commons une fois le bouquin corrigé et validé, si ? Jean-Fred 20 mai 2010 à 20:20 (UTC)
Non, ils ne sont à ma connaissance pas mis à jour. Si vous pouvez programmer un bot qui le fasse cela permettrait à Wikisource et à la BnF de redonner à l’éventail de services offerts un « plus » appréciable. Peux-tu préciser quelles informations de localisation du texte seraient perdues en cas de réinjection du texte corrigé dans le djvu ?
Quand tu dis que « les pages de WS pourront bien sûr être améliorées », est-ce que tu penses aux améliorations apportées à la main par les correcteurs wikisourciens, ou à des améliorations apportées par les progrès des OCR toujours plus performantes qui leur faciliteront de plus en plus la tâche ? --Zyephyrus 20 mai 2010 à 20:47 (UTC)
Une page DjVu ce n’est pas simplement une image et du texte : à chaque mot sont associées des coordonnées délimitant la zone dans laquelle il se trouve (ainsi que chaque ligne et chaque paragraphe). Or nous disposons de ces données dans les OCR de la BnF (à quelques acrobaties matheuses près), donc nous générons une couche texte très clean. (Bien sûr, il est possible de remplir la couche texte des DjVu à l’arrache en mettant tous le texte dans une seule grosse boîte, mais ce n’est pas du tout classe ni très exploitable pour des gens reprenant les DjVu sur Commons.) Le wikitexte est beaucoup moins riche de ce point de vue là : les mots n’ont pas de position associée. A partir de là, il est quasi-impossible de mettre à jour le DjVu proprement (comment déterminer que tel pâté infâme de l’OCR originel doit être remplacé par tel mot corrigé ?)
Je pensais aux améliorations à la main. Sur les progrès des OCR : imaginons une page WS initialisée avec l’OCR de la BnF (supposons ! Clin d'œil), esseulée jusqu’à une époque où Tesseract (ou autre outil disponible sur WS) soit devenu un killer, je ne vois ce qui empêcherait de s’aider de cet outil pour la correction du texte (au coup par coup ou +/- automatiquement, d’ailleurs). Jean-Fred 20 mai 2010 à 21:36 (UTC)

Récapitulatif et proposition :

Corrigez-moi si je me trompe, mais j’ai l’impression que tout le monde est à peu près d’accord sur l’idée que les Livre: soient initialisés par BnFBoT. Le gain en terme de métadonnées est en effet appréciable (type, titre, auteur, année, pagelist).

Pour les pages : dès que notre process est opérationnel, je propose que comme annoncé BnFBoT initialise toutes les pages d’un bouquin donné (de votre choix). Sur cet exemple, la communauté WS juge si le gain de mise en forme est suffisamment intéressant pour justifier l’idée d’une initialisation massive des pages (à côté des arguments "politiques"). Parallèlement, on continue la réflexion entamée par André plus haut sur d’éventuels critères pour une initialisation massive sélective.

Qu’en pensez-vous ? Jean-Fred 20 mai 2010 à 21:36 (UTC)

La proposition me paraît intéressante. Sur une page comme celle-ci qui correspond à cette image quelles améliorations seraient apportées par le bot ? est-il possible de faire un premier test sur une seule page ? --Zyephyrus 20 mai 2010 à 22:54 (UTC)

Je pense aussi préférable de ne pas créer les pages avec le bot. Du moment que les pages sont remplies automatiquement avec le texte extrait du DJVU, il vaut mieux laisser les pages vides. Une fois les pages créées, il devient difficile de renommer l'index, entre autres. Pour Pour la création des index, par contre. Je vais essayer de corriger et compléter la liste des auteurs, bien que ma connexion soit lente et intermittente. Désolé de ne pouvoir être plus efficace. Yann 21 mai 2010 à 04:43 (UTC)

Pour Pour la création des index, et pour un bouton qui fasse ce que Seb35 a dit ci-dessus : « traiter tous les retours à la ligne (d'un même paragraphe) et les césures d'une même page ». Est-ce que vous pouvez nous mettre en place ce bouton (qui rectifierait aussi les apostrophes et les tirets quand on corrigerait quelque chose à la main, ce qui éviterait une autre perte de temps plutôt importante) ? --Zyephyrus 21 mai 2010 à 07:08 (UTC)
Houlà, il y a maldonne sur ce coup : ce n’est pas du tout comme cela que ça marche. Le processus est le suivant : lors de l’analyse syntaxique des OCR de la BnF, nous construisons d’un côté la couche texte des DjVu et de l’autre du wikitexte. C’est fait par le Python à partir de données qui existent dans les OCR et pas dans les DjVu. Si 100% des infos des XML OCR pouvaient être transférées dans le DjVu et envoyées par ce biais sur WS, on ne se serait pas cassé la tête à générer en plus du wikitexte Clin d'œil.
Donc un tel bouton n’est pas envisageable, car la "plus-value" que nous proposons n’est rendu possible que grâce aux données BnF, dont on ne disposera pas indéfiniment. Jean-Fred 21 mai 2010 à 18:00 (UTC)
C'est différent de ce que j'avais tout d'abord compris. Il me semble évidemment qu'on ne peut se permettre de perdre des informations. Si les informations ne peuvent pas être inclues dans le DJVU, alors il est préférable de créer les pages avec le bot. Mais j'ai du mal à comprendre quelles informations sont récupérées de la BNF qui ne peuvent être inclues dans le DJVU. Yann 22 mai 2010 à 11:02 (UTC)

Coupure arbitraire[modifier]


Source : Wikisource:Bots


Je me suis permis de transclure ici certains arguments avancés sur la page Wikisource:Bots et qui me semblent importants pour le débat. Je me rends compte aussi que lorsque j’avais donné mon avis plutôt favorable, j’avais mal mesuré toutes les implications de ce qui était proposé. Ce qui me met assez mal à l’aise, c’est que le débat est conditionné par l’état actuel des moyens que nous avons à notre disposition. Par exemple, un des arguments pour la création des pages et que cela réaliserait déjà une partie de la mise en forme wikisource comme les en-têtes ou les tirets de fin de page (ces mises en forme en wikicode n’ont aucune raison d’être incluse dans la couche texte d'un fichier djvu). On oppose à cela, que ces mises en forme pourrait être fait automatiquement en javascript, « à la volée », lors de l’initialisation de la page (pour l’instant la couche texte est reportée de façon brute dans la zone d’édition). Ceci nous renvoie donc à la question de l’amélioration des outils déjà présents sur wikisource.

La question est donc difficile, car on raisonne en se disant que les outils vont être amenés à évoluer, la qualité des logiciels d’OCR va augmenter, etc… alors que ce transfert de la BNF est bien actuel. Peut-être n’est-ce pas aussi grave, car rien (ou presque rien) n’est définitif dans un wiki, et si les outils évoluent un jour, il sera toujours temps de mettre à jour les livres créés au moment du transfert. J’en profite pour résumer : 1. tout le monde semble d’accord pour la création des pages d’index 2. la mise en forme wikisource (wikicode) ne doit pas être incluse dans la couche texte des djvu, mais pourrait être faite « à la volée », cf #Autre point lié à la BnF mais liés. Je pense donc qu’il faut attendre que la situation s’éclaire un peu, et de voir le résultat du test annoncé plus haut avant de donner un avis définitif. Zaran (Discuter) 23 mai 2010 à 16:57 (UTC)

Euh, je ne vois vraiment pas pourquoi on devrait s’interdire de mettre du wikitexte dans la couche texte d’un Djvu. C’est un péché ? ThomasV 23 mai 2010 à 17:18 (UTC)
Ce n’est pas vraiment un péché, mais les deux raisons suivantes avancées par Jean-Fred plus haut me semblent valables :
1. les fichiers djvu devrait pouvoir être réutilisable ailleurs : imaginons quelqu’un qui télécharge le fichier djvu depuis commons et qui souhaite en extraire tous le texte. S’il désirait avoir tout le texte du livre, et seulement le texte du livre, peut-être sera-t-il déçu de devoir commencer par enlever tous les {{tiret}} et noinclude avant d’avoir un texte lisible.
2. normalement, la syntaxe des couches textes de fichiers djvu contient pour chaque mot l'information de position dans la page, cela ne me semble pas compatible avec par exemple l’ajout de balises noinclude autour des mots correspondant à l’entête de la page. Zaran (Discuter) 23 mai 2010 à 17:25 (UTC)
En effet, un fichier djvu placé sur commons devrait être réutilisable ailleurs. Et alors ? Est-ce que le fait d’y inclure du wikitexte le rend inutilisable pour autant ? Et surtout, est-ce que nous sommes supposés donner la priorité aux autres usages qui pourraient être faits de ces fichiers, même si cela nous oblige à créer un demi million de pages ? Je rappelle que nous ne sommes nullement obligés de placer sur commons les fichiers DjVu que nous utilisons sur Wikisource. Nous avons pris l’habitude de placer sur commons nos fichiers sources, mais si les admins de commons veulent donner priorité aux autres usages possibles de ces fichiers, alors rien ne nous empêche d’avoir une version locale de ces fichiers, avec une couche texte adaptée à ce que nous voulons en faire.
Autre question: est-ce que quelqu’un a pris la peine de calculer le temps nécessaire à un robot pour créer un demi million de pages ? bien sûr, on peut toujours dire que nous sommes sur un wiki, et que donc rien n’est définitif. C’est vrai en théorie seulement. En pratique, ça cesse d’être vrai quand il faut programmer un robot pour revenir en arrière, et quand la tâche à accomplir est si lourde que ce robot mettra plusieurs mois à charger toutes les pages. Dans ce cas, le mot "réversible" prend un tout autre sens…
Enfin, ce qui me dérange par dessus tout, c’est que toutes ces pages vont rester en chantier pendant des années. Le jour où on s’apercevra qu’on a besoin de les renommer, d’en améliorer l’OCR, ou bien d’en modifier la syntaxe, alors il est fort probable que le créateur du robot ne sera plus disponible pour offrir son aide, pas plus que ceux qui auront approuvé sa décision. J’ignore si je serai encore actif sur Wikisource dans dix ans, et je me méfie des promesses qui s’étendent sur une durée pareille. En d’autres termes, vous vous apprêtez à lancer un chantier qui est destiné à durer bien plus longtemps que votre passage sur Wikisource, sans vous soucier des conditions dans lesquelles il sera mené à son terme. D’autres que vous vont devoir supporter les conséquences des décisions que vous prenez maintenant. Je trouve que ce n’est pas responsable. Il vaudrait mieux que ce travail soit divisé en chantiers plus petits, à taille humaine.
ThomasV 23 mai 2010 à 18:33 (UTC)
Oui, pourquoi pas inclure le wikitexte dans la couche texte des djvu, même si on perd un peu en universalité, on peut envisager avoir une version wikisource et une version non wikisource des fichiers. Par contre, tu ne réponds pas au point 2, penses-tu que l’on puisse conserver les informations relatives à la position des mots dans la couche texte tout en insérant du wikicode et des balises telles que noinclude  ? Cela semble difficile, mais peut-être que je me trompe. On peut aussi considérer que pour une version wikisource des djvu, ces informations ne sont pas nécessaires.
Ensuite, tu sembles légèrement irrité dans ton message précédent, ce que je comprends. Moi-même, j’écrivais plus haut, que je me sentais mal à l’aise car on parle de quelque chose qui va s’étaler au moins sur 10 ans, et qu’il faut donc prendre en compte les évolutions futures. Par contre, je trouve ton accusation d’irresponsabilité plutôt injustifiée, car j’essayais justement de soulever ces questions. Il est vrai que l’on peut résoudre ce problème en ne créant les pages qu’au cas par cas. C’est probablement la solution la plus prudente. Il faudrait donc dans ce cas s’assurer que toutes les mises en forme qui devaient être faites dans l’initialisation des pages puissent bien être insérées dans la couche texte. De plus, cela va demander aux personnes s’occupant de ce transfert quelques modifications dans leur code… A suivre.
Zaran (Discuter) 23 mai 2010 à 18:53 (UTC)
Non, rassure-toi je ne suis pas irrité; j’essaie d’expliquer ce qui me dérange. Le meilleur moyen de prendre en compte les évolutions futures est de confier la création des pages à celui qui a l’intention de les corriger. Pour ton point 2 : il n’est pas obligatoire de donner la position des mots dans la couche texte d’un djvu; pour Wikisource ça a peu d’intérêt. ThomasV 23 mai 2010 à 19:05 (UTC)
Vous parlez de ceux qui supporteront les conséquences de nos décisions : je trouve comme vous que nous devons tous fournir un effort, chacun à notre façon, pour imaginer ces conséquences. Or chacun de nous voit des dangers différents (je pense pour mon compte qu’il faut les envisager tous). Pour moi j’appréhende que des décideurs zélés ferment des chemins et des entrées en fonction de leur vision d’un moment et d'un espace alors que nos points de vue aussi sont transitoires. Oui, je suis bien d’accord que des chantiers peuvent être décourageants et peuvent dissuader d’entrer dans une bibliothèque. Oui, je vise moi aussi des bibliothèques ordonnées, balisées, aménagées en fonction des goûts de leurs visiteurs ; mais d’autre part je ne suis pas d’accord avec l’exclusion d’un grand nombre de textes qui un jour ne satisfont pas tel critère, un autre jour tel autre, et qui aboutissent à la loi de décideurs qui ne sont pas forcément les plus tolérants ni forcément les plus intelligents, ni forcément les plus honnêtes. Rien qu’en mettant ces décisions là ensemble, que de livres exclus déjà. Et si on y ajoute les décisions d’ordre esthétique, financières, politiques, que sais-je, à quoi finit-on par arriver ? Je suis d’accord avec vos points de vue, j’y ajoute aussi celui-là, j’aimerais qu’il y en ait encore beaucoup d’autres.
Pour en revenir aux suggestions que vous avez faites, il me semble (c’est peut-être excès d’optimisme) que tout cela n’est pas incompatible, peut-être parce que sur ce point je manque d’imagination. Ne peut-on avoir à la fois des pages créées par un bot en tâche de fond pendant plusieurs mois une fois qu’on aura abouti à une programmation et une qualité d’OCR qui donne au projet une chance de réussir ; et en même temps constituer des équipes autour de divers chantiers plus petits et à taille humaine, avec nos propres versions de Djvu dans certains cas comme le suggère Thomas ? Est-ce que c’est incompatible ? --Zyephyrus 23 mai 2010 à 19:49 (UTC)
Il est possible de sauvegarder l'ensemble des wikitextes-OCR et de les ressortir quand on s'attaque à un livre. On doit rendre le serveur en location fin juin, mais on peut sauvegarder ces textes sur un autre serveur pérenne (toolserver), et peut-être dire au bot d'importer au livre par livre ces fichiers. Ça suppose un peu de programmation Python-JavaScript pour l'extraction, un peu comme le bot de Phe sauf que le texte ne vient pas d'un programme OCR mais un texte statique (lui-même issu d'un OCR).
Je ne suis pas trop chaud pour faire une autre version DjVu, car ça duplique l'information entre Commons et Wikisource (overwrite local) ainsi que les images (et leur poids) (outre le fait que je trouve pas propre l'intégration de wikitexte dans un DjVu, troll pourquoi pas l'Alto plus complet avec les styles ? /troll ), et surtout ça fait un import massif en plus : Commons a l'habitude de reçevoir 100+ Gio de fichiers, Wikisource non. ~ Seb35 [^_^] 24 mai 2010 à 20:42 (UTC)
Je vois que la discussion a un peu avancée. Il me semble que la meilleure solution est effectivement de stocker ces textes sur un autre serveur pérenne, pourquoi pas Wikisource ou Commons ? Il me semble aussi préférable de ne pas dupliquer les fichiers DJVU. Yann (d) 25 mai 2010 à 17:20 (UTC)
va pour de l’Alto dans la couche texte, si ça peut éviter de créer un demi million de pages. Je ne connais pas ce format, mais je suppose qu’il est possible de le convertir en wikitexte à la volée, à l’aide d’un outil javascript ? ThomasV (d) 25 mai 2010 à 17:39 (UTC)
Quelqu’un peut-il me donner un lien vers la description du langage Alto. De plus, d’après ce que dit Seb, ce langage permet de gérer les styles. En quoi est-il préférable au XHTML/CSS. Zaran (Discuter) 25 mai 2010 à 20:59 (UTC)
Seb doit avoir une documentation quelque part… En attendant, avec Google, rapidement, j’ai trouvé ça.
XML ALTO et HTML sont différent et pas du tout créer dans le même but. ALTO contient notamment une information sur la position de chaque mot dans la page (ce qui est inutile et même sans objet en HTML). ALTO est donc plutôt inutile pour la Wikisource mais il important pour les djvus (c’est plus propre, plus professionnel, plus pérenne, etc. il ne faut pas oublier que si les djvus sont d’abord pour la Wikisource, ils doivent pouvoir être aussi utile à d’autres, ne serait-ce que la Wikisource de demain qui aura probablement des standards différents de ceux d’aujourd’hui).
Cdlt, VIGNERON * discut. 25 mai 2010 à 22:13 (UTC)
Il n’y a pas de doc, le site que tu as trouvé est le seul site (intéressant) qui parle de l’Alto en dehors du site officiel (XSD = meilleure description ) et de celui de la BnF. ~ Seb35 [^_^] 27 mai 2010 à 21:38 (UTC)
En fait, la section que j’ai mis entre balises troll était un p’tit troll et non un truc à prendre au sérieux. On a déjà fait cette transformation. Je donne un exemple :

XML ALTO :

 TextBlock ID="PAG_5_TB000008" STYLEREFS="TXT_4" HPOS="831" VPOS="1120" HEIGHT="651" WIDTH="897" 
  TextLine ID="PAG_5_TL000011" STYLEREFS="TXT_4" HPOS="832" VPOS="1223" HEIGHT="41" WIDTH="894" 
  ...
   String ID="PAG_5_ST000056" STYLEREFS="TXT_4" HPOS="1628" VPOS="1225" HEIGHT="30" WIDTH="17" WC="0.99" CONTENT="à"/ 
   SP ID="PAG_5_SP000046" HPOS="1645" VPOS="1232" WIDTH="11"/ 
   String ID="PAG_5_ST000057" STYLEREFS="TXT_4" HPOS="1656" VPOS="1232" HEIGHT="31" WIDTH="70" WC="0.99" CONTENT="pro-" SUBS_TYPE="HypPart1" SUBS_CONTENT="propos."/ 
   HYP HPOS="1726" VPOS="1263" WIDTH="30" CONTENT="-"/ 
  /TextLine 
  TextLine ID="PAG_5_TL000012" STYLEREFS="TXT_4" HPOS="831" VPOS="1275" HEIGHT="41" WIDTH="894" 
   String ID="PAG_5_ST000058" STYLEREFS="TXT_4" HPOS="831" VPOS="1284" HEIGHT="31" WIDTH="64" WC="0.99" CONTENT="pos." SUBS_TYPE="HypPart2" SUBS_CONTENT="propos."/ 
   SP ID="PAG_5_SP000047" HPOS="895" VPOS="1275" WIDTH="19"/ 
   String ID="PAG_5_ST000059" STYLEREFS="TXT_4" HPOS="914" VPOS="1275" HEIGHT="31" WIDTH="76" WC="0.99" CONTENT="C'est"/ 
  ...
  /TextLine 
 /TextBlock 

Couche texte DjVu (coordonnées non contractuelles, c'est qqch genre x 3508-y-h x+w 3508-y à qq détails près dûs à l'élimination des marges blanches) :

(para 831 1491 1482 2388
 (line 832 1391 873 2285
  (word 1628 2253 1645 2283 "à")
  (word 1656 2245 1726 2276 "propos."))
 (line 1284 2192 1348 2233
  (word 914 2202 990 2233 "C’est")))

Couche texte DjVu lue par Wikisource :

à propos.
C’est

Wikitexte (qui peut être initialisé par BnFBoT, sans coupure de lignes mais avec saut pour les changements de paragraphes) :

à propos. C’est

Voilà. Pour info, les styles ne sont pas vraiment utilisables, ils ne comportent que la fontfamily et la fontsize, ce que les Wikisourciers font très bien sans avoir besoin de cette info, qui n’est utile que dans la page de titre, et qu’il serait difficile d’inclure dans le wikitexte automatique (quelle taille est la taille standard du livre ? etc.).

Finalement, maintenant, on se disait avec Jean-Fred que ça n’est peut-être pas la peine d’initialiser les pages vu le peu d’apport (seulement fins de lignes+entête, puisque les césures sont dans le DjVu), le problème du renommage, d’avoir beaucoup de pages non revues pendant un temps long. ~ Seb35 [^_^] 27 mai 2010 à 21:38 (UTC)

(conflit d'édit, rendant mon message inutile :-p)
@Zaran : Voir le site de la BnF.
Pour la couche texte : DjVu est dédié à contenir du texte brut, pas des dialectes XML ou autre chose. Quant à générer les DjVu en double, je rejoins Seb : processus de création plus lourd, duplication du contenu, import massif sur une plate-forme non-adaptée.
Je confirme ce que dit Seb : le gain nous apparaît trop faible pour les désagréments soulevés. Jean-Fred (d) 27 mai 2010 à 21:50 (UTC)
Merci à vous trois pour vos réponses sur l’Alto. Donc visiblement, la tendance se dessine plutôt pour une simple création des pages d’index sans initialisation des pages. En tout cas c’est maintenant mon point de vue (contrairement à mon vote initial beaucoup trop irréfléchi). Dans ce cas la discussion initiée par Vigneron : #Autre point lié à la BnF mais liés concernant la mise en place d'un outil de mise en forme automatique des césures (+ éventuellement de quelques ajustements typographiques) est à poursuivre sérieusement. Zaran (Discuter) 27 mai 2010 à 23:19 (UTC)

Autre point lié à la BnF mais liés[modifier]

Le projet BnF fait remonter à la surface divers points qui n’y pas directement liés. Je note deux points qui serait facilement améliorable :

  • celui de Yann : « Une fois les pages créées, il devient difficile de renommer l'index, entre autres. » Actuellement, c’est vrai mais il suffirait d’activer le renommage des sous pages et on pourrait renommer toute les pages d’un livre en un clic.
    • Pour autant que je sache, ça fonctionne dans l'espace principal, mais pas pour les pages d'un livre. Yann 22 mai 2010 à 04:12 (UTC)
      • Oui pour le moment, mais je crois que c’est juste une question de réglage. Cdlt, VIGNERON * discut.
  • celui de Zyephyrus : la mise en forme automatique. Un gadget développé par Phe et Acer fait déjà cela pour le Trévoux. Toute une partie est spécifique au Trévoux mais la partie correction de césures et de la typo de base pourrait être reprise et grandement faciliter l’édition.

Quelqu’un pourrait-il s’en charger (pour le premier point, je pense que cela doit être fait par un dev : ThomasV pourrais-tu regarder ?). Cdlt, VIGNERON * discut. 21 mai 2010 à 10:08 (UTC)

Pour le second point, j’utilise pour ma part la fonction suivante :
function typo(str){
    str = str.replace(/(- *)?\n/g, "");
    str = str.replace(/'/g, "’");
    str = str.replace(/\.\.\./g, "…");
    return str;
}

qui peut ensuite être liée à un bouton quelconque. Cette fonction pourrait être grandement affinée pour réaliser un certain nombre de corrections de base. Zaran (Discuter) 27 mai 2010 à 23:28 (UTC)

P. S. : je reproduis ici la partie réutilisable du script de Phe et Acer pour le Trévoux :
     "([^'])['‘]([^'])", "$1’$2",
     "[.][.][.][.]*", "…",
     "[ ]([,.])", "$1",
     "([^ \s])([;:!?])", "$1 $2",
     "([«;:!?])([^ \s…])", "$1 $2",
 
     // Séparé des précédentes sinon "word!»" overlap
     "([^ \s])([»])", "$1 $2",
 
     // Une des regexp précédentes a pu produire des  espace \n et de
     // toute façon les espaces en fin de ligne n'ont pas d'intérêt
     " (\n| br)", "$1",
 
     // Trois majuscules en début de ligne --  paragraphe
     "([^\n])\n([A-Z][A-Z][A-Z])", "$1\n\n$2",
 
     // Césure
     "-\n([a-zéèçà])", "$1",
     "([^\n])\n([^\n])", "$1 $2",

Interproject transclusions[modifier]

Bonjour. J'ai ajouté une section d'une page de ca.source avec la class "iwpage" que nous donne oldwikisource:MediaWiki:InterWikiTransclusion.js (importé avec MediaWiki:Common.js). Il peut être préférable grouper le code dans un modèle comme la:template:iwpage o ca:template:iwpage? -Aleator 20 mai 2010 à 00:29 (UTC)

Bonjour Aleator, grand merci pour toutes ces avancées !
Ne penses-tu pas qu’il faudrait aussi réussir à créer un même formatage des différentes sources pour afficher différentes versions les unes à côté des autres ? Comment faire ? Les wikisourciens ont-ils des idées ?
J’ai commencé à créer un modèle {{tr_interwiki}} calqué sur le modèle {{tr}} mais je ne sais pas s’il pourra servir tel quel. Il faudra sans doute l’adapter. --Zyephyrus 20 mai 2010 à 07:43 (UTC)
Cet avis s’affiche sur la page :
Error de citació: Hi ha etiquetes ref però no cap etiqueta references/
L’ajout de references / ne le fait pas disparaître. Que faut-il faire ? --Zyephyrus 20 mai 2010 à 14:49 (UTC)
Je ne sais pas. Éviter les references a ca.source? Annoncé a oldwikisource:MediaWiki_talk:InterWikiTransclusion.js#References. Sur le livre en latin et français, je suis confus: le texte en latin ne devrait pas aller à la.source? utilisons formatage comme Satires (Perse)/VI, ou le bilingual interwiki-link " == ", ou les functions de InterWikiTransclusion.js (pour livres multilingues fonctionne trés bien)? ou tous les trois à la fois :) -Aleator 20 mai 2010 à 23:33 (UTC)
Riches, très riches en solutions, nous le sommes, c’est bien aussi mon avis  :) . Il me semble que nous n’avons plus qu’une seule chose à décider : quelles conventions de formatage allons-nous adopter pour qu’elles soient partout les mêmes et que tout soit en face de tout sans décalage quelle que soit la méthode adoptée ; il serait souhaitable que ce formatage commun soit aussi simple que possible à réaliser. (Et de plus, il y a aussi l’esthétique : les wikistylistes auront peut-être des idées ?). Donc que faisons-nous ? Pouvons-nous créer un même modèle qui s’intègre partout ? --Zyephyrus 21 mai 2010 à 06:53 (UTC)
J’ai corrigé le problème en sortant du noinclude la balise d’appel des ref (ce n’est pas ce qui est le plus propre, mais cela a le mérite d’être assez simple).
Effectivement, très riches en possibilités nous sommes. Certaines possibilités me semble cependant être de fausses bonnes idées. Mettre le texte original et traduit côté à côté me semble plutôt être une de ces fausses bonnes idées. En effet, on peut déjà juxtaposer deux versions avec l’outil match disponible dans la barre de gauche, donc juxtaposer en dur dans le code de la page fait doublon et peut même être nuisible : exemple (on a deux fois le texte latin et la largeur est tellement réduite que cela en devient presque illisible). Personnellement, cela me semble donc plus problématique que le fait que les deux textes de soit pas aligné… Ceci dit, je n’ai pas encore trouvé la solution parfaite. Je vais faire quelques tests.
Cdlt, VIGNERON * discut. 21 mai 2010 à 10:33 (UTC)
Je me suis mal fait comprendre. Ce que je voudrais développer est un formatage commun quelle que soit la solution retenue ensuite pour le côte-à-côte, par exemple qu’il soit entendu que le modèle titre, puis le nombre de lignes à passer avant le premier paragraphe, permettront d’obtenir ce premier paragraphe toujours à même hauteur par rapport au haut de la page, et de même pour les paragraphes suivants, de façon à éviter des décalages qui ont rendu la mise en parallèle inutilement difficile jusqu’à présent. La seule chose à faire serait de nous mettre d’accord sur ce formatage commun. Disons, pour employer une image, que c’est l’équivalent d’un rendez-vous : il est inutile que l’un des deux textes attende l’autre au 3e étage tandis que l’autre texte l’attend au rez-de-chaussée… --Zyephyrus 21 mai 2010 à 12:21 (UTC)
Oui, il y a ce point aussi (plutôt indépendamment du premier d’ailleurs).
Ce rendez-vous risque d’être assez difficile à organisez. Je vois deux possibilités :
  • on assimile petit à petit, par groupe de projet (par exemple fr et la pour commencer, ensuite en, ainsi de suite ; ordre au hasard).
  • on essaye de faire tout les projets en même temps (via old).
La première solution peut sembler plus facile mais je ne suis pas sur que ce soit une bonne idée sur le long terme.
De plus, même en se mettant d’accord sur une mise en forme commune (ce qui sera facile pour certains points, mais beaucoup plus dur pour d’autres), on va avoir toujours un problème selon les langues et malgré la mise en forme, certains textes sont plus long que d’autres (c’est flagrant quand on change de système d’écriture). Ceci dit, on peut essayer de faire au mieux.
Une autre possibilité est de couper les textes en chapitres et paragraphes, plus un texte est court moins le décalage se voit.
Pour le moment, je n’ai pas trop le temps mais c’est un projet dans lequel j’aimerais bien m’impliquer.
Cdlt, VIGNERON * discut. 21 mai 2010 à 16:33 (UTC)

Moteur de recherche par livre[modifier]

Que penseriez-vous de placer {{moteur}} en page d'accueil de chaque livre svp ? JackPotte 20 mai 2010 à 19:35 (UTC)

L’idée me semble très bonne.
Par contre, plutôt qu’en haut de chaque page, ne serait-il pas possible de l’intégrer automatiquement dans la barre de gauche ? (ce serait plus propre, non ? Par contre, il faut faire ça en fonction de Vector qui n’est pas encore finalisé donc sujet à modification). Cdlt, VIGNERON * discut. 21 mai 2010 à 10:10 (UTC)
Je pense comme Vigneron que l’idée est très bonne et qu’il est souhaitable d’avoir une image d’ensemble de Vector tel qu’il sera quand terminé, pour placer cette boîte de recherche au mieux, esthétiquement et fonctionnellement, par rapport au reste à ce moment là.
Pour ceux qui veulent tester, voici la boîte :
JackPotte, félicitations ! --Zyephyrus 21 mai 2010 à 14:05 (UTC)
Merci, tout le mérite en revient à Eloquence. Par ailleurs les anglophones ont apprécié également. JackPotte 21 mai 2010 à 16:11 (UTC)
En lien avec la discussion précédente, il serait bon que les deux projets adoptent le même outil de la même façon. On laisse les anglophones commencer et on copie ? Je propose donc de continuer la conversation technique là-bas. Cdlt, VIGNERON * discut. 21 mai 2010 à 16:53 (UTC)
J'ai aussi créé {{moteur-djvu}}, ce qui permet même de chercher dans certains ouvrages non corrigés comme le Gaffiot. JackPotte (d) 9 août 2010 à 20:59 (UTC)
Magnifique ! --Zyephyrus (d) 9 août 2010 à 23:38 (UTC)

Formatage des notes[modifier]

Nous cherchons depuis longtemps comment différencier les notes et le texte. J’ai mis en place un essai de formatage[1]. Après quelques jours pour nous y habituer, avis et propositions seront les bienvenus, n’hésitez pas. Les balises small que nous mettions après les balises ref ont presque toutes disparu ; si vous en voyez, merci de les enlever, elles ne sont plus utiles à présent.--Zyephyrus 21 mai 2010 à 21:33 (UTC)


  1. Voici la présentation obtenue.
Excellente idée ! Je ne suis pas sur que tout ce que tu voulais à fonctionner correctement (je peux me tromper mais je ne vois ni darkslategray ni bordure) mais si on pouvait se débarasser des codes inutiles comme les smalls avec et/ou dans les refs, ce serait génial. PS: du coup, on peut peut-être aussi retiré .references-small { font-size: 90%;} de MediaWiki:Common.css, il fait doublon, non ? Cdlt, VIGNERON * discut. 21 mai 2010 à 22:28 (UTC)
Merci Vigneron, j’ai corrigé le darkslategray, cela m’a permis d’apprendre qu’il fallait mettre simplement color pour colorer le texte.
Tu es sûr qu’on ne voit pas le liseré ? J’en avais mis un très discret et il me semble le voir, c’est une illusion ?
Que devient une classe dans les pages où elle est employée, si on la supprime ? Y a-t-il quelque chose à faire avant de la supprimer ? Merci de ton aide ! --Zyephyrus 22 mai 2010 à 08:59 (UTC)
Je vois tout maintenant, ce devait probablement être un problème de cache.
Supprimer une classe utilisée est plutôt une mauvaise, je suis pas sur du résultat (probablement juste la suppression du style) mais le problème que je vois c’est qu’on risque de l’oublier. Il faut donc retirer les utilisation avant (travail pour un bot).
Juste une remarque sur l’acessibilité : le rapport de contraste est-il suffisant ? (on préconise au moins 4.5:1) Cdlt, VIGNERON * discut. 22 mai 2010 à 09:34 (UTC)
J’essayais d’éviter un contraste voyant car les notes devraient être discrètes, et semblent être l’élément principal si elles paraissent encadrées ; je me demande aussi de combien devrait être le padding (distance du texte aux bords du cadre), n’est-il pas un peu trop large ? Par contre, je préfèrerais que les numéros des notes s’éloignent davantage du bord du cadre, faut-il employer Margin pour cela ? --Zyephyrus 23 mai 2010 à 09:26 (UTC)
Pour éloigner les notes du bord du cadre, il faut utiliser padding (padding-left ici). Par contre je ne comprends pas bien le besoin de changer la mise en forme des notes. Qu’y avait-il de mauvais dans la présentation actuelle ? Pour séparer les notes du texte, ne suffit-il pas de mettre un trait horizontal avec le modèle {{Ligne Ref}} par exemple ? Le défaut de mettre les notes sur fond de couleur est que c’est inesthétique si le reste de la page est également sur fond coloré. Par exemple pour Modèle:Bienvenue. Zaran (Discuter) 23 mai 2010 à 17:14 (UTC)
Pour les marges et la taille, c’est juste une question de gout donc peu m’importe. Par contre pour les couleurs, si le contraste est trop faible (inférieur à 4.5:1) le contenu devient inaccessible pour les malvoyants, et là ça pose un vrai problème. Le mieux serait donc probablement de laisser un fond blanc ou en tout cas très clair. Cdlt, VIGNERON * discut. 24 mai 2010 à 08:54 (UTC)

Téléverser un fichier source?[modifier]

Bonjour, je possède le PDF de «Trois Traitez de la philosophie naturelle», ainsi que des versions textes avec images, mais je ne saisis tout simplement pas comment commencer. Si je crée la page «Trois Traitez de la philosophie naturelle», je ne vois nullement comment téléverser le source PDF, puis copier/coller le texte page par page. J’ai regardé la page De_la_transformation_metallique, qui est aussi un livre contenant plusieurs textes, mais si j’édite la page, le contenu semble se contenter de référencer d’autre pages que je ne sais pas comment créer. En clair, je ne comprends pas comment fonctionne Wikisource. ^^ Étoile 23 mai 2010 à 07:10 (UTC)

Bienvenue sur wikisource. Le premier abord est toujours un peu déroutant. La page d’aide que tu cherches est la suivante. J’avoue que l’on pourrez faire plus clair… Enfin le premier pas est de téléverser ton fichier sur commons (c’est mieux si il posséde une couche texte, c’est à dire : peut-on faire une recherche d’un mot dans ce fichier ?). Le second est de créer une page dans l’espace livre ici sur wikisource (aide). Dans l’exemple que tu citais, pour voir la page livre, clique sur le second onglet appelé source. Il est important de bien faire attention aux noms qui doivent être identiques pour le livre et le fichier pdf sur commons. Par exemple, le nom du fichier commons est « File:De la transformation metallique.djvu » et celui sur l’espace livre est « Livre:De la transformation metallique.djvu ». Il faut aussi respecter si possible la convention de nommage. andre 23 mai 2010 à 09:27 (UTC)
Même si cela ne répond pas à la question, j’avais souligné le côté déroutant de voir un contenu transclu sans pouvoir le modifier. J’avais proposé l’ajout d’un bandeau au dessus de la zone d’édition pour les pages dont le contenu est obtenu par transclusion. La discussion était ici : Wikisource:Scriptorium/Mars_2010#Idées en vrac. Zaran (Discuter) 23 mai 2010 à 17:18 (UTC)

Légende pour sources[modifier]

En regardant le dictionnaire Gaffiot, je pense que nous avons besoin de proposer une légende sur une page en évidence. Exemple :

  1. f. féminin
  2. n. neutre
  3. indécl. indéclinable... JackPotte 23 mai 2010 à 16:17 (UTC)
ce serait utile mais non ;). Le problème vient du fichier source qui n’est pas complet. Je ne sais pas pourquoi la page explicative des abréviations du volume original a été éliminée (en fait manquent les pages de 1703 à 1720). Il faudrait recharger le fichier djvu correct avec ces parties manquantes. aie aie aie. andre 23 mai 2010 à 18:04 (UTC)
Je ne vois pas trop où se situe le problème, tant qu'on a les scans desdites pages. Une bonne âme pour numériser les pages manquantes ? (Mon Gaffiot est à plusieurs milliers de kilomètres d'où je me trouve en ce moment, donc je vais avoir du mal :P) Par ailleurs, cette histoire d'abréviations est typiquement le genre d'endroits où l'utilisation de modèles serait appréciable. Pmx (d) 25 mai 2010 à 13:17 (UTC)

Fichiers de test BnF[modifier]

Bon(jour|soir),

Voilà, les premiers livres BnF sont sortis, issus du process standard que suivront les 1400 suivants :

  • Livre:Asselineau - Charles Baudelaire - sa vie et son œuvre.djvu (ref: 0061826 - taux ocr: 86.8)
  • Livre:Revue de métaphysique et de morale, supplément 4, 1907.djvu (ref: 0011081 - taux ocr: 93.5)
  • Livre:Boutmy - Projet d’une faculté libre des sciences politiques.djvu (ref: 0062535 - taux ocr: 85.6)
  • Livre:Paris, Gaston - Le roman du comte de Toulouse.djvu (ref: 0063257 - taux ocr:85.6)

Qu’est-ce qui va ? qu’est-ce qui va pas ?

Remarque : si vous en voulez un ou deux autres en particulier, je peux vous les lancer, mais il faut qu’il ait l’OCR (colonne X cochée) et qu’il fasse moins de ~ 200 pages (sinon Commons n’en voudra pas car la limite est à 100 Mio). Cette limite de 100 Mio sera ignorée lors de l’import en masse car ça ne passera pas par l’interface web. Pour les 360 livres qui n’ont pas l’OCR, la BnF est en train d’examiner la situation, si vous avez des remarques aussi à ce sujet (importer ces livres sans OCR-BnF, ne pas importer…). Seb35 [^_^] 23 mai 2010 à 22:24 (UTC)

Remarque 2 : nous avons mis les mots césurés en entier dans la couche texte, ça rend les coordonnées (taille) du mot légèrement fausses dans la couche texte, mais ça vous simpliera la vie. ~ Seb35 [^_^] 24 mai 2010 à 09:30 (UTC)

Je suppose qu'il faudra ajouter les informations manquantes à la main ? C'est toujours mieux si les fichiers sans OCR sont disponibles sur Commons, on pourra faire l'OCR nous-mêmes si la BnF ne peut pas fournir l'OCR. La liste des auteurs n'est pas encore complètement vérifiée. Yann 24 mai 2010 à 04:51 (UTC)
J’en prends dix, les dix derniers liens rouges en commençant par la fin de l’alphabet : jusqu’à Tamizey de Laroque inclus. --Zyephyrus 24 mai 2010 à 06:03 (UTC)
Nous n'avons pas vraiment d'autres infos, à part peut-être "volume" qui a été ajouté dans les titres djvu, il faudrait extraire cette info de cette colonne (regex), mais il y a parfois marqué ", tome 5" parfois ", 5" et parfois " (5)" selon les personnes qui ont traités les livres. ~ Seb35 [^_^] 24 mai 2010 à 09:23 (UTC)

C’est bien ce que je redoutais. La compilation sur l’espace livre n’est pas facile. Ces quatre exemples le démontrent. Les titres ne sont pas les bons dans les deux derniers cas. Par exemple, dans le troisième exemple, Boutmy n’est pas le seul auteur (Mea culpa - Je crois que c’est moi qui est validé celui-ci). Mais que vient faire Tamizey de Larroque dans cette histoire ? Il y a un problème de confusion, l’éditeur étant pris pour l’auteur dans le quatrième exemple. Nous devons faire un effort pour la vérification des champs.Je pense qu’il va falloir passer beaucoup plus de temps sur cette validation des tables fournies par seb35 avec une vérification systématique sur l’original et peut-être un système de double validation.
Le bot pourrait prendre aussi en charge la création du modèle Infoédit en page de discussion. Il serait aussi intéressant de mettre un lien interne sur le nom de l’auteur. Voici mes premières impressions. Il faut maintenant que je regarde plus en détail. andre 24 mai 2010 à 08:28 (UTC)
PS:Ne modifier pas ou ne corriger pas les pages ou le livre pour le moment sinon il faut retourner dans l’historique pour voir exactement le comportement du bot. andre 24 mai 2010 à 08:58 (UTC)

Pour l’OCR, voici ce que donne avant correction la Revue de métaphysique et de morale (le même texte après passage du script d’Acer et Phe le même texte avec amélioration de la taille des tirets ; le texte d’Asselineau ; un tableau du Projet d’une faculté libre ; le Roman du Comte de Toulouse. --Zyephyrus 24 mai 2010 à 08:33 (UTC)
J'ai bien choisi mes exemples alors :-) Pour Boutmy, effectivement on peut mettre deux auteurs (est-ce réellement important, ça rallonge le titre ;-). Pour Tamizey de Larroque, mea culpa, j'ai rentré les métadonnées de cette pré-série à la main et me suis trompé de ligne (0065233 au lieu de 0062535), ça ne devrait pas se produire dans le process automatique. Pour Paris, il y a effectivement marqué "Paris, Gaston (éd)" dans le champ auteur donné par la BnF, mais il semble bien que ce soit l'auteur (Par Gaston Paris en 1re page, nom en haut de chaque page), je pense que ça a été rempli "Paris, Gaston (éd)" par la BnF car Gaston Paris a également été éditeur d'autres livres dans la liste, d'où une confusion à mon avis. ~ Seb35 [^_^] 24 mai 2010 à 09:23 (UTC)
Pour le livre sur Baudelaire, j’ai pu utiliser les outils de ThomasV Match et Split car le texte en mode texte était disponible sur la Toile : voir lien dans l’infoédit en page de discussion. --Zyephyrus 24 mai 2010 à 10:37 (UTC)
@André : oups, j’ai lu ta recommandation trop tard ! j’ai pratiqué sur ces textes des expériences en cascade. N’hésitez pas à remettre tout à zéro si c’est utile. --Zyephyrus 24 mai 2010 à 12:25 (UTC)

Bonjour,

J'ai créé hier soir une nouvelle colonne dans la liste des textes : il s'agit des bons noms des auteurs, tels que nommés dans l’espace Auteur de WS et dans l’espace Creator de Commons. La nomenclature est Auteur1;Auteur2;etc (avec des points virgules ";" entre les auteurs). Je précise bien car nous nous basons sur ce découpage, pour désormais générer automatiquement les liens Auteur dans WS et ceux Creator dans Commons, ainsi que la catégorie Commons.

Donc, si vous corrigez les auteurs, pourriez-vous aussi penser à mettre à jour la liste des textes ?

Question bête : s’il y a plusieurs auteurs, comment doivent-ils être indiqués dans le champ "Auteur" de l’espace Livre ? "Alice, Bob, Charles", "Alice, Bob et Charles", en liste à puces… ?

@Andre : sauf erreur de ma part, le modèle {{Infoédit}} se place en PDD de l’espace principal ? Il n’était pas prévu que nous touchions à cet espace, d'autant que nous ne pouvons pas garantir la correction des titres des bouquins, et j’avais cru comprendre que ce n’était pas gravissime pour le nom du fichier DjVu, mais pas acceptable dans l’espace principal. J'ai bon ?

Jean-Fred (d) 24 mai 2010 à 17:07 (UTC)

Bon je dois avoir la comprenette difficile, donc pardonnez moi si je radote. Quelqu’un peut il m’expliquer exactement quels sont les champs qui sont extraits directement d’infos bnf et ceux qui passent pas une page wiki que nous pouvons corriger. Je dis cela parce que le cas de "Paris, Gaston (éd)" me met en difficulté. Sur le site bnf, la fiche semble correcte. Elle ne l’ai pas sur la page wiki mais cela n’a pas d’importance ou si ? Sur la page wiki ne compte que le titre du fichier djvu et aussi maintenant la colonne Bons Auteurs (cela aurait été sympa de l’initialiser à partir de la colonne auteur « nom, prénom » en « prénom nom »). Est-ce correct ?
Autre détails : Année, cela prend un accent. Sinon pourquoi l’éditeur n’est pas mis dans le livre d’Assileneau ou celui de Boutmy (pareil pour Paris). Il est vrai qu’il y a trois lignes pour l’éditeur de la revue de métaphysique. Je veux pas chipoter mais le titre « Livre:Paris, Gaston - Le roman du comte de Toulouse.djvu » devrait etre « Livre:Paris - Le roman du comte de Toulouse.djvu ». Donc il faut un minimum que l’on se mette d’accord sur les convention de nommage.
Pour {{Infoédit}} c’était pour l’initialiser correctement au départ quitte à le déplacer ensuite dans la page de discussion de l’espace principal. Cela permet aussi de mettre vos noms dedans pour savoir qui sont les responsables de tout ceci et que l’on sache qui taper par la suite (je plaisante, c’est pour le cc). andre 24 mai 2010 à 18:06 (UTC)
Je répondrai plus en détail plus tard mais j’aimerais expliquer tout de suite l’histoire de Gaston Paris. C’est le fils de Paulin Paris qui a aussi édité des livres ; de plus, il existe aussi des éditions qu’on appelle éditions de Paris et qui se réfèrent à la ville de ce nom. Pour toutes ces raisons, on parle d’édition Gaston Paris et Paulin Paris. Mais d’autre part, il serait plus pratique que Paris soit en premier dans le titre du djvu pour que la liste se classe automatiquement par ordre alphabétique des auteurs. Des idées pour résoudre le problème ? --Zyephyrus (d) 24 mai 2010 à 23:43 (UTC)
@andre : non, le but de cette nouvelle colonne justement d’être remplie à la main, afin d’être sûrs à 100% qu'il correspondent aux bons noms. Partant de là, une initialisation automatique ne permet pas de savoir lesquels sont bons et lesquels ne le sont pas.
Pour les infos : on se base sur le tableau (lui-même basé sur des données BNF au départ) pour tout ce qui est titrage des DjVu, titrage des bouquins, et noms des auteurs. On se base sur les données contenues dans les OCR pour la date d'édition et le nombre de pages. Les fiches BnF n’interviennent pas dans le processus de génération.
« Autre détails : Année, cela prend un accent. » -- Je ne comprends pas le sens de cette remarque.
Jean-Fred (d) 27 mai 2010 à 22:03 (UTC)
« Autre détails : Année, cela prend un accent. » andre 28 mai 2010 à 07:52 (UTC)
Merci, je ne voyais pas où on avait pu l'oublier. (Pour la petite histoire, on l’avait enlevé pour des problèmes d’encodage et oublié de le remettre). Jean-Fred (d) 28 mai 2010 à 08:18 (UTC)

Proposition : le jeu des mille pages.[modifier]

Héritage du passé, nous avons toujours une montagne de textes qui ne sont pas en mode page. Afin de motiver ceulx et celles qui aimeraient participer à leur conversion en mode page, je propose d’organiser un jeu. Le principe est le suivant : Je m’engage à convertir 100 pages de l’espace principal vers l’espace Page, et ceci en l’espace d’une semaine, à condition que neuf autres personnes en fassent autant. Si les conditions sont remplies, les dix participants s’engagent donc à convertir 1000 pages en une semaine. (ps : je n’ai rien inventé, ce type de jeu est régulièrement organisé sur de.wikisource, afin de valider les pages.) ThomasV 24 mai 2010 à 11:58 (UTC)

Bonne idée, je suis a priori partant (une semaine c’est un peu court, mais finalement cela motive).
Par contre, sur la forme, on fait comment ? Avant tout, comment on trouve un livre qui n’est pas en mode page (il y a une catégorie/liste ?)
Cdlt, VIGNERON * discut. 24 mai 2010 à 12:16 (UTC)
On a le droit de reconvertir des textes qui sont déjà en mode page, en textes, et puis de les reconvertir ensuite en sens inverse, pour pouvoir les compter deux fois ? --Zyephyrus 24 mai 2010 à 12:19 (UTC)
@Vigneron : il me semble que le plus rapide est de passer par les pages auteurs. --Zyephyrus 24 mai 2010 à 12:28 (UTC)
Il va de soi que ce que propose Zephyrus est une infâme tricherie.
Chaque participant est libre de convertir les textes qui lui conviennent; il en dresse la liste au fur et à mesure; (si on utilise exclusivement les commandes match&split, on peut aussi demander à mon robot de tenir à jour la liste). Pour trouver des textes prêts à être convertis, le plus simple est d’écumer Catégorie:Livres à découper, mais ce n’est pas obligatoire, on peut aussi ajouter des djvu qui n’y sont pas encore. Le plus facile est de s’attaquer à un recueil de poèmes, ou à un livre dont les chapitres sont nombreux et courts.
Si le délai d’une semaine est trop court on peut en changer; attendons de voir si ça pose problème.
@vigneron : j’ai mis ton nom dans la liste des participants çi-dessus.
ThomasV 24 mai 2010 à 12:50 (UTC)
Je ne parlais pas très sérieusement :) --Zyephyrus 24 mai 2010 à 12:58 (UTC)
Ok pour l’inscription. Je pense prendre Livre:Dottin - La religion des Celtes.djvu (que j’avais commencé sans le finir, mea culpa) et Livre:Virgile - Georgiques Delille 1819.djvu. Cela convient ?
Je propose de faire la première édition sur une semaine. Ce temps court présente des avantages et des inconvénients. On pourra faire un bilan ensuite.
Dernière question : on commence quand ? (je suis très pris cette semaine et surtout ce week-end, lundi prochain ça irait ? ça laisse le temps à d’autres participants de venir).
@Zyephyrus : honte à toi, pour la peine tu feras 200 pages Clin d'œil. Cdlt, VIGNERON * discut. 24 mai 2010 à 13:04 (UTC)
Le jeu commence dès que 10 personnes ont accepté de participer. ça peut prendre un certain temps…
Mais les deux livres que tu as trouvés ne font pas 100 pages dans l’espace principal : le premier ne correspond à aucune page à convertir, et le 2e ne fait que 4 pages; peut-être que tu avais compris qu’il fallait les corriger ? je parlais uniquement de transférer le texte vers l’espace page, pas de sa correction. Est-ce que ce n’était pas clair ?
ThomasV 24 mai 2010 à 13:08 (UTC)
Ok, c’est le mieux (et ça permettra de passer la semaine normalement).
Euh, non, ce n’était pas complètement clair (j’avais compris qu’il ne s’agissait que de conversion et non de correction mais je pensais 100 pages dans l’espace Page). Du coup, je comprends mieux le coup de choisir des recueils/poèmes. Mais par contre, une semaine ça va faire super court, non ? Les germanophones réussissent ?
Euh, pour le premier, il y a bien une page à convertir quand même. Donc il me reste 95 pages à trouver Clin d'œil Cdlt, VIGNERON * discut. 24 mai 2010 à 13:32 (UTC)
Comment ça le jeu commence quand 10 candidats ont accepté ! C’est franchement pas juste. Je viens juste de me faire 130 pages rapidos et ça compte pour du beurre. Je suis franchement dégoûté. Bon heureusement, grâce à Zoé, j’ai une réserve infinie de texte à tronçonner. Je me mets dans la liste. andre 24 mai 2010 à 13:38 (UTC)
bon, alors je le répète encore une fois : il s’agit de convertir 100 textes préexistant dans l’espace principal, pas de générer 100 pages dans l’espace page. sinon ça serait trop facile, il suffirait de faire un split d’un texte qui génère 100 pages, et ça ne prend pas une semaine. ThomasV 24 mai 2010 à 13:41 (UTC)
Oulala, alors je retire mes billes. Cela ferait en terme de la RDDM entre deux et trois tomes. Impossible à faire en une semaine pour moi. Depuis que je m’occupe de transformer la RDDM, j’ai une moyenne d’environ 230 pages par semaine. Et d’autre part je suis pas chaud pour jouer avec les Haiku. andre 24 mai 2010 à 13:52 (UTC)
et si on dit 15 jours au lieu d’une semaine ? ThomasV 24 mai 2010 à 14:00 (UTC)

Je me suis inscrit dans la liste plus haut. Cependant je trouve ce jeu assez étrange, car si l’on choisi un recueil de poèmes, avec l’outil match & split, c’est très rapide à faire, surtout que ce n’est pas demandé de corriger ces pages en question. Je pense qu’il faudrait au moins ajouter dans les règles que les pages transférées soit formatées conformément à l’édition scannée non ? Je vous met la liste des textes que je pense convertir dès que j’ai trouvé (il faudrait faire un tableau récapitulatif). Question : j’avais commencé les Dédicaces un jour, je suppose que ce texte ne peut pas être retenu, car il s’agit de création de textes, pas de transfert ? Zaran (Discuter) 24 mai 2010 à 16:34 (UTC)

en effet, les Dédicaces ne feraient pas partie du jeu. Il s’agit d’améliorer la qualité des textes déjà présents, pas de croissance. ThomasV (d) 24 mai 2010 à 17:08 (UTC)
Que faire ? les uns trouvent que ça va être trop difficile en une semaine, les autres que c’est trop facile et qu’il faudrait demander en plus que les pages soient corrigées… Le but de ma proposition est de faire diminuer la masse de textes sans mode page qui se trouve sur Wikisource; leur formatage est moins urgent, et c’est une tâche que beaucoup d’utilisateurs accomplissent spontanément. Je propose donc de s’en tenir aux règles de départ. ThomasV (d) 24 mai 2010 à 17:01 (UTC)
Tu as raison, mieux vaut garder les règles comme cela. Je prépare un tableau pour récapituler les textes et l'avancée de chacun. Zaran (Discuter) 24 mai 2010 à 18:18 (UTC)
Je suis d’accord. Surtout pour la première édition, testons ce format, il sera toujours temps de modifier le format ensuite. Cdlt, VIGNERON * discut. 25 mai 2010 à 13:36 (UTC)
Je participe. Une bonne occasion de relancer mes contributions après une pause (création d'un site internet...). Je ne pourrais peut être pas tenir le délais de la semaine à cause d'un emploi du temps très chargé. Tpt (d) 26 mai 2010 à 04:50 (UTC)


Participations au jeu des mille pages
Le jeu commence dès que le nombre de participants atteint 10
Utilisateur Textes Pages Faits
ThomasV liste sur [5] 213 213
VIGNERON Leconte de Lisle 3
José-Maria de Heredia, Poésies 9 0
Zyephyrus Victor Hugo, Les Contemplations, livres III, IV, V, VI 99 99
Victor Hugo, À celle qui est restée en France 1 1
Zaran Paul Verlaine, Jadis et naguère 43 43
Joris-Karl Huysmans, En route 20 11
Joris-Karl Huysmans, Là-bas 22 22
Victor Hugo, Les Contemplations, livres I,II 56 56
Somerset (d) Edgar Poe 50
La Case de l’oncle Tom 25
Histoire de Miss Clarisse Harlove 375
total 102
Tpt (d) François Maynard, Les Œuvres 107 0
Kip Le Devisement du monde (français moderne) + avant-propos 187 187
Livre:Hugo - Les Misérables Tome II (1890).djvu 5 5
Acélan Diderot, Les Bijoux indiscrets 54 54
Diderot, L’Oiseau blanc, conte bleu 1 1
Diderot, Sur le Génie 1 1
Diderot, Des idées accessoires 1 1
Diderot, Entretien d’un père avec ses enfants 1 1
Diderot, Principes philosophiques sur la matière et le mouvement 1 1
Diderot, Discours d’un Philosophe à un Roi 1 1
Diderot, Sur les femmes 1 1
Amour (Verlaine) 40 40 (à corriger)
Voyage (Rubruquis) 49 49
total 892

Note : les textes de Alexandre Dumas sont également de bons candidats, avec souvent plus de 100 chapitres. --Kip (d) 30 mai 2010 à 14:47 (UTC)

On dirait que j’ai été un peu trop optimiste: nous avons seulement huit participants, soit 800 pages… Je veux bien faire 100 pages de plus, comme ça nous sommes à 900 pages. Il nous manque donc encore un participant, soit 100 pages. ThomasV (d) 3 juin 2010 à 13:31 (UTC)
Si chacun de nous s’engageait pour 120 pages, cela résoudrait-il le problème ? Je prends 120 si quatre autres participants en prennent autant. --Zyephyrus (d) 3 juin 2010 à 13:41 (UTC)
Là, j'ai 110 pages, si j'ai le temps, je prends un morceau des Voyages en Asie. --Acélan (d) 3 juin 2010 à 14:44 (UTC)
Maintenant que nous sommes 9 participants, il suffit de faire 111 pages chacun. Je m’étais inscrit pour 112 pages (car je ne voulais pas m’arrêter au milieu d’une œuvre). Vu que la plupart des participants semblent avoir visés un peu plus que 100 pages, je pense qu’on devrait atteindre les milles pages non ?
Ou sinon il faudrait aller « démarcher » quelques gros contributeurs directement sur leur page de discussion, au hasard : Camelinat Maltaper Yland ou Walpole :) Zaran (Discuter) 3 juin 2010 à 15:25 (UTC)
@Somerset : es-tu sûr qu’il reste 50 textes de Poe à mettre en mode page ? (je ne vois que les Nouvelles Histoires extraordinaires et les Derniers contes. Zaran (Discuter) 3 juin 2010 à 15:25 (UTC)
Oui, oui, car j'ai déjà commencé la mise en pages. J'ai donnée une liste dépassant 100 pages car je savais que j'en ferai déjà une partie avant le début du jeu ; dans ce qui reste je piocherai 100 pages. Somerset (d) 4 juin 2010 à 09:29 (UTC)
Pour les participants qui aiment un compte « rond » : Zaran parle de 111 pages chacun, donc 11 pages chacun à ajouter : il reste le deuxième livre des Contemplations qui n’était pas pris : 44 pages peuvent se partager entre quatre contributeurs et donner un total exact --Zyephyrus (d) 3 juin 2010 à 19:53 (UTC)
Il me semble évident (pour moi en tout cas) que si je commence un recueil, je ne vais pas m’arrêter à 100 pages piles mais plutôt finir ledit recueil. 120 ne me posent donc aucun problème. On commence quand ? Vendredi minuit ce serait bon ? Cdlt, VIGNERON * discut. 3 juin 2010 à 21:40 (UTC)
Pour moi c’est d’accord pour vendredi minuit (c’est à dire ce soir). Le problème de nombre pages insuffisant ne m’inquiète pas trop, au pire on en fera un peu plus, quand on aime on ne compte pas :) Zaran (Discuter) 4 juin 2010 à 07:31 (UTC)
Il faudrait quand même avoir un engagement de chaque participant sur le nombre de pages qu’il va faire, et que le total des engagements atteigne 1000. Il me semble que ce n’est pas encore le cas, même en comptant 120 pour vigneron et zeph, 111 pour zaran. ThomasV (d) 4 juin 2010 à 08:06 (UTC)
Toutes mes excuses, j’avais mal compté, nous ne sommes que 8 participants alors que j’avais compté 9. Cela fait une moyenne de 125 pages par participant. J’étais à 112 pages, j’ajoute le livre deux des contemplations, cela fait donc : 112+28 = 140 pages. Zaran (Discuter) 4 juin 2010 à 09:23 (UTC)
Je veux bien m'engager à prendre tout le Deux Voyages en Asie au XIIIème siècle pour moi tout seul. ça fait plus de 200 pages, donc le compte doit être bon (il faut aussi que j'importe le djvu depuis archive.org). Ceci dit, si Acélan m'en prend un bout, le compte doit être quand même toujours bon. --Kip (d) 4 juin 2010 à 09:27 (UTC)
Ok dans ce cas le compte est bon. Je récapitule :
ThomasV : 200
zeph, vigneron : 120
Zaran : 140
Kipmaster : 120
Somerset, Tpt, Acélan : 100
total 1000
@Kipmaster j’ai compté 120 pages pour toi de sorte à avoir un total de 1000, mais tu es libre de t’engager à faire plus :-)
Pour ceux qui choisissent d’utiliser les commandes "match et split", j’ai mis en place un décompte automatique du nombre de pages effectuées :
voir ici : http://toolserver.org/~thomasv/1000pages.html (page remise à jour toutes les 5 minutes)
Pour ceux qui préfèrent faire le travail "à la main", il faudra compter leur pages manuellement.
ThomasV (d) 4 juin 2010 à 09:49 (UTC)
Il doit être possible d’obtenir que header=1 se mette automatiquement dans les balises, non ? Que faut-il faire pour cela ? Zyephyrus (d) 4 juin 2010 à 11:21 (UTC)
Dans le même ordre d’idées, est-il possible d’avoir d’autres options que header=1, par exemple header=2 pour utiliser PoemNav au lieu de ChapitreNav. Zaran (Discuter) 4 juin 2010 à 11:23 (UTC)
@zeph : le robot n’ajoute pas header=1 car la commande split doit laisser l’apparence de la page inchangée ; il se peut qu’il y ait déjà une boîte titre, et si on en rajoute une il faudrait supprimer la première.
@zaran : oui c’était l’idée de départ, et c’est toujours possible de configurer le wiki en ce sens, mais j’ai développé une nouvelle méthode entre-temps, qui utilise le type de livre. Voir sur Utilisateur:ThomasV/headers. tout ceci n’est pas définitif, je compte m’y remettre cet été. ThomasV (d) 4 juin 2010 à 11:52 (UTC)
Pour l’instant, je n’utilise pas split&merge (pour des chapitres d’une page, je ne suis pas sûr que je gagnerais du temps). Je tiens un compte à jour sur la page Utilisateur:Kipmaster/jeu des milles pages. --Kip (d) 5 juin 2010 à 14:12 (UTC)
ok j’ai mis un lien vers cette page sur la page du robot ThomasV (d) 5 juin 2010 à 14:35 (UTC)
@Kip : note que le robot sait gérer les pages contenant deux chapitres qui se chevauchent. ThomasV (d) 6 juin 2010 à 12:33 (UTC)
Le compteur de Thomas atteint 500 pages : faut-il compter cela comme un jalon ? Si oui \o/ ; mais c’est trop compliqué de suivre tous les décomptes à la fois pour savoir à quel moment le décompte total sera (ou a été) un chiffre rond… alors bravo à tout hasard pour le total ! --Zyephyrus (d) 10 juin 2010 à 21:37 (UTC)
Voici un peu plus d’une semaine que le jeu a commencé. Comme certains m’ont demandé un délai supplémentaire, je propose d’arrêter les compteurs ce soir à minuit. Ceux qui n’auront pas rempli leur contrat devront m’apporter un mot de leurs parents.
Même si l’objectif de 1000 pages n’est pas atteint ce soir, nous aurons fait un score honorable (plus de 800 pages), et plusieurs participants ont fait largement plus que ce qu’ils avaient annoncé. Merci aussi à ceux qui ne se sont pas inscrits mais participent en permanence à cette tâche (Andre, Maltaper).
ThomasV (d) 11 juin 2010 à 13:05 (UTC)
Thomas, vu qu’on a commencé vendredi minuit, ça ne fait pas un peu plus d'une semaine, mais un peu moins. Donc, si on arrête les compteurs ce soir à minuit, ça fera pile une semaine. --Acélan (d) 11 juin 2010 à 14:50 (UTC)
il me semble qu’on a commencé vers 10h UTC, soit midi heure française ? ThomasV (d) 11 juin 2010 à 15:01 (UTC)
finalement on a fait 892 pages. merci à tout le monde :-) ThomasV (d) 12 juin 2010 à 08:46 (UTC)

Éditeur offline[modifier]

Bonjour, ô patients scribes. À force de pester contre la lourdeur de l'interface web de Wikisource, qui n'a pas été conçue pour manipuler des livres en mode page, je me suis dit qu'il serait séant de développer un client lourd-mais-pas-tant-que-ça pour Wikisource. Je verrais bien un joli plugin pour votre éditeur de texte préféré à coups de scripts pywikipedia.

Avantages :

  • Persistence : pas besoin de recharger les pages toutes les trentes secondes quand on se balade dans le livre, en particulier l'image de la page, qu'on peut conserver sous la forme du djvu pur : du temps gagné !
  • Efficacité : un éditeur un peu plus décent que celui de mediawiki.
  • Uniformité : une vision d'ensemble d'un livre, où l'on peut faire de la recherche dans le source et des modifications globales.

Inconvénients:

  • Faut le coder... On n'a rien sans rien.
  • Choix d'un éditeur en particulier ?
  • Risque d'être perçu comme l'usurpation des prérogatives des bots.

Avant de me lancer dans l'aventure, je viens vous demander ce que vous en pensez.

  • Quid de l'état de l'art ? J'ai repéré un plugin wikipédia pour Eclipse, mais outre le fait d'être une usine à gaz, ça ne gère pas les spécificités de Wikisource.
  • Est-ce que les gens (c'est-à-dire toi, lecteur !) en voient l'intérêt ? Pestez-vous vous aussi contre l'interface web ?
  • Y a-t-il des gens à qui le code ne fait pas peur prêt à contribuer ? On pourrait écrire une interface pour Wikisource en python et l'inclure dans pywikipedia pour ne pas réinventer la roue...

Avis, commentaires, insultes, autres ? Pmx (d) 27 mai 2010 à 06:57 (UTC)

Commentaire : voilà qui paraît intéressant.
Avis : Créer une feuille de projet où les wikisourciens pourraient ajouter des suggestions ?
Insultes : champ actuellement vide…
Autres : Question : quel nom peut-on donner à l’outil que tu proposes ? Merci, Pmx, de cette offre ! --Zyephyrus (d) 27 mai 2010 à 07:31 (UTC)


je n’ai pas le temps de m’en occuper, mais si je devais programmer un éditeur offline, alors j’essaierais de le faire dans une extension pour Firefox, qui chargerait l’image depuis un djvu plutôt que de la chercher sur le web. Si c’est bien écrit ça peut être relativement transparent pour l’utilisateur.
ThomasV (d) 27 mai 2010 à 07:45 (UTC)
Le problème de lourdeur persiste, ne serait-ce parce qu'il faut recharger au moins le texte, et la latence de la connexion, c'est pénible. Les pseudo-applications légères dans le nuage ont une certaine tendance à me sortir par les trous de nez. Et si on veut bosser hors-ligne sur un livre ?
Dans un premier temps, quelque chose qui peut être fait en très peu de temps grâce à pywikipedia, c'est de définir un « instantané » d'un bouquin dans la lignée des systèmes de versionnement, à savoir un paquet qui contient:
  1. Le djvu en lui-même
  2. Une représentation de chaque page: texte + métadonnées associées (entre autres ID de la dernière modification)
  3. Un diff des modifications en cours pour chaque page
Avec ça, il suffit d'utiliser le script pour télécharger un tel paquet, et on a déjà tous les outils pour appliquer les modifications (diff + pywikipedia doivent faire un malheur). Reste à coder un greffon pour un éditeur de texte donné pour modifier ledit paquet. Pmx (d) 27 mai 2010 à 07:54 (UTC)

Bourses pour Wikimania[modifier]

Bonjoir,

Wikimania http://wikimania2010.wikimedia.org/wiki/Main_Page est la conférence annuelle dédiée aux projets Wikimedia. Elle a lieu cette année à Gdańsk (Pologne) du 9 au 11 juillet. La conférence permet à des contributeurs du monde entier d'échanger sur leurs pratiques wikimédiennes, de suivre des conférences sur les projets (projets Wikimedia, mais aussi d'autres projets œuvrant au libre partage de la connaissance), la recherche effectuée autour des projets, d'entendre parler des nouveautés techniques, des pratiques de gestion communautaire, ou tout simplement de se rencontrer. Plus d'infos ici http://meta.wikimedia.org/wiki/Wikimania_2010/Bids/Gda%C5%84sk .

La participation de contributeurs (aux projets Wikimedia ou à tout autre projet visant à faciliter le libre partage de la connaissance) à Wikimania enrichit la communauté des contributeurs et améliore les sites Wikimedia ainsi que les autres sites œuvrant au libre partage de la connaissance, à la fois dans leur gouvernance, dans leurs contenus et dans leur confort de navigation.

Wikimédia France http://www.wikimedia.fr (association dont le but est de soutenir, en France, la diffusion libre de la connaissance et notamment les projets Wikimedia) a décidé d'attribuer des bourses pour aider les personnes à participer à la conférence Wikimania. Deux types de bourses (bourses « simples » et bourses « renforcées ») sont proposées : 250 ou 500 €. Le type de bourse est déterminé selon les motivations du candidat et les conditions de ressources.

Mode de candidature : Les candidatures pour obtenir cette bourse doivent être envoyées à l'adresse wikimania@wikimedia.fr. Les demandes seront évaluées par un jury de 6 personnes. Les candidats doivent expliquer leurs motivations pour participer à Wikimania (une ébauche de programme est disponible ici : http://lists.wikimedia.org/pipermail/wikimania-l/2010-April/001768.html ), quel « track » ils comptent suivre, comment ils comptent mettre à profit les choses apprises pendant leur sejour, etc. Le candidat indiquera aussi si, au vu de ses ressources financières, il demande une bourse simple ou renforcée. Les candidats doivent parler anglais car les conférences et les (très intéressantes) discussions de couloir sont en anglais. Le mail sera donc en anglais.

Dates importantes : Le mail de candidature parviendra au jury avant le 2 juin 23h59. Les résultats seront communiqués avant le 15 juin. La conférence a lieu du 9 au 11 juillet.

Les récipiendaires des bourses Wikimédia France s'engagent à faire un résumé des conférences qu'ils ont suivi. Les récipiendaires s'engagent formellement à assister à la conférence. Ils seront remboursés des frais engagés (à hauteur de leur bourse) sur présentation des justificatifs. L'association ne s'occupe pas de prendre les billets, de réserver l'hôtel ou de payer la nourriture. Julien Fayolle (d) 27 mai 2010 à 11:56 (UTC)

PS : N'hésitez pas à candidater et à faire connaître cette annonce autour de vous.

Ajouter une image[modifier]

Bonjour,

J'ai besoin d'insérer une image ; l'aide indique quelle est la syntaxe à utiliser, mais rien d'autre. Comment transformer ma page en image ? où la déposer ? Merci d'avance, --Acélan (d) 28 mai 2010 à 07:10 (UTC)

Comme ceci. Tu peux modifier la taille (mise en 400 px). --Zyephyrus (d) 28 mai 2010 à 07:50 (UTC)
Merci ! --Acélan (d) 28 mai 2010 à 07:59 (UTC)

Code noire (sic)[modifier]

Une page de Wikisource se nomme Code noire/1685/orthographe modernisée. Pourriez-vous modifier en Code noir/1685/orthographe modernisée. Merci --Ambre Troizat (d) 29 mai 2010 à 01:21 (UTC)

Fait Yes check.svg. Merci de l'avoir signalé. Yann (d) 29 mai 2010 à 05:45 (UTC)
Merci.--Ambre Troizat (d) 27 juin 2010 à 21:02 (UTC)

Problème de prev et de next[modifier]

Bonjour,
En création de pages, jusqu'à présent, je n'avais que rarement à me préoccuper d'indiquer des "prev", next" et "current" ; sans crier gare, et alors que j'utilise exactement la même syntaxe, il faut maintenant que je les ajoute à chaque fois pour avoir les liens de navigation d'une lettre à l’autre ; lors du dernier enregistrement, je n’ai pas réussi à faire apparaître le lien "next" (vers un numéro bis ; est-ce que ça a un rapport ?). Quelqu'un peut-il me dépanner ? Par ailleurs, si quelqu'un trouvait pourquoi les lettres du tome XX de la correspondance de Diderot n'ont pas le même comportement que celles des tomes précédents (lien avec le sommaire qui ne se fait pas), ça m’arrangerait beaucoup. Merci d'avance, --Acélan (d) 31 mai 2010 à 15:47 (UTC)

Pour la correspondance 57, c'est apparemment la balise "sup" qui ne passe pas. Je l'ai enlevée.
pour la différence tome XX, tome XIX, tu veux bien dire pourquoi il ne trouve pas tout seul le titre, le next et le prev ? Si c'est ça, j'ai enlevé des trucs dans le sommaire (plus précisément div style="margin:5%; font-size:90%;" poem ... /poem /div ) et ça a l'air de marcher maintenant. --Kip (d) 31 mai 2010 à 16:48 (UTC)
Merci beaucoup, ça marche ! --Acélan (d) 31 mai 2010 à 19:00 (UTC)