Robot d'indexation


Un robot d'indexation (ou littéralement araignée du Web ; en anglais web crawler ou web spider ) est un logiciel qui explore automatiquement le Web . Il est généralement conçu pour collecter les ressources ( pages web , images ,
Dernière modification 2009/10/19 1:29:45http://fr.wikipedia.org/wiki/Robot d'indexationWorld Wide Web


Le World Wide Web , littéralement la « grande toile (d’araignée) [ 1 ] mondiale », communément appelé le Web , parfois la Toile ou le WWW , est un système hypertexte public fonctionnant sur Internet et qui permet de consulter
Dernière modification 2009/7/13 11:34:45http://fr.wikipedia.org/wiki/World Wide WebMoteur de recherche


Un moteur de recherche est un logiciel permettant de retrouver des ressources ( pages web , forums Usenet , images , vidéo , fichiers, etc.) associées à des mots quelconques. Certains sites web offrent un moteur de recherche comme pr
Dernière modification 2009/11/16 14:52:38http://fr.wikipedia.org/wiki/Moteur de rechercheUser-Agent


Un user agent est une application cliente utilisée avec un protocole réseau particulier; l'expression est plus généralement employée comme référence pour celles qui accèdent au World Wide Web . Les User Agents du Web vont de la gam
Dernière modification 2009/7/13 16:28:36http://fr.wikipedia.org/wiki/User-AgentMediaWiki:Robots.txt


MediaWiki:Robots.txt Un article de Wikipédia, l'encyclopédie libre. Aller à : Navigation , Rechercher # # # robots.txt pour http://fr.wikipedia.org/ # # (en) Please note: There are a lot of pages on this site, and there are #
Dernière modification 2009/7/13 14:15:56http://fr.wikipedia.org/wiki/MediaWiki:Robots.txtInternet Archive


L' Internet Archive ( IA ) est une organisation à but non lucratif consacrée à l' archivage du Web , située dans le Presidio de San Francisco , en Californie . Le projet sert aussi de bibliothèque numérique . Cette archive est const
Dernière modification 2009/10/19 17:20:43http://fr.wikipedia.org/wiki/Internet ArchivePourriel


Le pourriel ( québécisme ) ou spam ( anglicisme ) désigne une communication électronique non sollicitée, en premier lieu via le courrier électronique . Il s'agit en général d'envois en masse effectués à des fins publicitaires ,
Dernière modification 2009/10/18 9:17:34http://fr.wikipedia.org/wiki/PourrielRobots.txt


L'usage de robots.txt permet d'éviter que des ressources sans intérêt public se retrouvent dans la page de résultats d'un moteur de recherche . En outre, le fait que les robots n'accèdent pas à ces ressources allège le travail du se
Dernière modification 2009/7/13 12:35:37http://fr.wikipedia.org/wiki/Robots.txtArchivage du Web


Le Web est par essence un média éphémère. Certains sites sont mis à jour très souvent, d'autres disparaissent ou changent de fournisseur ou d'hébergeur. Face à ce constat, il a été tenté, dans une perspective de conservation du
Dernière modification 2009/7/13 16:13:15http://fr.wikipedia.org/wiki/Archivage du WebRobot


Un robot est un dispositif mécatronique (alliant mécanique, électronique et informatique) accomplissant automatiquement soit des tâches qui sont généralement dangereuses, pénibles, répétitives ou impossibles pour les humains, soi
Dernière modification 2009/11/16 17:09:29http://fr.wikipedia.org/wiki/Robot










