Si vous ne savez pas où partir en vacances en ce moment, vous pouvez déjà savoir où il est préférable de ne pas aller grâce à cette carte inéractive de Google Maps qui permet de suivre l’évolution de la grippe porcine : ici.
Source : www.geekologie.com
Twitter est l’application de microbloging à la mode en ce moment, il n’y a qu’à voir comment des gurus du marketing tels Guy Kawazaki se la sont appropriée pour s’en convaincre !
La taille des « tweets » a beau être limitée à 140 caractères et le processus de publication réduit à son plus simple élément, ça reste tout de même très fatigant à gérer, d’autant que les beaux jours approchent et que nous passerons bientôt plus de temps à la plage que devant l’ordinateur (je suis désolé pour les gens du Nord…).
Alors que faire ?
Une fois de plus, la réponse tient en un mot : automatisation. Et en quelques lignes de PHP !
Continue reading « Poster sur Twitter avec PHP »
Non ce blog n’est pas mort, seulement je suis occupé à d’autres projets en ce moment. C’est pourquoi l’article d’aujourd’hui sera bref, mais j’espère pourra vous être utile.
Il arrive parfois qu’on ait des besoins particuliers comme par exemple automatiser la publication de d’articles sur Wordpress qui ont besoin de manipulations côtés serveur avant d’être postées. Par exemple récupérer l’horoscope du jour.
Pour cela, plutôt que d’utiliser une batterie d’extensions qui vont faire mouliner encore un peu plus le bestiau, il peut être judicieux d’utiliser les fonctions XML-RPC de Wordpress, combinées à quelques lignes de PHP !
Continue reading « Poster automatiquement sur Wordpress avec PHP »
Toute l’équipe de Porn Sex Viagra Casino Spam s’associe à la préfecture de Police pour vous souhaiter une bonne année 2009 !
Voilà une situation qui pourrait bientôt changer avec l’arrivée de « Frédo le nettoyeur » au Secrétariat d’Etat à l’économie numérique : pas la peine de préciser que cette annonce fait l’unanimité dans le monde des professionnels d’Internet !
En effet, notre homme a l’air de bien savoir de quoi il parle :
« L’absence de régulation du Net provoque chaque jour des victimes !
Combien faudra-t-il de jeunes filles violées pour que les autorités réagissent ?
Combien faudra-t-il de morts suite à l’absorption de faux médicaments ?
Combien faudra-t-il d’adolescents manipulés ?
Combien faudra-t-il de bombes artisanales explosant aux quatre coins du monde ?
Combien faudra-t-il de créateurs ruinés par le pillage de leurs œuvres ?
Il est temps, mes chers collègues, que se réunisse un G20 du Net qui décide de réguler ce mode de communication moderne envahi par toutes les mafias du monde. [...]
La mafia s’est toujours développée là ou l’État était absent ; de même, les trafiquants d’armes, de médicaments ou d’objets volés et les proxénètes ont trouvé refuge sur Internet, et les psychopathes, les violeurs, les racistes et les voleurs y ont fait leur nid. »
Amen ! C’est beau comme un cantique…
Et pour ceux qui ne connaitraient pas le personnage, voici quelques éléments qui illustrent la grande maitrise des nouvelles technologies de Frédo, ici à propos du Web 2.0 :
Pour le reste, tout a déjà été dit avec beaucoup de talent déjà sur d’autres sites alors plutôt que d’y passer ma matinée je vous ai fait une sélection des meilleures sources :
Comment donc expliquer cette nomination incongrue ? La réponse est peut-être dans le Canard Enchaîné du 31 décembre 2008 :
« Il faut s’attendre à un renvoi en correctionnellet d’André Santini …. Conséquence possible : départ de Santini du gouvernement et, en vertu de la nouvelle loi, son retour à l’assemblée nationale à la place de son suppléant (*), Frédéric Lefebvre. Lequel se retrouverait à la rue. Un sort inacceptable pour un porte-parole de l’UMP et protégé personnel de l’Élysée. Du coup, Sarko cherche une solution pour sauver Lefebvre et il n’en a trouvé qu’une, pour le moment : l’élever au rang de secrétaire d’Etat lors du miniremaniement de janvier… »
Via http://www.couchet.org/blog/index.php?2009/01/04/352-un-lobbyiste-bientot-au-gouvernement
(*) Une loi récente (on arrête pas le progrès) lui permettrait en effet de retrouver rapidement son immunité parlementaire en récupérant son poste de député ; mais cela n’a sans doute rien à voir…
Et pour finir sur une note de bonne humeur, ça n’a vraiment, mais alors vraiment rien à voir, mais je ne peux m’empêcher de vous faire (re)découvrir ce fameux sketch du grand Albert Dupontel :
Le Blogueur et la Morue
Une morue sur son Hub perchée
Tenait par les couilles un admin
Un Blogueur par la pute excédé
Lui tint à peu près ce langage :
“Hé ! bonjour, Madame de la Morue
Que vous êtes vilaine et que vos paroles puent
Sans mentir, si votre affection
Se rapporte à votre tronche de laideron,
Vous êtes la grosse merde de ce forum. ”
A ces mots la Morue décide de ramener sa pomme ;
Et pour montrer qu’elle peut se défendre sans son homme
Innonde le web de ses coms.
Le Blogueur apeuré se dit “Oh my God
N’y a t’il pas là matière à exode ?
Cette vilaine s’en va pourrir mon dimanche
Va falloir que j’arrête de m’astiquer le manche ! ”
Cette leçon vaut bien un fromage, sans doute
D’ailleurs elle en a l’odeur et parait-il les croutes,
Et pardieu sur son Hub on ne m’y verra plus !
Fable librement inspirée de “Guerre et Paix” de Tolstoï
Vous avez été des milliers à vous plaindre du manque d’articles sur le référencement sur ce blog, je profite donc d’un petit script d’analyse de logs pour revenir dans le droit chemin !
Le suivi de l’activité des robots des moteurs de recherche sur votre site, et tout particulièrement du Googlebot, fait partie intégrante d’un bon référencement. Certes, Google mets à disposition des éditeurs depuis quelque temps déjà une série d’outils de suivi, les Google Webmaster Tools (GWT). C’est bien, mais pas toujours très complet et les mises à jours souvent aléatoires…
Les webmasters ont pourtant tout ce qu’il faut sous la main pour avoir des stats précises et surtout en temps réel pour suivre les bots : les logs du serveur Apache, souvent les meilleurs amis du référenceur !
Que faire avec ces logs ?
Les logs ne sont qu’un indicateur de plus pour l’analyse de la crawlabilité d’un site mais il y a de nombreuses façons de les utiliser. En vrac :
- Identifier des liens cassés (404) ou d’autres erreurs rencontrées par le bot lors de ses visites
- Si une page du site ne ressort pas dans l’index de Google, la première chose à faire est de vérifier si cette page a ou pas été crawlée par le googlebot
- On peut également s’amuser à corréler la fréquence de passage du bot au PageRank dune page, ou à son traffic réel, ou encore à sa position dans les SERP
- L’étude des visites du googlebot peut aussi servir à améliorer la structure des liens internes, détecter des pages isolées, etc.
Il y a encore sans doute de nombreuses autres apllications mais entrer dans le détail n’est pas l’objet de cet article.
Continue reading « Suivre l’activité de Googlebot sur votre site grâce aux logs Apache »
Je vous ai expliqué il y a quelques jours comment utiliser les fonctions curl de php pour récupérer des pages web et vous ai proposé à titre d’exemple une petite classe php5 prête à l’emploi (SpiceCurl). C’est l’occasion aujourd’hui de la tester, et pour cela j’ai imaginé une petite application bien sympa : un assistant pour Scoopeo, le ScoopeoBot
En effet, il faut se rendre à l’évidence : passer son temps à promouvoir ses propres scoops, pourrir ceux des autresmodérer le spam, plusser les copains et moinser les commentaires des nombreux boulets de Scoopeo toujours à l’affût d’un troll ou d’une indignation ; que de tâches répétitives qui nuisent à notre productivité et font perdre quelques précieuses places à notre employeur dans une compétition internationale toujours plus impitoyable (vous pouvez respirer) !
Heureusement, avec un peu d’imagination et de technique, nous allons pouvoir déléguer toutes ces tâches ingrates à un robot et ainsi nous remettre au travail l’esprit serein !
J’ai donc imaginé le cahier des charges suivant pour notre robot :
- Le robot doit pouvoir gérer un nombre illimité de comptes (bien sûr nous n’en avons qu’un chacun, mais peut être vos amis vous demanderont d’utiliser votre robot donc autant prévoir)
- Le robot doit reconnaitre les sites ET les comptes de vos amis, ainsi que des spammeurs
- Le robot évitera d’être trop bête et de systématiquement cliquer les amis et moinser les autres par exemple
- Pour ne pas surcharger les serveurs de scoopeo, le robots devra observer des pauses entre chaque action
- Le robot devra pouvoir : voter ou modérer un scoop, plusser ou moinser un commentaire
Bon, ça me semble déjà pas mal donc voici ce que vous attendez tous, le code ; qui se présente sous la forme de 4 petites classes :
- ScoopeoAnonymousAccount : une classe de base pour définir un utilisateur de scoopeo non identifié, avec des méthodes pour récupérer une liste de scoops, une liste de commentaires et cliquer.
- ScoopeoAccount : étend la classe précédente et ajoute la possibilité de s’identifier avec un compte scoopeo.
- ScoopeoSource : définit une source sur scoopeo, ce peut être un membre de scoopeo, ou un domaine d’où provient des scoops. Cette classe a deux méthodes pour savoir comment réagir face à un scoop ou face à un commentaire de cette source.
- ScoopeoBot: la classe principale qui sert d’interface pour ajouter des sources, des comptes utilisateurs, des pages à analyser et qui va dire au robot ce qu’il doit faire.
Continue reading « Exemple d’utilisation de la classe SpiceCurl : le ScoopeoBot »
C’est tout chaud, la nouvelle circule déjà dans l’underground : suite à une mauvaise manipulation qu’on mettra sur le compte de la distraction plutôt que sur celui de l’incompétence, c’est un fichier client d’OVH qui se ballade maintenant dans la nature (on parle de plus d’une trentaine de milliers d’adresses email notamment).
Il semble en effet que les responsables d’OVH aient un peu tardé à protéger une console d’administration du webmail accessible en ligne (ici: https://ssl0.ovh.net/atmail/webadmin/).
Quand on sait les efforts d’OVH pour lutter contre le spam et la fraude, il y a de quoi être surpris. Reste à savoir maintenant quelle sanction va être prise à l’encontre des employés responsables ; si la politique de la maison est la même que pour les clients d’OVH, il pourrait bien y avoir du licenciement sans préavis et sans solde de tous comptes dans l’air !
On peut dire que vous êtes vernis : parce que j’avais une féroce envie de faire un jeu de mots pourri (et même deux), je me sens obligé de balancer un peu de substance pour en faire un article.
Au programme aujourd’hui donc, Curl.
Pour ceux qui ne le savent pas, Curl est la librairie préférée des scrapers, pourrisseurs de commentaires et autres spammers
Je vous propose donc ici, un objet PHP5 que vous pourrez utiliser pour récupérer des pages web comme si c’était un vrai internaute qui visitait la page (ou presque).
Continue reading « Curl Just Want To Have Fun »