Je vous ai expliqué il y a quelques jours comment utiliser les fonctions curl de php pour récupérer des pages web et vous ai proposé à titre d’exemple une petite classe php5 prête à l’emploi (SpiceCurl). C’est l’occasion aujourd’hui de la tester, et pour cela j’ai imaginé une petite application bien sympa : un assistant pour Scoopeo, le ScoopeoBot
En effet, il faut se rendre à l’évidence : passer son temps à promouvoir ses propres scoops, pourrir ceux des autresmodérer le spam, plusser les copains et moinser les commentaires des nombreux boulets de Scoopeo toujours à l’affût d’un troll ou d’une indignation ; que de tâches répétitives qui nuisent à notre productivité et font perdre quelques précieuses places à notre employeur dans une compétition internationale toujours plus impitoyable (vous pouvez respirer) !
Heureusement, avec un peu d’imagination et de technique, nous allons pouvoir déléguer toutes ces tâches ingrates à un robot et ainsi nous remettre au travail l’esprit serein !
J’ai donc imaginé le cahier des charges suivant pour notre robot :
- Le robot doit pouvoir gérer un nombre illimité de comptes (bien sûr nous n’en avons qu’un chacun, mais peut être vos amis vous demanderont d’utiliser votre robot donc autant prévoir)
- Le robot doit reconnaitre les sites ET les comptes de vos amis, ainsi que des spammeurs
- Le robot évitera d’être trop bête et de systématiquement cliquer les amis et moinser les autres par exemple
- Pour ne pas surcharger les serveurs de scoopeo, le robots devra observer des pauses entre chaque action
- Le robot devra pouvoir : voter ou modérer un scoop, plusser ou moinser un commentaire
Bon, ça me semble déjà pas mal donc voici ce que vous attendez tous, le code ; qui se présente sous la forme de 4 petites classes :
- ScoopeoAnonymousAccount : une classe de base pour définir un utilisateur de scoopeo non identifié, avec des méthodes pour récupérer une liste de scoops, une liste de commentaires et cliquer.
- ScoopeoAccount : étend la classe précédente et ajoute la possibilité de s’identifier avec un compte scoopeo.
- ScoopeoSource : définit une source sur scoopeo, ce peut être un membre de scoopeo, ou un domaine d’où provient des scoops. Cette classe a deux méthodes pour savoir comment réagir face à un scoop ou face à un commentaire de cette source.
- ScoopeoBot: la classe principale qui sert d’interface pour ajouter des sources, des comptes utilisateurs, des pages à analyser et qui va dire au robot ce qu’il doit faire.
Continue reading “Exemple d’utilisation de la classe SpiceCurl : le ScoopeoBot”
C’est tout chaud, la nouvelle circule déjà dans l’underground : suite à une mauvaise manipulation qu’on mettra sur le compte de la distraction plutôt que sur celui de l’incompétence, c’est un fichier client d’OVH qui se ballade maintenant dans la nature (on parle de plus d’une trentaine de milliers d’adresses email notamment).
Il semble en effet que les responsables d’OVH aient un peu tardé à protéger une console d’administration du webmail accessible en ligne (ici: https://ssl0.ovh.net/atmail/webadmin/).
Quand on sait les efforts d’OVH pour lutter contre le spam et la fraude, il y a de quoi être surpris. Reste à savoir maintenant quelle sanction va être prise à l’encontre des employés responsables ; si la politique de la maison est la même que pour les clients d’OVH, il pourrait bien y avoir du licenciement sans préavis et sans solde de tous comptes dans l’air !
On peut dire que vous êtes vernis : parce que j’avais une féroce envie de faire un jeu de mots pourri (et même deux), je me sens obligé de balancer un peu de substance pour en faire un article.
Au programme aujourd’hui donc, Curl.
Pour ceux qui ne le savent pas, Curl est la librairie préférée des scrapers, pourrisseurs de commentaires et autres spammers
Je vous propose donc ici, un objet PHP5 que vous pourrez utiliser pour récupérer des pages web comme si c’était un vrai internaute qui visitait la page (ou presque).
Continue reading “Curl Just Want To Have Fun”
Avant tout je tiens à préciser que cet article ne traite pas de Google Translate. Désolé amis spammeurs mais je garde mes fonctions de traduction automatique pour moi tout seul encore quelque temps.
Aujourd’hui je m’adresse donc aux vrais gens, qui font des vrais sites, et en particulier à tous ceux qui ont à gérer un site internet multi langues, qu’ils soient cravatés ou non. Ceux qui savent à quel point les soucis liés à l’internationalisation peuvent être handicapants dans le développement d’un projet ambitieux qui avait pourtant mobilisé toutes les synérgies de l’entreprise, hein mémé (je l’entends mal mais je crois qu’elle a répondu “oui oui” depuis la cuisine).
Les solutions existantes pour localiser un site Internet
Comme à chaque fois que je développe un site Internet multilingue donc (c’est à dire environ une fois tous les 33 ans), j’essaye d’abord de faire un peu le tour des solutions existantes pour savoir laquelle éventuellement dépouiller intégrer à mon projet. Et le constat est à chaque fois le même, je distingue en général trois types de solutions :
- gettext qui semble une solution solide et répandue, ceux qui ne connaissent pas, je vous laisse découvrir tout ça sur leur site super accueillant.
- définir des pages et des pages de constantes à traduire ensuite dans chaque langue, je n’ai pas d’exemple en tête mais il doit bien y avoir des CMS pourris sur le marché du genre de Joomla qui doivent fonctionner comme ça.
- se taper à la main autant de versions du site qu’il y a de langues ; c’est souvent comme ça que ça finit !
Continue reading “Utiliser les “magic functions” de PHP 5 pour traduire son site”