Follow

Rappel : Quand vous utiliser google captcha de merde « parce que c'est le seul système antispam userfriendly et efficace », en plus d'emmerder prodigieusement vos visiteurs, vous les faites travailler gratos et à leurs insu pour google… Travailler à entraîner un système de reconnaissance d'images aux mains d'une entreprise de surveillance de masse ! Travailler pour une entreprise qui veut utiliser la reconnaissance d'images dans un projet de drones militaires tueurs pour un pays fasciste…

· Web · 11 · 57 · 26

@devnull y a t'il une preuve quelque part que cela fasse travailler les visiteurs "gratos et à leur insu" ? quelles informations utiles sont acquises à cette occasions ?

@JulienLecaille Non, bien sur que valider humainement qu'une image est un voiture, un passage piéton, ou un vélo ou autre, n'apporte absolument rien à un système de reconnaissance d'images… Je raconte évidemment n'importe quoi.

De plus, google ne paye pas eux même des « employés » $1/heure pour justement bosser à améliorer leurs « intelligence artificielle » (machine learning) de reconnaissance d'images, dans le cadre d'un projet militaire…

theintercept.com/2019/02/04/go

@devnull tu veux dire que Google ne connait pas *déjà* la solution du Captcha ? Mais alors qu'est ce qui permet de valider la réussite ou l'échec ?

Ce genre d'affirmations me plonge depuis des années dans des abîmes de perplexité. Je souhaiterai des sources réelles, pas des considérations morales.

@JulienLecaille Si, il connaît ses captchas. Ça ne veut pas dire que ça leurs apporte rien. Sinon ils ne paieraient des gens $1/l'heure pour faire le même type de travail (en disant à quoi correspondent les images. Voir le lien que j'ai donné

@JulienLecaille Le principe du machine learning, en gros, c'est de donner à des machines un jeu de données suffisamment important, lui dire que ça c'est des arbres, ça une voiture et ça c'est une personne ou un chat, et avec cette connaissance plus des calculs stastiques, la machine sera à un moment donné capable de classifier des images qui lui sont inconnues, en forction des motifs que la machine reconnait.

Plus la machine est « entraînée ». moins elle fera d'erreurs sur des données inconnues

@devnull Ben oui, donc il paye des gens dans un cadre contrôlé pour acquérir de l'information. Donc je ne comprend pas d'où vient cette certitude qu'il acquièrerait autrement des informations ayant la moindre valeur.

@JulienLecaille Ils sous-paient des gens… plutôt.

Et en quoi les données des gens non-payés n'auraient ppas de valeur? Ils essayeront de faire de leurs mieux pour accéder à la ressources… Et par la même occasion, ça donne plus d'infos, gratos, a google… C'et tout benef pour eux. Et c'est pas 2 ou 3 gus qui font faire exprès de donner des infos foireuses, qu'ils vont changer la donne, quand on fasse t'as un énorme jeu de données et des milliers de gens qui donnent les bonnes réponses

@JulienLecaille Quand au terme réducteur « considérations morales », c'est vrai que j'avais oublié que google est une entreprise respectable, aucune raison de ne pas leurs faire confiance… Ils ont absolument aucun antécédent qui démontre le contraire…

@JulienLecaille Ces informations sont.tellement sans valeur que le grand bienfaiteur google fournit ses ressources gracieusement aux développeurs web pour combattre le spam…

@JulienLecaille
Google a officiellement reconnu que cela permet d'entraîner leur IA. (je n'ai malheureusement plus le lien).

Avant que Recaptcha soit racheté par Google, cela servait uniquement à aider à la numérisation des livres.

Que Google a rapidement remplacé par ses images de StreetView pour faire travailler les internautes à améliorer sa reconnaissance d'objets.
@devnull

@sebsauvage
J'ajouterai, Google ignore peut être la signification d'une image dans sa liste, mais comme tu ne sais pas laquelle c'est, tu respectes (si tu es bien dressé) le test, tu va la valider (en positif/négatif).
Donc même si Google ne sais pas si cette image précise est bonne ou pas, la validation des autres leur dira si tu es fiable ou pas.
Tu ajoutes à cela les millions de requêtes quotidiennes, et en peu de temps l'image sera sûr.
@JulienLecaille @devnull

@JulienLecaille Pas de source, juste déduction.
Leur objectif est de limiter le coût de leur produits, ce genre de tâche étant peu intéressante et si ils peuvent limiter le cou de celles-ci, ils le feront.

Ensuite, c'est aussi un peu d’expérience personnelle, certaines images validées (à tort et volontairement) ne m'ont pas bloqué lors du passage de ce péage (bien que ça puisse aussi être une tolérance volontaire aux erreurs.
@sebsauvage @devnull

Si il devaient le faire, je pense qu'ils s'y prendrait comme cela.

De plus, avec leur challenge où les images changent à chaque sélection, cela est très facile à implémenter et masquer.

@JulienLecaille @sebsauvage @devnull

@JulienLecaille
Papier sur l'attribution automatique des numéros de rue dans street view (Google Maps) :
arxiv.org/abs/1312.6082

@C_Chell @sebsauvage @devnull

@JulienLecaille @C_Chell @sebsauvage @devnull
oups ! je viens de voir que ce thread a un jour ...
j'ai croisé un partage sans regarder la date du thread ...
désolée du dérangement !

@JulienLecaille @devnull c'est facile, dans le CAPTCHA il y a la moitié des images que Google connaît et l'autre non. C'était plus évident à l'époque des mots où ReCAPTCHA affichait toujours deux mots. Du coup si tu réponds correctement aux images que le CAPTCHA connait alors il considère que la réponse est bonne pour les autres.

D'ailleurs perso j'en répond toujours un à côté de la plaque pour fausser leurs algos 🙃 #PasDePetiteRebellion

@JulienLecaille @devnull En fait c'est un peu plus subtile que ça, "ils" connaissent la solution de certains Captcha (ceux qui servent réellement à prouver que tu n'es pas un robot), mais dans le lot il y en a pour lesquels ils n'ont pas encore "la" réponse, ou le label pour bien parler.
Et c'est bien par rapport à ces derniers que les utilisateurs "travaillent" pour eux...

@HorlogeSkynet

S'ils n'ont pas "la" réponse, comment font-ils pour valider ou pas le captcha ? Franchement, est ce qu'il existe une source crédible quelque part qui explique cela ?

@JulienLecaille Ben ils valident avec celui pour lequel ils ont la réponse. Pour l'autre c'est juste de l'apprentissage qui s'auto-équilibre sur la moyenne de la population.
Pour la petite histoire, j'ai déjà passé les validations en renseignant absolument n'importe quoi...

Et pour ma part, on m'a expliqué ça à l'école un jour

@devnull @agnesaltairis En parlant de trucs de merde, une idée pour une appli android non intrusive mais qui permet de filtrer efficacement les spams et les appels pourris?

@devnull
Rappel, quand vous êtes un utilisateur, vous n'avez aucune obligation d'utiliser un site web qui vous propose des publicités, des captchas ou des contenus qui vont à l'encontre de vos convictions.
Pour ma part, je n'ai pas de solutions alternatives, et la valeur du service Captchas vaut largement le travail que je fournis à Google en échange, même si je ne préférerais pas.

@matclab T'inquiète pas pour moi, c'est sûr que je risque pas de mettre les pieds sur ton site

> s, et la valeur du service Captchas vaut largement le travail que je fournis à Google en échange

Non, c'est le travail que tes visiteurs fournissent à google, sans s'en rendre compte… Toi, tu ne fournisà google rien d'autres que les données personnelles de tes visiteurs, à leurs insu…

@devnull
Je parlais de ma position en tant qu'utilisateur, pour lequel un site qui contient du spam ne m'intéresse pas. C'est à cette mesure que j'accepte le captcha Google...
Mon blog est un site statique sans captchas (et vraisemblablement sans utilisateur aussi :-) )
Ceci dit, s'il y a une alternative libre et aussi efficace, je serais ravi d'en faire la promotion auprès des services que j'utilise...

@devnull Sélectionnez les cases contenant : un dissident rebelle

@devnull Oui, de même sans doute que quand on taggue une photo hébergée (au hasard) chez FB, Insta ou sur le disque dur de son ordi Apple, en lui disant QUI figure dessus.

Tu as une référence sur le "projet de techno tueuse à vendre" dont tu parles ?

@benjahainaut Bah non, « on » s'en doute pas. Les gens en taggent d'autres machinalement sans se poser de question, puis te sorte la carte « T'es parano, j'ai rien à cacher ». Un tas de gens pensent que google connaît déjà toutes les réponses a tout son deux d'images de recaptcha, et que du coup foutre recaptcha sur leurs site, ne revient à travailler gratos à amiéliorer la reco d'image de Google, que ça n'apporte aucune information de valeur à google…

@benjahainaut Je fait référence au projet Maven, ce n'est plus un.secret depuis longtemps hein… En plus j'ai publié le lien de The Intercept plusieurs fois ces derniers jours, dont juste hier…

@devnull D'ailleurs dans le même style, l'utilisation des hashtags sur Instagram leur a permis de développer une IA très précise sur ce que contient une photo.
Il suffit de désactiver le wifi pendant le chargement d'une page et de constater ce qui s'affiche à la place des images.

@raph C'est beau… Avoir comme business modèle le flicage publicita:et faire bosser gratuitement les gens à noirir son.système de machine learning 👏🙂

Sign in to participate in the conversation
La Quadrature du Net - Mastodon - Media Fédéré

The social network of the future: No ads, no corporate surveillance, ethical design, and decentralization! Own your data with Mastodon!