Dernièrement, j'ai entrepris la tâche ingrate de lire les conditions d'utilisation et les politiques de confidentialité des divers services en ligne que j'utilise. Cet exercice est motivé par deux raisons : premièrement, je veux déterminer quels services utilisent mes données de façon responsable et transparente; deuxièmement, je veux minimiser la quantité d'informations personnelles que je mets entre les mains d'une seule compagnie.

Ma première cible a été facile à choisir : Google.

La compagnie a récemment changé sa politique de confidentialité ce qui a causé certains remous dans les médias (BBC, The Guardian, The Washington Post, Radio-Canada). En lâche citoyen du web, j'ai ignoré les messages que Google m'affichait pour annoncer ce changement et les avertissements des alarmistes du web, mais l'heure est maintenant venue pour moi de faire mes devoirs.

La situation actuelle

Voici la liste des services de Google que j'utilise actuellement, classés en ordre décroissant de leur fréquence d'utilisation.

  • Gmail (courriels)
  • Google Search (recherche)
  • Google Reader (fils RSS)
  • Google Scholar (recherche dans la littérature scientifique)
  • Google Maps (cartes géographiques et itinéraires)
  • Google Bookmarks (signets)
  • Blogger (blogue)

Il est clair que Google détient une quantité importante d'information sur moi. Comment cette compagnie gère-t-elle mes informations? Puis-je trouver des alternatives aux services qu'elle offre?

Confidentialité et conditions d'utilisation

Google collectionne beaucoup d'information sur ses utilisateurs et les appareils qu'ils utilisent. Voici une liste non exhaustive des informations que Google peut collecter (pour une liste complète, voir les Règles de confidentialité):

  • modèle de l'appareil utilisé
  • version du système d'exploitation
  • numéro de téléphone
  • requêtes de recherche
  • adresse IP
  • données de plantage de l'appareil utilisé
  • données de localisation GPS

Google peut ensuite corréler ces données avec celles que les utilisateurs lui fournissent de plein gré, c'est à dire tout ce qu'ils mettent sur Gmail, Google+, Picasa, Blogger, etc. Le but de cette collecte est, selon Google, de "vous proposer des contenus adaptés, tels que des annonces et des résultats de recherche plus pertinents" (les caractères gras sont de moi) et d'"améliorer les services proposés aux utilisateurs".

La compagnie se réserve aussi certains droits sur le contenu téléversé sur ses serveurs:

En soumettant des contenus à nos Services, par importation, ou par tout autre moyen, vous accordez à Google (et à toute personne travaillant avec Google) une licence, dans le monde entier, d'utilisation, d'hébergement, de stockage, de reproduction, de modification, de création d'oeuvres dérivées (des traductions, des adaptations ou d'autres modifications destinées à améliorer le fonctionnement de vos contenus par le biais de nos Services), de communication, de publication, de représentation publique, d'affichage ou de distribution publique desdits contenus.

(Tiré des Conditions d'utilisation.) Autrement dit, Google peut utiliser les contenus des utilisateurs dans ses publicités.

Heureusement, le Google Dashboard donne un certain contrôle sur les données stockées sur les serveurs de Google. Les utilisateurs peuvent y spécifier quels types de données sont conservées et effacer certaines de ces données. Grâce au Data Liberation Front, une autre initiative de Google, il est facile pour les utilisateurs qui le désire d'extraire leurs données des serveurs de Google et de les sauvegarder sur leur ordinateur personnel.

Est-ce que ça en vaut la chandelle?

Le modèle d'affaire de Google est basé sur la publicité et je trouve donc légitime que la compagnie essaie de maximiser la pertinence des annonces qu'elle affiche. Google fournit des services de grande qualité et en retour les utilisateurs acceptent de visionner de la publicité. Rien n'est gratuit.

Par contre, il est également légitime pour un citoyen de s'interroger sur les dangers qu'il peut y avoir à accorder à une compagnie privée une trop grande place dans sa vie privée. Personnellement, je ne suis pas à l'aise avec le fait que Google, une firme dont le but premier est de faire de l'argent, pas de me faire plaisir, puisse établir mon profil détaillé. J'aime bénéficier d'un certain anonymat.

Il ne faut pas oublier que Google fonctionne grâce à des êtres humains et que les êtres humains font des erreurs. Le géant de l'Internet a eu son lot de problèmes dus à des erreurs humaines (humage de wifi, activation de Google Buzz, comptes Gmail piratés). On ne peut pas en vouloir à la compagnie pour des erreurs, tout le monde en fait, mais les conséquences de telles erreurs peuvent être désastreuses pour un utilisateur qui met toutes ses données dans les mains de Google.

Je ne suis pas prêt à renoncer à tous les services que Google offre, mais je crois qu'il est sage de ne pas mettre tous mes oeufs dans le même panier. Je vais donc tenter de trouver des alternatives à certains des services de Google tout en continuant à en utiliser certains autres.

Alternatives

La bonne nouvelle, c'est qu'il existe une grande variété d'autres services parmi lesquels choisir. Voici mes coups de coeur.

Recherche

DuckDuckGo est un moteur de recherche qui se targue de prendre la protection de la vie privée très au sérieux. Les deux premières phrases de sa politique de confidentialité sont éloquentes:

DuckDuckGo does not collect or share personal information. That is our privacy policy in a nutshell. The rest of this page tries to explain why you should care.

Il ne collecte aucune information personnelle, ne transmet pas les données relatives à la recherche aux sites visités et ne contient aucune publicité. Les deux guides illustrés donttrack.us et dontbubble.us sont excellents et expliquent bien les enjeux.

Les résultats sont également très biens. Une excellente alternative à Google Search.

Blogue

J'ai remplacé mon site Blogger par un site statique généré avec Pelican et hébergé sur GitHub.

Pelican est un générateur de site web statique écrit en Python. Je peux écrire mes articles avec mon éditeur de texte préféré (Vim) en format reStructuredText ou Markdown, puis Pelican se charge de prendre les fichiers sources et de créer les fichiers HTML appropriés. Comme les articles sont écrits en format texte, ils peuvent facilement être gérés par un logiciel de contrôle de versions (Git ou Mercurial, par exemple).

Pour l'hébergement, j'ai choisi GitHub. Évidemment, GitHub est surtout connu comme site pour héberger des dépôts Git, ce qu'il fait merveilleusement bien, mais il offre aussi l'hébergement d'un site personnel. Les conditions d'utilisation et la politique de confidentialité de GitHub sont courtes et facile à lire. Contrairement à Google, GitHub ne s'arroge pas le droit d'utiliser les contenus de ses utilisateurs pour faire de la promotion:

We claim no intellectual property rights over the material you provide to the Service. Your profile and materials uploaded remain yours.

Publier les articles se fait d'un simple

$ pelican -s pelican.conf.py
$ git add . && git commit -m "Nouvel article" && git push

Cartes géographiques

OpenStreetMap n'est pas encore une alternative complète à Google Maps, mais ce site est néanmoins très intéressant. On y retrouve une carte du monde de bonne qualité (avec un visuel légèrement vintage) développée à la façon du logiciel libre avec des contributions de cartographes de partout dans le monde.

Il manque malheureusement une fonctionnalité essentielle : le calcul d'itinéraires.

Entreposage de données

Google offre le Google Drive depuis peu pour l'entreposage de données en ligne. Une alternative bien connue est Dropbox. Encore une fois, la politique de confidentialité de Dropbox est tout à fait raisonnable et le service est excellent.

Fils RSS

Je n'ai pas trouvé d'équivalent en ligne pour Google Reader. Cependant, les utilisateurs de Mac OS X peuvent utiliser Vienna, un aggrégateur de nouvelles. Vienna ne peut être utilisée que sur l'ordinateur ou elle est installée et je ne crois pas qu'il existe de moyen pour synchroniser les fils suivis entre deux ordinateurs. Néanmoins, cette application est très bien conçue et c'est un logiciel libre (licence Apache).

Articles scientifiques

Par l'intermédiaire de n'importe quelle institution d'enseignement universitaire qui se respecte, il est possible d'accéder à différentes bases de données pour faire des recherches dans la littérature scientifique (par exemple, MathSciNet, Web of Science, etc.).

Il existe également quelques moteurs de recherche accessible à tous. En ce qui me concerne, j'utilise surtout arXiv.org et SOA/NASA ADS.