Un groupe de chercheurs a révélé les limites fondamentales de la confidentialité sur les réseaux sociaux présentées par les recommandations personnalisées. Celles-ci ne peuvent pas être faites sans divulguer des relations confidentielles entre les utilisateurs.

Facebook recommande de nouveaux contacts en fonction des modèles de connexion entre les utilisateurs existants ; Amazon recommande des livres et d'autres produits en fonction des habitudes d'achat ; enfin, Netflix recommande des films en fonction de l'historique des notes attribuées. Certes, ces sites renvoient des résultats utiles pour les utilisateurs ainsi que pour les sites marchands, qui augmentent ainsi leurs ventes. Ils risquent cependant aussi de menacer la vie privée des utilisateurs.

Par exemple, une recommandation sur un réseau social peut indiquer qu'une personne a échangé des e-mails avec une autre, ou qu'un individu a acheté un certain produit ou vu un film donné. Découvrir que votre ami ne fait pas confiance à vos jugements concernant les livres peut même constituer une violation de la confidentialité.

Aujourd'hui, les chercheurs affirment que les violations de la confidentialité sont inévitables lorsque les réseaux sont exploités de cette manière. Ils ont d'ailleurs établi une limite fondamentale pour le niveau de confidentialité possible lorsque des réseaux sociaux sont truffés de recommandations.

L'approche scientifique consiste à examiner une représentation générale constituée de noeuds et de liens. Il peut s'agir d'un réseau où les noeuds sont, par exemple des livres. Le lien entre deux noeuds sera alors l'achat d'un livre par le propriétaire d'un autre livre. L'équipe considère que tous ces liens sont des informations d'ordre privé. Les chercheurs partent de l'hypothèse d'un pirate qui rechercherait dans la représentation un lien partant d'une recommandation particulière. Sachant que ceux qui ont acheté le livre X ont également acheté le livre Y, est-il possible de déterminer une décision d'achat faite par un individu particulier ?

Pour ce faire, les scientifiques définissent le différentiel de confidentialité comme étant le rapport entre les probabilités que le site Web fasse une telle recommandation avec la décision d'achat privée et sans elle. Ils se demandent alors dans quelle mesure il est possible de faire des recommandations tout en préservant ce différentiel de confidentialité.

Il apparaît un compromis entre la précision de la recommandation et la confidentialité du réseau. Ainsi, la perte de confidentialité est inévitable avec un bon moteur de recommandation.

Source :