nowebscraping

Je ne suis pas un spécialiste du droit et lorsque j’ai pris ces dernières semaines l’initiative ici et ici d’indiquer dans les mentions légales de mon site web que je n’autorise pas le webscraping du contenu de mes pages et que cette pratique est soumise à mon consentement préalable je n’avais pas de certitude que cela ait véritablement du sens ou plutôt une portée légale authentique. Ce n’était pas d’ailleurs mon souci premier, je cherchais surtout à prendre les devants et à refuser cette pratique sur mes contenus. Or sa portée légale semble bien réelle.

Je m’apprêtais à rédiger un nouvel article (qui sera publié une autre fois car le présent article a pris le temps que je voulais lui consacrer) et pour parler d’une nouvelle pratique que j’envisage de mettre en oeuvre sur mes pages pour ce qui relève du webscraping quand mes recherches sur le mot ‘webscraper’ m’ont fait atterrir sur une page éclairante.

Soit dit en passant le terme ‘webscraper’ que je pensais pouvoir utiliser pour l’associer aux pratiquants du webscraping dans mon article n’est définitivement pas un terme utilisé à cette fin. Il n’existe pas de termes pour les pratiquants du webscraping.

Cette page sur laquelle je suis donc parvenue de clic en clic est celle d’une entreprise spécialisée dans la pratique du webscraping. Elle indique qu’un propriétaire de site web peut se protéger de la pratique du webscraping en indiquant dans les conditions d’utilisation de celui-ci son refus de voir ses pages absorbées par webscraping. Et qu’en conséquence un pratiquant du webscraping ne pourra obtenir le contenu des pages et à moins d’en demander l’autorisation à son propriétaire.

Extrait de l’article : << Web scraping can generally be done without asking for permission of the owner of data if it does not a violate the website’s terms of service. Each website has Terms of Service (ToS), you can easily find that document in the footer of the page and check that there is no direct prohibition on scraping. If a website has written under its ToS that data collection is not allowed, you risk being fined for web scraping, because it is done without the owner’s permission. >>

Pour ma part j’ai indiqué cette condition il y a quelques semaines dans les mentions légales de mon site web et le fait qu’il soit évoqué ‘Terms of Service (ToS)’ autrement dit les conditions générales d’utilisation (CGU) m’interpelle. Il pourrait être effectivement plus juste de le mentionner dans des CGU ce à quoi je vais m’atteler sous peu sur mon site web.

.

Tous les articles sur ce sujet sont regroupés au sein du tag #nowebscraping.

Dans ma page des mentions légales, j’ai entrepris d’élargir le champs de protection des données pour ce qui relèverait d’une extraction ou d’une absorption à laquelle je m’oppose même si ce procédé est une pratique légale actuellement. Initialement je l’avais cantonné à la pratique au webscraping. Je viens de l’élargir à tout moyen d’extraction ou d’absorption utilisé. Le webscraping est un moyen parmi d’autres et j’ai précisé à ce titre une autre extraction possible : l’intervention humaine.

Précédemment j’avais nommé mon paragraphe : Pratique du webscraping à destination du site web borisperchat.fr

Il s’intitule désormais : Extraction des données du site web borisperchat.fr notamment par webscraping

Si vous souhaitez utiliser mon paragraphe à l’identique pour votre usage, c’est possible mais j’ai besoin que vous m’en demandiez au préalable l’autorisation. Si vous avez l’intention d’écrire votre propre paragraphe indépendamment du mien, contactez-moi également pour que nous puissions échanger sur le sujet.

La page des mentions légales

Tous les articles sur ce sujet seront regroupés au sein du tag #nowebscraping désormais.

Je viens de mettre à jour les mentions légales du présent site web borisperchat.fr et pour le positionner sur la pratique dite du webscraping qui consiste en une absorption des données par le biais de logiciels ou de scripts, soit par procédés automatisés ou semi-automatisés. Cette pratique est utilisée notamment à des fins de prospections commerciales à par exemple pour obtenir votre adresse e-mail, votre numéro de téléphone ou votre adresse postale ou tout à la fois. Mais rien n’empêche un webscraper (néologisme de ma part pour désigner un pratiquant du webscraping) de collecter d’autres données / contenus pour peu que ceux-ci sont “accessibles” sur vos pages. Je sais que cette pratique connait un engouement croissant et que son champs d’action est sans doute déjà plus large et va s’élargir. Elle est une pratique légale mais l’utilisation qui est faite ensuite des données ainsi récoltées est sujete à controverse et donne régulièrement lieu à des affaires en justice. En ce qui me concerne je choisis de ne plus me laisser exposer à cette pratique sans que la personne obtienne mon consentement. Il y a longtemps que je réfléchis à afficher mon refus. J’ai pris le temps de la réflexion et de l’écriture à cette fin pour écrire un paragraphe intitulé “Pratique du webscraping à destination du site web borisperchat.fr” ajouté à mes mentions légales.

Si vous souhaitez utiliser ce paragraphe et afin de l’adapter à votre site web, contactez-moi.

J’en ai profité pour préciser ma position par rapport au crawling qui est une pratique ancienne consistant pour les moteurs de recherche à parcourir les sites web afin d’indexer leurs pages. Un second paragraphe a été ajouté aux mentions légales intitulé “Pratique du crawling à destination du site web borisperchat.fr“.

Le paragraphe concernant le webscraping ajouté à mes mentions légales est une écriture réalisée par mes soins et issue de ma réflexion. Certaines lectures m’ont permise de confirmer deux aspects 1) les différentes technologies (robots, logiciels, scripts) et le passage concernant le RGPD et dont voici les sources :
Sur le site de la CNIL
Sur le site de Islean consulting
Sur le site de Dastra

.

Mise à jour du 14 février 2023 : la phrase relative au crawling n’est pas terminée : “… avec une intention de servir les intérêts”. Je vais revenir ultérieurement pour poursuivre ma réflexion sur les intérêts en question.

Appelez-moi