Meta ha “raschiato” dati (scraping) per anni sui siti mentre combatteva questa pratica

Meta Platforms, a cui fa riferimento Facebook, per anni ha pagato terze parti per raccogliere dati da altri siti Web. In termini tecnici si chiama “scraping”, ossia la raccolta “raschiando” dati disponibili dai siti e aggregandoli. E questo è avvenuto in modo indisturbato, nonostante Meta continuasse a condannare pubblicamente la pratica e facendo causa alle società che hanno prelevato dati dalle proprie piattaforme di social media (oltre a Facebook anche Instagram, Messenger e WhatsApp).

Lo scraping di Meta è emerso nei documenti legali depositati in un caso giudiziario della California in cui la piattaforma di social media ha citato in giudizio la società Bright Data, specializzata nella raccolta dati e con sede in Israele, per avere eseguito lo scraping e venduto le relative informazioni da Facebook e Instagram. 

È una svolta ironica, del tutto kafkiana, degli eventi per l’azienda: la corrispondenza e-mail tra le due aziende sembra confermare che Meta ha avuto un rapporto professionale di anni con il gruppo specializzato nello scraping dei dati. Bright Data offre una gamma di servizi che includono lo scraping di informazioni sul profilo, nonché “Mi piace”, numero dei follower, post e commenti da piattaforme di social media come TikTok e Twitter e da siti di e-commerce come Amazon, eBay e Walmart.

Il portavoce di Meta, Andy Stone, ha confermato in un’intervista a Bloomberg che Meta ha pagato Bright Data per raccogliere dati dai siti di e-commerce al fine di creare profili di marca sulle piattaforme Meta, ma ha rifiutato di dire quali siti sono stati cancellati. Meta ha anche utilizzato Bright Data per trovare “siti Web dannosi” e “operazioni di phishing”, ha detto Stone. 

Dal 2021, Meta ha represso i servizi di scraping a pagamento con una serie di azioni legali contro le aziende che estraggono dati dalla sua piattaforma. Oltre a Bright Data, che include Voyager Labs con sede negli Stati Uniti, nella lista dei “bloccati”, ci sono Octopus, una filiale statunitense di una società cinese, e BrandTotal. A gennaio, Meta ha pubblicato l’ultimo di una serie di post sul blog su come stava “guidando la lotta contro lo scraping-for-hire”, ossia su come si combatte il raschiamento attuato da società che lo fanno per lavoro. Ulteriore nota di colore in questa vicenda torbida.

“La raccolta di dati dai siti Web può servire a legittima integrità e scopi commerciali, se eseguita in modo lecito e in conformità con i termini di tali siti Web”, ha detto Stone. Ha confermato che Meta non stava usando Bright Data per raschiare i siti web dei rivali. Meta ha concluso la relazione con Bright Data dopo aver appreso che stava violando i termini dell’azienda che proibivano la raccolta e la vendita automatizzata di dati, ha aggiunto Stone.

Molte aziende estraggono dati dai siti Web per recuperare informazioni che possono aiutarli a tenere traccia dei concorrenti, comprendere meglio un pubblico specifico, seguire le tendenze del mercato e confrontare i prezzi. Tuttavia, lo scraping può rappresentare un rischio per la privacy quando prende di mira informazioni personali come i dettagli di contatto e va contro il diritto dell’UE se le aziende non si sforzano di impedirlo con mezzi tecnici e legali. A novembre, Meta è stata multata di 265 milioni di euro dall’UE per non aver protetto i dati degli utenti dallo scraping da parte di terzi. 

Meta ha intentato una causa contro Bright Data a San Francisco il 6 gennaio. Tra i documenti inviati c’è uno scambio di e-mail tra i rappresentanti di Meta e l’amministratore delegato di Bright Data Or Lenchner. “Come sapete, Meta è stata a lungo un cliente stimato dei nostri servizi di proxy e scraping almeno negli ultimi sei anni”, ha scritto Lenchner nell’e-mail del 1° dicembre, riferendosi in seguito alla “collaborazione di successo di lunga durata delle due società”.

Bright Data ha confermato di aver fornito servizi di scraping a Meta, ma ha rifiutato di rivelare quali siti web gli è stato chiesto di prendere di mira. Bright Data ha presentato una contro-querela chiedendo il permesso di continuare a raccogliere dati da Facebook e Instagram. Nella sua causa, la società ha notato la sua conformità alle normative UE e USA e ha sottolineato che raccoglie solo informazioni pubbliche che non sono protette dall’accesso.