DuckDuckGo publikuje bazę stron śledzących. Na czym polega Tracker Radar?

Firma DuckDuckGo jest znana przede wszystkim ze swojej konkurencyjnej względem Google'a wyszukiwarki internetowej mającej zapewniać prywatność. Lecz poza udostępnianiem infrastruktury pozwalającej choć na chwilę uciec od Google (z różnym skutkiem), DuckDuckGo zajmuje się także opracowywaniem "prywatnych" rozszerzeń do przeglądarek oraz aplikacji mobilnych. Zajmują się one blokowaniem trackerów (komponentów śledzących ruch), a nie bezpośrednio reklam, co cieszy się większą popularnością.

DuckDuckGo publikuje bazę stron śledzących. (fot. Pixabay)
DuckDuckGo publikuje bazę stron śledzących. (fot. Pixabay)
Kamil J. Dudek

Nie da się jednak w pełni heurystycznie, "w locie" określić, który komponent zagnieżdżony na mapie strony internetowej "śledzi", a który nie. Trudno też postawić jasną granicę między śledzeniem a niewinną analizą/profilowaniem ruchu.

Wyszukiwarka DuckDuckGo
Wyszukiwarka DuckDuckGo

Aby to osiągnąć, potrzebna jest baza reputacji i adresów, w dodatku dość często aktualizowana. Z takiej bazy korzystają narzędzia DuckDuckGo i od kilku dni jest ona ogólnodostępna. W przystępnej formie, pozwalającej na wykorzystanie przez innych twórców.

Tracker Radar

Baza komponentów śledzących nosi nazwę DuckDuckGo Tracker Radar. Jest generowana automatycznie po stronie twórców serwisu i regularnie aktualizowana. Wraz z samą bazą udostępniono kod crawlerów odpowiedzialnych za jej tworzenie. Wszystkie elementy są dostępne w repozytorium na portalu GitHub (niezaopatrzonym w komponenty śledzące).

GitHub: czysto.
GitHub: czysto.

Pliki z definicjami, dostarczane przez DuckDuckGo, nie zawierają wyłącznie informacji "dobre-złe", lecz szereg danych pozwalających obliczyć reputację. Wśród nich znajdują się takie kwestie jak kategoria, częstość, stosowanie fingerprintingu oraz średni wpływ na prędkość ładowania strony. Dzięki temu można zadecydować, czy chce się odsiać wszystko, czy tylko komponenty najbardziej "zjadliwe" lub najmocniej degradujące wydajność.

Serwer CDN Wirtualnej Polski. Źródło narzędzia wpjslib, komponentu dostarczania treści (fot. DuckDuckGo, via GitHub)
Serwer CDN Wirtualnej Polski. Źródło narzędzia wpjslib, komponentu dostarczania treści (fot. DuckDuckGo, via GitHub)

Potencjał do rozwoju

Dane są dostępne na zasadach Creative Commons (CC BY-NC-SA 4.0) i można je wykorzystać podczas opracowywania własnych mechanizmów blokowania śledzenia a także jako pomoc naukową podczas badania samego zjawiska. Nie jest jasne, na ile DuckDuckGo straci na swoim szlachetnym ruchu, pewne jest za to, że firma zwraca w ten sposób uwagę na to, że obecny model finansowania twórców w internecie (reklamy i monitorowanie ruchu) może się okazać niemożliwy do utrzymania, przy jednoczesnym braku oczywistych alternatyw.

Programy

Zobacz więcej
Wybrane dla Ciebie
Komentarze (54)