Expert spoločnosti Semalt hovorí, ako bolo legalizované zoškrabovanie webových údajov súdnym rozhodnutím

Aj keď môže byť nezákonné zoškrabať údaje z webových stránok bez výslovného súhlasu majiteľov týchto stránok, sudca za určitých okolností nedávno rozhodol inak. Spoločnosť hiQ Labs nedávno podala na LinkedIn žalobu, ktorá im bránila v extrahovaní údajov zo stránok LinkedIn.

Pre väčšinu ľudí to bolo hrubým šokom, o ktorom bolo spoločnosti LinkedIn povedané, aby poskytlo startupu bezplatný prístup k svojim webovým stránkam. hiQ použil svoje algoritmy na zistenie toho, kedy užívateľ LinkedIn hľadá prácu na základe zmien, ktoré užívateľ urobí vo svojom verejnom profile.

Algoritmy bežia na údajoch extrahovaných z webových stránok LinkedIn. Ako sa očakávalo, LinkedIn sa to nepáčilo a boli zavedené protiopatrenia, aby sa zabránilo hiQ v ďalšej extrakcii údajov. Okrem zavedených technických prekážok boli vydané aj dôrazne formulované právne upozornenia.

Štart nemal inú možnosť, ako začať problém legálne. hiQ sa musel usilovať o právnu nápravu. Spoločnosť chcela, aby LinkedIn nariadil odstrániť technické prekážky. Spoločnosť hiQ tiež chcela legalizovať proces extrakcie údajov na LinkedIn.

Našťastie pre spustenie, to, čo chcel. Rozhodnutie bolo v prospech hiQ. LinkedIn bolo nariadené odstrániť všetky protiopatrenia brániace hiQ zo škrabania jeho (LinkedIn) webových stránok a tiež dať hiQ voľnú ruku, pretože zákon je úplne legálny. Sudca závisel na tom, že hiQ chce zoškrabať údaje, ktoré boli zobrazené pre verejnosť.

Sudca nielen nariadil žalovanému, aby odstránil všetky preventívne mechanizmy zavedené proti hiQ, ale nariadil aj žalovanému, aby sa v budúcnosti takýmto činom vzdal.

Podpora otvorených webových údajov

Aj keď je rozhodnutie stále dočasným súdnym príkazom, je potešujúce počuť, že zákon podporuje otvorené webové údaje a voľný prístup k informáciám na internete, čo toto rozhodnutie potvrdzuje. Aj keď konečné rozhodnutie prinesie prospech obžalovanému, táto skutočnosť už bola preukázaná.

Sudca presadzoval túto politiku zrušením prakticky všetkých argumentov LinkedIn. Zatiaľ čo sa LinkedIn snažil dokázať, že žalobca porušil svoje súkromie, sudca proti nemu namietal skutočnosť, že údaje predáva aj odporca.

Keď argument neobsahoval vodu, odporca tiež uviedol, že akt spoločnosti hiQ bol v hrubom rozpore so zákonom o počítačových podvodoch a zneužívaní (CFAA), pretože spustenie malo prístup k ich serverom na nezákonné získavanie údajov. Tento argument bol opäť prepichnutý. Bolo zamietnuté z dôvodu, že hiQ iba zoškrabával obsah na verejných nechránených stránkach.

Sudca prípad analogizoval ako niekto, kto chodil do obchodov v pracovnej dobe. O takomto človeku nemožno hovoriť, že sa dopúšťa priestupku. Takže hiQ sa nedotýkala. Je zaujímavé, že sudca išiel ďalej, aby vysvetlil, prečo je jeho rozhodnutie vo verejnom záujme.

Stručne povedané, súd uznal, že je vo verejnom záujme, aby bolo možné údaje prehľadávať, extrahovať a analyzovať. Bude preto škodlivou politikou podporovať umiestňovanie prekážok voľného toku informácií.

Čo by ste sa mali poučiť z vládnutia

Aj keď možno nemáte dôvody extrahovať údaje priamo z LinkedIn, mali by ste sa z rozhodnutia poučiť. Je lepšie hrať bezpečne čítaním a rešpektovaním súboru robots.txt na všetkých webových stránkach. Pamätajte, že rozhodnutie je stále dočasným príkazom. Nakoniec by to mohlo byť v prospech LinkedIn.

Aj keď rozsudok vás nemusí priamo ovplyvniť, je potešujúce, že federálny súd presadzuje politiku udržiavania webu otvorenú pre verejnosť. Informácie by preto mali byť dostupné a prístupné tým, ktorí ich môžu vyhľadávať a dobre ich využívať.

Webové údaje sú mimoriadne užitočné pre všetkých, najmä pre mediálnych analytikov, vývojárov, vedcov údajov a niektorých ďalších odborníkov. Toto rozhodnutie je preto vítaným vývojom.

mass gmail