Využívání obsahu na internetu – mýty a přání vydavatelů

V dubnu 2012 podepsalo pět velkých vydavatelství dokument s názvem Co se smí a nesmí při využívání obsahu na internetu. Tento dokument si vydavatelé ušili sami sobě na míru a je vydáván jako „release candidate“ verze, připravená k dalším připomínkám. Jelikož jsem v celé věci zainteresován (moje firma provozuje zpravodajský agregátor pravednes.cz), rozhodl jsem se na dokument reagovat a upozornit na některé jeho nedostatky. Základním problémem dokumentu je, že se od začátku tváří jako „správný výklad“ zákona a působí dojmem, že informuje méně znalé uživatele internetu, co je správně v oblasti využívání cizího obsahu. Text je prošpikován výrazy, jako „zákony umožňují“ nebo „pokud někdo dělá …, tak porušuje zákony„, atd. Nelze si však nevšimnout, že chybí jakákoliv citace, jakýkoliv paragraf nebo cokoliv, o co se dají podobná tvrzení opřít. Místy je tedy potřeba podobné zmínky interpretovat, jako „přání otcem myšlenky“. Osobně se domnívám, že považovat linkování na obsah s použitím titulku jako nelegální, je nepravdivé a zavádějící. I když jsem se snažil, nikdy se mi nepodařilo objevit nezávislou analýzu, která by tvrzení autorů a nelegálnosti linků potvrzovala. Pokud taková analýza existuje, sem s ní. Připouštím, že mohla být v únoru nějaká novela, o které se neví. Řekl bych, že nejdůležitější pravidlo je v preambuli celéko dokumentu. Co nechceš, aby ti jiní činili, nečiň ty jim. Samo o sobě jistě nepomůže, protože funguje jen na lidi s určitým morálním standardem. Je chvályhodné se o ochranu obsahu na internetu nějakým způsobem snažit. Je jasné, že není možné tvořit nový obsah na síti pomocí copy & paste. Naprosto souhlasím s tím, že by se mělo poctivě citovat a rozumně parafrázovat. Není možné, aby se někdo živil jako autor tím, že vezme 3 články na jedno téma a udělá z nich svůj vlastní tak, že z každého originálu něco vytrhne. Vznikne jakýsi remix a takový tvůrce už není autorem, ale zpravodajským DJem. Autoři pravidel se dále snaží zavádět koncept, který si možná vypůjčili z oblasti boje proti drogám. Snaží se prosadit jakési „větší než malé množství linkování„. Podle jejich představ je jeden osamocený hyperlink naprosto OK, ale pokud je těch linků hodně a jsou prováděny pravidelně, najednou se údajně porušuje zákon. Tento koncept je dle mého názoru naprosto smyšlený (opět se rád nechám přesvědčit o opaku). Když někomu seberete propisku, tak je to nelegální bez ohledu na to, kolik těch propisek bylo. Jestliže je jeden link legální, musí být legální i tisíc. Pro matematiky: 1000 x legální = legální … nelegální / 1000 = nelegální. V dokumentu se mluví o tzv. linkomatech, čímž jsou myšleny webové služby, které hromadně pracují s linky na články nebo jiný obsah. Do této kategorie musí padnout všechny zpravodajské agregátory (jako i naše pravednes.cz), ale nevyhnutelně i třeba Google, domácí Seznam nebo i spousta mobilních aplikací a RSS čteček. Tyto služby jednoznačně autoři staví mimo zákon. I kdybychom připustili, že opakované linkování je problematické, tak je třeba si uvědomit, že na „udělování souhlasu“ už dnes existuje průmyslový standard s názvem robots.txt. To je soubor, který je v kořenovém adresáři serveru a povoluje nebo zakazuje robotům procházet obsah webu a shromažďovat linky na jeho stránky. Za těch několik let kultivování internetu je toto „usazená“ metoda. Máme tu dva velmi praktické důvody, proč je robots.txt tím správným řešením:

  1. Většina serverů chce mít linky na svůj obsah (SEO).
  2. U služeb, jako vyhledávače a agregátory není technicky proveditelné (v rozumném čase) se explicitně každého zeptat na svolení.
Jak je vidět, vydavatelé mají plnou kontrolu nad tím, jestli mohou linkomaty odkazovat na jejich články. Z nějakého důvodu však tuto možnost nevyužívají a snaží se obracet zavedený koncept: místo „co není zakázáno je dovoleno“ na „co není dovoleno je zakázáno„.

 

Google - vyhledání článku
Vyhledání článku na Google

 

Právě dnes - nalezený článek
Vyhledání článku na PrávěDnes.cz

 

Vyhledání článku na Seznam.cz
Stejný článek vyhledán přes Seznam.cz

 

Vyhledání článku na Bing.cz
Stejný článek vyhledán přes Bing

V oblasti hyperlinků se vydavatelé snaží řešit už dávno vyřešené. Tuším, proč to chtějí dělat. Současný internet je totiž brutálně demokratický v tom, že malý blogger má úplně stejnou šanci být na první stránce „linkomatu“, jako velké vydavatelství. Vydavatel tak ztrácí výhodu kapitálu. Ve skutečnosti mu nevadí, že Google nebo kdokoliv jiný linkuje na jeho články, ale vadí mu, že Google linkuje i na články jeho konkurentů (často menších a chudších). Část dokumentu, která se věnuje hyperlinkům není ani tak o přebírání nebo zneužívání obsahu, ale spíš o jeho distribuci. Velcí vydavatelé novin přestali tuto oblast kontrolovat stejně, jako vydavatelé hudby. Chtěli by ji zpět, ale argumentovat nelegálností linkování je špatný způsob. Na to už je svět někde jinde. Vše je zaindexované a dostupné přes fulltext. Celý internet je na hyperlinku postaven. Bez hyperlinků by internet nebyl. Bylo by to jen obrovské úložiště dokumentů. Bez použití titulku cílové stránky by linkování mohlo vypadat takto nebo takto, případně možná takto. Obávám se, že vědět na co klikám, je hodně praktický prvek a těžko jej znemožnit. Přečtěte si třeba toto a ještě toto. Před tím, než začnu být konstruktivní a poskytnu i nějaké návrhy, bych se ještě rád zmínil o části dokumentu, která se zabývá reklamou. Autorům vadí, že provozovatelé služeb jako jsou tvz. linkomaty, umisťují na své stránky reklamu. Z nějakého důvodu by toto mělo být vnímáno jako nekalá soutěž. Tak předně, žádný linkomat s vydavatelem nesoutěží. Oba podnikají v úplně jiné oblasti. Např. Google poskytuje globální vyhledávání a nepíše regionální zprávy. Linkomaty se snaží dělat nadstavbovou službu, kterou sám jediný vydavatel nemůže realizovat. Na realizaci služby vynaložily nemalé prostředky a je to služba, kterou internetová populace vyžaduje. Reklama na těchto projektech tudíž není parazitování na cizím obsahu, ale odměnou za realizaci a provoz nové (dříve neexistující) služby (vyhledávače, agregátoru, atd.). A teď konstruktivní návrhy

  1. Rozlišovat skutečné přebírání obsahu (kdy vzniká nové dílo nebo se tak přebíratel tváří) a odkazování, kdy je smyslem „odeslat“ uživatele internetu na originál.
  2. Akceptovat exitující standard robots.txt – pro zakazování (nepovolování) indexace obsahu.
  3. Jasně rozlišit, co je zákon, co etika (kodex) a co přání té které strany.
  4. Zamést si před vlastním vydavatelským prahem. Např. vkládání videa z jiných serverů. Např. monitoring sociálních sítí, kdy společnost (jako třeba Newton Media – patrně propojená s ČTK) bez svolení přebírá texty z Facebooku nebo Twitteru a ekonomicky zhodnocuje.
Tomáš Bleša
Programuju v Javě, podnikám (anneca.cz), mám rád tech.hračky, maso, chytré debaty, nové úhly pohledu, doutníky, whisky a lidi, co se moc nežerou.

komentáře 3

  1. Mno vidíte, a mě kdysi mimosoudně donutili zaplatit nekřesťanský peníze (desítky tisíc) za to že jsem na ně (a další) hromadně linkoval a používal náhledy jako vy.
    Neměl jsem nervy na to 3x denně zvedat výhružné telefony a vybírat obálky s pruhy a s vylhanými fakturami – radši jsem zaplatil výpalný a měl klid – nepřeju to nikomu a Vám držím palce.

  2. Jedna technická na okraj – článek ukazuje celkem rozšířené nepochopení robots.txt. To totiž vůbec neslouží k „zakazování (nepovolování) indexace obsahu“. A už vůbec ne k „povolování nebo zakazování shromažďovat linky na stránky“.

    Na smyslu a vyznění článku to samozřejmě nic nemění, ale robots.txt není tím nástrojem, který hledáte, protože prostě k ničemu takovému neslouží a takhle zamýšleně vůbec nefunguje.

    1. Tak já myslím, že specifikace robots.txt se vůbec nezabývá motivy proč to vlastně web zakazuje. Jasně, že to může být z různých důvodů (dynamické skripty, archiv, junk, …). Nicméně, když web vloží řádek Disallow: /article/, tak to má žádaný efekt pro roboty a žádný efekt na ruční linkování.
      Souhlasím ale s tím, že to není ideální nástroj. Nicméně to nebrání tomu, aby vznikla nějaká konvence speciálně pro tento účel. Např.
      – zvláštní soubor links.txt
      – rozšíření RSS o nějaký tag
      – vložení do hlavičky článku
      Jde to vymyslet. Jde mi hlavně o tu podstatu, že z ryze praktických důvodů, které jsem uvedl, by měl tvůrce webu zakazovat indexaci spíš než očekávat, že se bude někdo ptát.
      BTW, nevidím rozdíl mezi indexací a shromažďováním linků, protože indexace bez toho, abyste měl link, ztráci smysl.

Napsat komentář

Vaše emailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *