6+1 tipp, hogyan rejtsd el az Email címed a botok elől

Csentes Zoltán    2020-05-10
elolvasom

Főoldal > ADOPS

Nagyon idegesítő tud lenni, hogy miután kiteszed a weboldaladra az e-mail címed, spam levelek tucatjait kezded el kapni. Ez azért van, mert rengeteg e-mail begyűjtő bot létezik az interneten, amiknek az a feladatuk, hogy összegyűjtsék az oldalakon elérhető e-mail címeket, majd később spam levelet küldjenek rá. Ebben a posztban bemutatom, hogyan működik egy ilyen script, és te hogyan nehezítheted meg a botok dolgát.

E-mail cím gyűjtő script működése

Hogy szemléltessem milyen egyszerű olyan scriptet írni, ami egy adott url-t megvizsgálva kigyűjti az oldalon található e-mail címeket, írtam egy ilyet:

See the Pen E-mail cím kigyűjtés by Csentes Zoltán (@csenty) on CodePen.

A fenti script Xpath használatával átnézi az oldal forráskódját a mailto: paramétert keresve, majd ha megtalálja, listázza a benne beállított e-mail címet.

Teszteld le te is:

  • nyisd meg a böngészőben a céloldalt
  • F12-vel lépj be DevTools-ba (chrome)
  • console fülön futtasd a fenti scriptet

Ugye milyen pofon egyszerű? A fenti script viszont csak akkor működik, ha az e-mail címet mailto: megoldással

<a href='mailto:...'>

építik az oldalba. De mi van akkor ha az oldalon nem használják ezt a megoldást, és csak simán szövegként van elhelyezve az e-mail cím?

Gyűjtsük ki a 44 hazai SEO szakember e-mail címét az ITE oldaláról

Ezen az oldalon az e-mail címek sima szövegként vannak betéve, tehát a feni script nem fog működni. Viszont ha egy kicsit átírjuk...

See the Pen E-mail cím kigyűjtés ITE oldalról by Csentes Zoltán (@csenty) on CodePen.

Máris listázhatjuk az összes e-mail címet:

SEO szakértők E-mail címének listázása ITE oldalról

Hát így működnek az email gyűjtő botok.

5+1 megoldás e-mail cím gyűjtő botok ellen

Ahogy a fenti példák mutatják, nagyon egyszerű olyan botot írni ami seperc alatt több millió e-mail címet gyűjt be nekünk. Ha nem szeretnéd, hogy a botok a te címedet is listázzák, akkor mutatok néhány megoldást, amivel megnehezítheted a dolgukat.

1. szöveges kiírás

minta: admin [kukac] ad-ops [pont] hu

Biztos te is találkoztál már azzal a megoldással, hogy a hagyományos beépítés helyett, szövegesen írják ki az e-mail cím speciális karaktereit. A válság miatt most webfejlesztőnek tanuló BKV ellenőrök által írt teszt botok ellen még hatásos is lehet ez a trükk.

Tény, hogy a legegyszerűbb botokon már ez is kifoghat, de ne legyünk naívak. Ha egy elterjedt mintát követ a cím, akkor semmibe se kerül úgy módosítani a scriptet, hogy helyettesítse a kukac és pont szavakat a megfelelő karakterrel.

2. unicode karakterek használata

minta: admin&#64;ad-ops&#46;hu

Egy másik ötletes módszer, amikor a speciális karaktereket ASCII formátumra alakítva tesszük a forráskódba. pl.

a @ -> &#64, a pont -> &#46
Ez a megoldás a botok nézőpontjából megint csak ugyanaz, mint az első pontban bemutatott verzió. A fejlettebb botok ezt simán kiolvassák.

3. Átalakítás hexadecimális karakterekké

minta: mailto:%61 %64 %6d %69 %6e %40 %61 %64 %2d %6f %70 %73 %2e %68 %75

Ha már karakterkódolás, akkor jó megoldás lehet az e-mail címet hexadecimális kóddá alakítani. Az interneten sok hexa átalakító oldalt találhatsz. A mailto részbe pedig a hexa kódot másold be. Ez már egy fokkal hatásosabb lehet, de semmibe se telik úgy átírni a scriptet, hogy ha a mailto részben több % karaktert lát, akkor az egész szöveget fordítsa le.

4. Kommentelés használata

minta: admin<!-- >@. -->@<!-- >kukac. -->ad-ops<!-- >pont. -->.<!-- >@. -->hu

A HTML nyelvben a kommentelésre használható karakterek kellően szétbarmolhatják az e-mail címünket az oldal forráskódjában e-mail címet kereső botok számára, viszont a látogatók ebből semmit sem vesznek észre. Minél több @ karaktert használunk a kommentben, annál hatásosabb a módszer.

5. CSS használata

minta: p span.rejt { display:none; }

admin@ad-ops

<span class="rejt">macilaci</span>.hu

Az oldal forráskódjában mégjobban szét tudjuk trollkodni az e-mail címet ha rejtett szöveget helyezünk el benne. Ez szintén csak a forráskódban látszik majd, a látogató ebből semmit se vesz észre, még másolni is tudja az e-mail címet.

6. Törlendő rész elhelyezése

minta: admin @EZTTOROLD ad-ops.hu

Amilyen egyszerű, olyan hatékony. Hátránya, hogy megfelelő IQ-val és tapasztalattal rendelkező látogatót feltételez, aki észreveszi a törlendő részt és ki is törli azt. Idős és más nyelvű célközönség esetében ez a megoldás problémás lehet...

+1. Beillesztés képként

minta:

E-mail cím képként beillesztve

Ebben az esetben az e-mail címet kép fájlként illesztjük az oldalba. Elég hatékony megoldás, mert bár a kép felismerő algoritmusok már elég fejlettek értelmezni egy képet, ez a módszer elég költséges és problémás lehet a botot írók számára. Ezért inkább nem is fektetnek ebbe energiát. Hátránya viszont, hogy csak akkor látszik, ha betölti a böngésző, és nem másolható ki a cím. (látáskorlátozottak számára problémás lehet)

Hasznosnak találtad? Oszd meg mással is:

Ez is érdekelhet:



Kíváncsi vagyok a Te véleményedre is:

Kérjen Google Analytics Auditot

Ne hagyja elveszni az értékes adatokat! Ha nem jól működik az Analitika lehetőséget és pénzt veszít. Kérjen Google Analytics auditot és átnézem a teljes fiók beállítását.