Semalt เปิดเผยแนวทางในการลบ Traffic ปลอมจากเว็บไซต์ของคุณ

สแปมอ้างอิงเป็นผลิตภัณฑ์ของสแปมบอทที่ส่งปริมาณการใช้งานปลอมไปยัง Google Analytics โดยตรงจึงปรากฏในรายงานปริมาณการใช้ที่สร้างขึ้น ดำเนินการเพื่อลบสแปมอ้างอิงถ้าคุณพบพวกเขาในรายงาน GA เพื่อให้ได้สถิติที่ถูกต้องสำหรับเว็บไซต์

Artem Abgarian ผู้จัดการอาวุโสที่ประสบความสำเร็จของลูกค้าของ Semalt Digital Services แบ่งปันประเด็นที่เป็นประโยชน์ในเรื่องนี้

บอทคืออะไร

บอทคือโปรแกรมที่พัฒนาขึ้นเพื่อดำเนินงานซ้ำ ๆ อย่างรวดเร็วและแม่นยำ บอตถูกออกแบบมาเพื่อทำดัชนีหน้าแรกในอินเทอร์เน็ตโดย เครื่องมือค้นหา ผู้ที่มีเจตนาร้ายใช้การบอทในช่วงหลายปีที่ผ่านมาเพื่อช่วยพวกเขาในการฉ้อโกงด้วยการคลิกโอนเนื้อหาของไซต์แจกจ่ายมัลแวร์สะสมที่อยู่อีเมล

บอทที่ปลอดภัยและเป็นอันตราย

ตัวอย่างของบอทที่ดีคือ Googlebot ซึ่งรวบรวมข้อมูลและจัดทำดัชนีหน้าเว็บสำหรับผู้ใช้ บอตค้นหาไม่เรียกใช้ JavaScript (ส่วนใหญ่) อย่างไรก็ตามผู้ที่ใช้มันพบว่าตัวเองปรากฏในรายงาน GA ซึ่งอาจส่งผลกระทบต่อการแสดงเมตริก หากพวกเขาไม่ได้เรียกใช้ JavaScript ก็จะไม่มีผลกระทบต่อรายงาน แต่จะปรากฏในบันทึกของเซิร์ฟเวอร์ อย่างไรก็ตามอาจส่งผลกระทบต่อความเร็วในการโหลดเนื่องจากใช้ทรัพยากรของเซิร์ฟเวอร์ บอทที่ปลอดภัยเป็นไปตามคำสั่งที่มีอยู่ใน robots.txt ในทางกลับกันบ็อตที่เป็นอันตรายจะใช้กลยุทธ์ต่าง ๆ เพื่อแทนที่แนวทางเหล่านี้

บอทสแปม

วัตถุประสงค์หลักของพวกเขาคือการเยี่ยมชมเว็บไซต์ให้ได้มากที่สุดและส่งสแปมด้วยส่วนหัวของผู้อ้างอิงใบหน้าเพื่อหลีกเลี่ยงการตรวจจับ ส่วนหัวของผู้อ้างอิงปลอมฝังลิงค์เปลี่ยนเส้นทางไปยังไซต์ที่พวกเขาต้องการโปรโมต คำขอ HTTP จากบอตดังกล่าวปรากฏในบันทึกของเซิร์ฟเวอร์และจัดทำดัชนีโดย Google มันทำหน้าที่เป็นลิงก์ย้อนกลับไปยังเว็บไซต์เมื่อมันปรากฏในบันทึกของเซิร์ฟเวอร์ Google ได้ทำการเปลี่ยนแปลงอัลกอริทึมของพวกเขาที่จะไม่สร้างดัชนีข้อมูลจากบันทึกของเซิร์ฟเวอร์ดังนั้นจึงเป็นการขัดขวางความพยายามของนักพัฒนาสแปมบอท บอทสแปมที่ดำเนินการโดย JavaScript สามารถสร้างทางผ่านตัวกรอง GA ซึ่งเป็นสาเหตุที่พวกเขาสะท้อนในรายงาน

บ็อตเน็ต

Botnets ประกอบด้วยคอมพิวเตอร์ที่ติดเชื้อหลายตัวเพื่อสร้างเครือข่ายที่ควบคุมโดยผู้ส่งสแปม มันใช้ IP ที่แตกต่างกันเพื่อโจมตีเว็บไซต์เดียว ยิ่ง botnet มีขนาดใหญ่เท่าใดอัตราการแทรกซึมก็จะยิ่งสูงขึ้นเท่านั้น ทราฟฟิกจากบ็อตเน็ตจะปรากฏเป็นทราฟฟิกโดยตรงเนื่องจากมาจากคอมพิวเตอร์เครื่องอื่นทำให้ตรวจจับได้ยากขึ้น การบล็อกอย่างใดอย่างหนึ่งจะไม่ได้รับผลกระทบมากเท่าที่อื่นจะเกิดขึ้น

บอทสแปมที่เป็นอันตรายสูง

วัตถุประสงค์หลักของพวกเขาคือการรับสมัครคอมพิวเตอร์เพื่อเป็นส่วนหนึ่งของบ็อตเน็ตโดยติดมัลแวร์ คอมพิวเตอร์จะถูกใช้เพื่อแจกจ่ายมัลแวร์เดียวกันไปยังคอมพิวเตอร์เครื่องอื่น การบล็อกบ็อตเน็ตสามารถยับยั้งการรับส่งข้อมูลจากผู้เยี่ยมชมจริง การเปลี่ยนเส้นทางที่น่าสงสัยจากรายงานปริมาณผู้อ้างอิงส่วนใหญ่นำไปสู่เว็บไซต์ที่ติดมัลแวร์เหล่านี้ หลีกเลี่ยงการคลิกลิงค์ดังกล่าวเว้นแต่จะมีซอฟต์แวร์ป้องกันมัลแวร์ติดตั้งอยู่หรือคอมพิวเตอร์แยกต่างหาก

บอทสมาร์ทสแปม

เว็บไซต์เหล่านี้ส่งปริมาณการใช้งานไปยัง Google Analytics โดยใช้รหัสติดตามร่วมกับรหัสไซต์ นอกจากนี้ยังรวมถึงผู้อ้างอิงปลอมในรายงานปริมาณการใช้งานซึ่งอาจไม่น่าสงสัย กิจกรรมของพวกเขาจะไม่ปรากฏในบันทึกของเซิร์ฟเวอร์และไม่มีทางปิดกั้นพวกเขาเพราะพวกเขาส่งข้อมูลตรงไปยังเครื่องมือวิเคราะห์ คนที่ไม่ใช้ Google Tag Managers จะมีรหัสติดตาม GA บนเว็บไซต์ซึ่งทำหน้าที่เป็นตัวระบุคุณสมบัติของเว็บไซต์ Google เครื่องจัดการแท็กเป็นเครื่องมือที่มีประสิทธิภาพในการลบสแปมผู้อ้างอิงในกรณีนี้ สแปมบอทส่วนใหญ่โจมตีไซต์ที่เต็มไปด้วยช่องโหว่ในซอร์สโค้ดหรือที่มีมาตรการรักษาความปลอดภัยที่ จำกัด

ตรวจจับแหล่งสแปม

ไปที่รายงานปริมาณการใช้งานของ Google และใช้อัตราตีกลับเป็นองค์ประกอบการเรียงลำดับจากมากไปหาน้อย ผู้ที่มีอัตราตีกลับ 100% หรือ 0% น่าจะเป็นสแปม อีกวิธีหนึ่งคือรายการผู้ส่งอีเมลขยะที่จัดตั้งขึ้นแล้วที่คุณสามารถเปรียบเทียบได้โดยไม่ต้องทำการวิเคราะห์ด้วยตนเอง ขั้นตอนต่อไปคือการบล็อกพวกเขา

ตรวจสอบให้แน่ใจว่าได้สร้างสัญกรณ์บนกราฟของรายงานที่อธิบายว่ามีปริมาณการใช้งานมากในเวลานั้น

1. ใช้เอ็นจิ้นเขียนซ้ำสำหรับไฟล์. htaccess และใช้ความสามารถของ Spambot เพื่อลบสแปมอ้างอิงโดยทำการเปลี่ยนแปลง หากแน่ใจเกี่ยวกับที่อยู่ IP ที่สแปมบอทใช้ให้รวมไว้ในรหัสและปฏิเสธการเข้าถึง ความสามารถนี้สามารถใช้เพื่อบล็อกช่วงของที่อยู่ IP ทำเช่นนี้ต่อเมื่อคุณแน่ใจว่าสแปมบอทใช้ที่อยู่ IP หลายแห่งเพื่อดำเนินการเพียงครั้งเดียว นอกจากนี้ยังป้องกันไม่ให้ผู้ใช้รู้จักใช้สแปมบอท

2. Bot Filtering Feature: ทำเครื่องหมายในช่องที่แจ้งให้ยกเว้นบ็อตและสไปเดอร์ที่รู้จัก

3. Monitor Server Logs: ทำให้บ็อตตกใจโดยไปที่ไซต์เป็นประจำ ใช้ไฟร์วอลล์เพื่อป้องกันคอมพิวเตอร์จากพื้นที่เสมือนโดยการกรองแหล่งข้อมูลบนเว็บจากสแปมบอท

4. ผู้ดูแลระบบควรอยู่ในตำแหน่งที่จะให้ความช่วยเหลืออย่างมืออาชีพ

5. รหัส ItSAlive ช่วยป้องกันไม่ให้ตัวชี้วัดจาก Google และ Yandex ถูกรบกวนจากสแปมบอท

6. Google Chrome สามารถตรวจจับมัลแวร์และเหมาะสำหรับการเรียกดูหากไม่มีไฟร์วอลล์

7. การแจ้งเตือนผู้ใช้เป็นการแจ้งเตือนส่วนบุคคลจาก Google ซึ่งแจ้งเตือนเมื่อมีการจราจรติดขัดที่ไม่คาดคิด

8. ตัวกรอง Google Analytics สร้างตัวกรองใหม่ในส่วนมุมมองของแท็บผู้ดูแลระบบใน GA