Cách chặn các bot spam không truy cập vào website

Tác giả: | Chuyên mục: Google Tools | Đăng ngày: 29/12/2016


Mất dữ liệu website! Sai lệch dữ liệu báo cáo từ Google Analytics! Lây lan nội dung độc hại! Tạo ra các click ảo! Đây là những hậu quả nghiêm trọng mà “kẻ thù” của website – bot spam mang lại khi nó xâm nhập vào website. Vì vậy, phải tìm cách chặn các bot spam truy cập vào website ngay lập tức!

1. Sự nguy hiểm khi bot spam truy cập vào website của bạn

Các công cụ tìm kiếm như Google tạo ra rất nhiều con bot truy cập đến các website để thu thập dữ liệu. Nhờ có các dữ liệu mới có cơ sở để đánh giá, phân loại website. Nhiệm vụ của chúng ta là mở rộng cửa và làm thông thoáng các lối đi để chúng tiếp cận thông tin một cách dễ dàng nhất.

Chặn bot spam trong Google Analytics

Các bot của Google thu thập dữ liệu một cách chính thống và có kỷ luật

Ngoài loại bot này, còn có những loại bot khác được tạo từ các cá nhân hoặc team nào đó, thâm nhập và thu thập dữ liệu trên website để phục vụ cho mục đích xấu. Từ đó chúng có thể hack website, spam email được cấu hình trong form liên hệ, hoang phí băng thông của hosting, sai lệch báo cáo của Google Analytics. Chúng ta gọi tên những con bot có hại này là bot spam. Chúng truy cập website, nhưng không tạo ra được một lợi ích hay ý nghĩa nào hết.

Bot của Google tuân thủ theo quy định của file robots.txt  trong website. File này được người thiết kế web hoặc người làm SEO tạo ra để cho các các con bot biết đâu là những nơi chúng được truy cập và thu thập dữ liệu.

Bot spam thì khác, chúng không tuân theo bất cứ quy định nào, chúng đến những nơi chúng muốn, lợi dụng hoặc hack những website kém bảo mật.

Hậu quả thứ nhất là người truy cập những website đó vô tình sẽ bị lây nhiễm những mã độc.

Chặn bot spam trong Google Analytics 1

Google cảnh báo website có bot spam

Hậu quả thứ hai, nặng nề hơn, Google dựa vào công cụ của mình có thể đánh giá một website có chứa mã độc hại không, nếu có, nó sẽ cảnh báo thông điệp “This site may be hacked” khi có người tìm kiếm. Vì thế, dù website lên top từ khoá, nhưng nếu người xem thấy thông điệp này, khả năng 100% họ sẽ không bấm vào coi.

Trong bài viết này chúng ta sẽ đi sâu vào cách làm sao biết website có đang bị dòm ngó bởi những con bot spam và cách để ngăn chặn chúng. Trợ thủ giúp chúng ta chính là Google Analytics.

2. Cách phát hiện website của bạn có bot spam

Đầu tiên hãy đăng nhập vào tài khoản Google Analytics của website. Chọn thời gian báo cáo là 2 tháng tính tới thời điểm hiện tại.

Chặn bot spam trong Google Analytics 2

Chọn thời gian xem báo cáo kết quả

Có rất nhiều cách để phát hiện. Nếu sau khi kiểm tra, bạn có 1 hoặc nhiều kết quả tương tự với bên dưới, chứng tỏ bạn website của bạn đang có bot spam truy cập.

  • Phát hiện 1: Có những trang lạ trên website.

Vào Behaviour –> Site Content –> Landing page

Đây là báo cáo lượng truy cập vào những trang con trong website. Nếu có những trang không hề tồn tại trong website nhưng vẫn được thống kê đây chính là những bot spam.

Chặn bot spam trong Google Analytics 3

Chặn bot spam trong Google Analytics 4

Nhấn vào để xem hình lớn

Những trang ảo mà thường gặp mà chúng tôi thống kê được là: sharebutton.to; 37668473-1.compliance-ivan.xyz….

  • Phát hiện 2: có những ngôn ngữ kỳ lạ

Vào Audience –> Geo –> Language

Đây là thống kê người truy cập website sử dụng ngôn ngữ gì. Vì vậy kết quả hay nhận được sẽ là vi (vietnamese), en (english), nếu xuất hiện những ngôn ngữ lạ sẽ là điều bất thường.

Chặn bot spam trong Google Analytics 5

Xuất hiện những ngôn ngữ lạ trong Google Analytics

  • Phát hiện 3: truy cập đột biến từ những vùng địa lý khác

Vào Audience –> Geo –> Location.

Chặn bot spam trong Google Analytics 6

Lượng truy cập ở Russia còn cao hơn cả Việt Nam

Đây là thống kê cho biết người truy cập ở đâu.

Một trang web tiếng việt, nhưng có lượng truy cập từ Nga còn nhiều hơn cả trong nước.

  • Phát hiện 4: Xuất hiện những từ khoá không liên quan

Vào: Acquisition –> All traffic –> Channels.

Trong Channels, bạn nhấn chọn Organic search

Đây là báo cáo cho bạn biết người truy cập website thông qua tìm kiếm từ khoá gì trên Google. Bất thường khi xuất hiện những từ khoá sau:

Chặn bot spam trong Google Analytics 7

Xuất hiện những từ khóa lạ trong Google Analytics

3. Chặn bot spam truy cập website

Cách 1: Chặn bằng bộ lọc spam bằng Cách sử dụng bot filtering

Cách 2: Chặn thủ công

Để bot spam không tiếp tục truy cập website nữa, chúng ta cần chặn chúng.

B1: Lấy danh sách web không tốt đang trỏ tới bạn.

Vào Audience –> Geo –> Location (vẫn giữ thời gian thống kê là 2 tháng). Sẽ xuất hiện danh sách các nước có người truy cập vào website của bạn. Chúng ta sẽ rà từng nước một.

Đầu tiên là từ Nga. Bấm chọn Russia.

Chặn bot spam trong Google Analytics 12

Chọn nước Nga để kiểm các bot spam

Danh sách các địa điểm cụ thể ở Nga hiện ra, bạn chọn Secondary Dimension. Trong phần tìm kiếm, bạn nhập Source và chọn Source/Medium.

Chặn bot spam trong Google Analytics 13

Chọn Source/Medium để xem những trang web có nguồn truy cập referral

Bây giờ bạn hãy xem xét danh sách website nằm ở cột Source/Medium và chỉ quan tâm đến những web có phần đuôi là /referral. Đây là những website từ Nga có trỏ link tới website bạn.

Chặn bot spam trong Google Analytics 14

Kiểm tra kết quả những website có nguồn referral

Hãy nhớ lại xem website của bạn hoạt động trong lĩnh vực gì, những website này có cùng lĩnh vực đó không, nếu không hãy copy tên miền và bỏ vào file để lưu trữ.

Ví dụ:

  • lifehacĸer.com
  • motherboard.vice.com
  • blackhatworld.com
  • abc.xyz

Tuyệt đối không bấm xem thử những web này, vì bạn có thể dính mã độc.

Sau đó bạn làm tương tự với United States

local-bot-spam-4

Sau khi đã tổng hợp được hết danh sách các trang web này, chúng ta đến bước thứ 2.

Bước 2: Đưa danh sách này cho người quản trị mạng, người thiết kế web hoặc người làm SEO nhờ họ dùng file .htaccess chặn những website này truy cập.

Cách 3: Chặn bot spam bằng bộ lọc Google Analytics

Trong Google Analytics bạn chọn Admin => Filter => Add Filter để bắt đầu tạo cho mình một bộ lọc mới.

Tạo bộ lọc mới để chặn các bot spam

Tạo bộ lọc mới để chặn các bot spam

Sau đó, bạn hãy điền thông tin của bộ lọc mà mình muốn tạo theo cách sau:

Chặn bot spam trong Google Analytics 8

Thêm thông tin cho bộ lọc

  • (1) Chọn Create New Filter.
  • (2) Đặt tên cho bộ lọc.
  • (3) Chọn Custom.
  • (4) Chọn Campaign Source.
  • (5) Điền địa chỉ website mà bạn muốn loại trừ. Nếu muốn loại trừ nhiều website hãy dùng dấu | để ngăn cách.
  • (6) Nhấn Save để lưu lại bộ lọc.

Cách 4: Bật tùy chọn loại trừ bot và spiders.

Vào Admin => View Settings => Tick vào mục Bot Filtering => Save.

Chặn bot spam trong Google Analytics 8

Bật chế độ lọc bot spam trong Google Analytics

Sau khi chặn, bạn sẽ thấy lượng truy cập trong Google Analytics giảm, nhưng đây mới chính là những truy cập thực chất và có ý nghĩa với bạn. Việc chặn bot spam sẽ không dừng lại tại đây, mà SEO VietNam khuyên bạn nên kiểm tra vài tháng một lần để đảm bảo không bị sai lệch dữ liệu trên Google Analytics. Để hạn chế tối đa bot spam truy cập vào website bạn nên trang bị kiến thức cơ bản về Google Analytics nhằm mục đích “phòng bệnh hơn chữa bệnh”.

Share:
Bài Viết mới nhất