Phân biệt Bot tốt và Bot xấu

Rate this post

Ở bài Bot Traffic là gì đã có giới thiệu về Bot Traffic và những tác động của nó đến website. Bài viết này sẽ làm rõ mục đích, cơ chế tấn công của bot cũng như cách phân biệt bot tốt và bot xấu.

Mục đích của bot

Bot là những chương trình cài đặt sẵn để thu thập dữ liệu, thực hiện các nhiệm vụ lặp đi lặp lại với độ chính xác và tốc độ cao. Thông thường bot dùng để lập chỉ mục cho website. Nhưng chúng còn có mục đích sử dụng khác như:

_ Tạo ra click ảo

_ Thu thập email trên các website

_ Tạo nội dung xấu hay còn gọi là spam nội dung

_ Lây lan virut độc hại

_Tạo các truy cập ảo

Có thể thấy tùy vào mục đích sử dụng, cách sử dụng bot mà ta phân chia ra hai loại bot tốt và bot xấu.

Phân biệt bot tốt và bot xấu

Như đã nói ở trên có hai loại bot: White Bot và Black Bot. Tuy nhiên cũng cần phân biệt được hai loại bot này khi nhìn vào báo cáo dữ liệu Referral. Nếu phân biệt nhầm và loại bỏ bot tốt, bạn có thể làm giảm lượng truy cập và không được Google lập chỉ mục.

phân biệt bot tốt bot xấu

Bot tốt (white bot)

Trước tiên, bạn cần phải biết rằng cả bot xấu và bot tốt đều có thể xuất hiện trong báo cáo Referral, làm mất chính xác dữ liệu. Thông thường bot tốt như Googlebot sẽ không gây ảnh hưởng tới dữ liệu, nó có thể không hiện trong Analytics nhưng truy cập từ những bot này vẫn sẽ được lưu trên máy chủ. Trong một số trường hợp, bot tốt sẽ gây xáo trộn dữ liệu một chút như việc bạn cài đặt event tracking code. Tìm hiểu thêm ở bài viết Giảm Bounce Rate hiệu quả bằng Event Tracking. Một đặc điểm nữa của bot tốt đó là chúng luôn tuân theo chỉ dẫn của robots.txt, tức là bạn có thể quản lý, chặn bot ra vào website một cách chủ động.

Spam bot

Khi bot xấu được sử dụng cho mục đích spam thì được gọi là spam bot. Spam bot đi qua hàng nghìn website mỗi ngày và gửi yêu cầu HTTP tới website cùng với địa chỉ URL giả mạo. Và chúng có khả năng “qua mặt” các phương pháp lọc spam của Google Analytics nên bạn thường thấy chúng trong báo cáo Referral.

Spam bot có một số đặc điểm chung, dễ phân biệt với bot tốt như tỉ lệ bỏ trang (Bounce Rate), % phiên mới (Session) luôn gần bằng hoặc bằng 100%, thời lượng truy cập (Visit Duration) bằng 0, số trang được xem bằng 1 hoặc nhiều hơn một chút không đáng kể.

Lưu ý với một số spambot sử dụng botnet (botnet hiểu là mạng lưới của những máy tính của người thật bị nhiễm virut độc hại được phân bổ theo khu vực, thậm chí toàn thế giới). Khi đó, spambot có thể truy cập website dưới hàng trăm địa chỉ IP, tạo ra lượng truy cập khổng lồ nhưng không có giá trị gì hết. Botnet càng lớn, mạng lưới càng rộng thì càng nhiều địa chỉ IP mà spambot có thể sử dụng. Do đó rất khó có thể chặn bằng tường lửa hay những cơ chế bảo mật thông thường khác. Ngoài ra, không phải tất cả spambot đều hiển thị trong báo cáo Referral. Một số spambot sử dụng botnet lại xuất hiện trong báo cáo Direct khiến chúng càng khó bị phát hiện hơn.

Bot cực kì xấu

Mục đích của bot loại này là để lây nhiễm virut khiến máy tính, website của bạn trở thành một phần trong botnet ví dụ như  Impersonator hoặc Hacking tool mà bài Bot Traffic đã đề cập. Có hàng nghìn máy tính trên thế giới sử dụng bởi người thật trở thành một phần của mạng lưới botnet. Vì vậy, nếu bạn muốn chặn một botnet, khả năng cao bạn sẽ chặn cả truy cập từ người thật. Lời khuyên đối với các nhà quản lý, SEOer là KHÔNG BAO GIỜ truy cập vào những liên kết hiện trong báo cáo Referral bị coi là spam để tránh bị trở thành “một con bot vô tri vô giác”.

phân biệt bot tốt bot xấu

Spambot thông minh

Một số spambot thông minh như darodar.com có thể gửi truy cập ảo đến website. Hoặc đối với trang dautuseo.com, spambot free-social-button lại gửi tỷ lệ bỏ trang (Bounce Rate) là 69,23%. Đương nhiên con số này là số ảo. Hoặc spambot có thể giả mạo các website nổi tiếng như bbc.co.uk. Gọi là thông minh bởi truy cập từ chúng không bị lưu lại trên dữ liệu máy chủ. Do đó bạn không thể chặn bằng địa chỉ IP, tổ chức ISP hay chặn trang giới thiệu.

phân biệt bot tốt bot xấu

Smartbot truy cập website bằng cách tìm kiếm mã theo dõi web (web property ID). Mã theo dõi web thường bị để trong các code theo dõi cố định của Google Analytics trên website nên smartbot có thể tìm thấy. Để phòng chống việc này, bạn nên sử dụng công cụ Google Tag Manager vì công cụ này giúp bạn cài đặt mã đo lường dễ dàng như Event Tracking Code mà không để lộ mã theo dõi web của bạn.

Không phải website nào cũng bị tấn công

Lí do bởi spambot được tạo ra để tấn công những website không có bảo mật, dễ bị tổn thương. Một khi chúng đã tìm được đối tượng, chúng sẽ tấn công thường xuyên. Do đó, cần lưu ý vấn đề bảo mật, sử dụng các phần mềm bảo vệ uy tín. Thêm vào đó, bạn nên thuê những nhà cung cấp máy chủ uy tín hay những phần mềm quản lý nội dung/giỏ mua sắm được nhiều người sử dụng đề phòng bị spambot tấn công.

Tác giả: Tuấn Anh – VietMoz SEO Junior
Ghi rõ nguồn www.dautuseo.com khi đăng tải lại bài viết này

Xem thêm các kiến thức SEO khác tại đường dẫn Kiến thức SEO

Danh mục bài viết có liên quan:

Bot Traffic là gìNgăn chặn spam trong Referral Traffic

Add a Comment

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *