Khi nào Google chậm hay dừng thu thập thông tin trên website?

Tại hội nghị  SMX East- nơi chia sẻ những kinh nghiệm thủ thuật hàng đầu về Seo, người phân tích của Google’s Webmaster Trends-Gary Illyes đã chia sẻ cho khán thính giả 2 kỹ thuật cơ bản Google xác định khi nào  GoogleBot, Crawler nên làm chậm hay dừng thu thập thông tin trên website. Đó là thời gian kết nối và các trạng thái phản hồi của máy chủ HTTP. Seo VietNam

Các tín hiệu thu thập thông tin của Google bao gồm thời gian kết nối và các trạng thái phản hồi của máy chủ HTTP

google-tools

Hôm nay tại hội nghị  SMX East, người phân tích của Google’s Webmaster Trends-Gary Illyes đã chia sẻ cho khán thính giả 2 kỹ thuật Google xác định khi nào  GoogleBot, Crawler nên làm chậm hay dừng thu thập thông tin trên website.

Một trong những yếu tố quan trọng hơn về SEO đó là đảm bảo việc thu thập thông tin từ các công cụ tìm kiếm có thể truy cập vào website của bạn. Nếu chúng không thể, website bạn sẽ gặp khó khăn khi xếp hạng trên kết quả tìm kiếm.

Google nói rằng họ còn sử dụng nhiều tín hiệu khác ngoài disavow, robots.txt và nofollow tags để xác định có nên dừng việc thu thập thông tin từ website của bạn hay không.

Gary đề cập đến 2 tín hiệu quan trọng sau:

Thời gian kết nối

Google xác định mất bao nhiêu thời gian để kết nối với máy chủ và trang web. Nếu thời gian kết nối diễn ra lâu, Google sẽ chờ, làm chậm lại hay dừng hẳn thu thập thông tin trên trang web của bạn. Google không muốn ngừng kết nối với máy chủ của bạn nên sử dụng thời gian kết nối như một nhân tố thu thập thông tin.

Trạng thái phản hồi của máy chủ HTTP

Google sẽ làm chậm hay dừng thu thập thông tin trên website nếu như họ nhận được trạng thái máy chủ ở dạng 5xx. Mã trạng thái 5xx Server Error có nghĩa rằng có một vài vấn đề xảy ra ở phản hồi củ máy chủ.Bạn có thể tìm hiểu thêm các danh sách này trên Wikipedia.

Google cho biết khi họ thấy các mã này, họ sẽ dừng kết nối với máy chủ của bạn để tránh gây ra thêm vấn đề nào nữa cho máy chủ.

ở 2 tín hiệu, GoogleBot sẽ xác định lại nhưng chỉ cần liên quan đến 2 tín hiệu trên, ngay lập tức Google sẽ dừng thu thập thông tin để không gây ra vấn đề nào nữa cho người dùng khi cố truy cập vào website của bạn.

Như vậy, thời gian kết nối và các trạng thái phản hồi của máy chủ HTTP là 2 yếu tố quyết định đến thu thập thông tin của Google trên website để hiển thị các kết quả tìm kiếm từ các truy vấn liên quan. Do đo, nhà quản trị web cần xác định 2 yếu tố này nhằm tháo gỡ các rào cản truy cập vào website, tạo cơ sở cho website nằm trên trang đầu tiên của Google. Seo Việt Nam

Nguồn: SearchEngineLand