Cách loại bỏ URL không mong muốn khỏi kết quả tìm kiếm Google

Google cung cấp cho bạn các công cụ để ẩn tạm thời URL, gỡ URL ra khỏi kết quả tìm kiếm trên Google.

Để sử dụng được công cụ của Google, bạn cần có tài khoản Google Webmaster tool (Google Search Console)

Mục lục bài viết

  1. Cách ẩn tạm thời URL bất kỳ trên trang kết quả của Google.
  2. Cách để Google không hiển thị những đường link không còn tồn tại trên website.
  3. Cách remove những URL bị hack đã được Google index.

 

1. Sử dụng Remove URL

Remove URL được sử dụng để ẩn tạm thời bất kỳ URL nào trên kết quả tìm kiếm của Google.

Một số người khi nghe thấy tên công cụ là “Remove URL” thì lầm tưởng đây là công cụ để loại bỏ URL hoàn toàn. Thực tế đây chỉ là công cụ giúp ẩn tạm thời.

remove-url-4

Google đã nói rõ chức năng của công cụ là: Temporarily remove (bấm vào để xem hình lớn)

a. Sử dụng remove URL khi nào?

  • Bạn phát hiện nội dung bạn up lên website có chỗ sai, và bạn cần ẩn tạm thời trên Google để sửa và tránh có người tiếp tục tìm đọc thông tin.
  • Website của bạn bị Google đánh giá thấp do nội dung trùng lặp hoặc có chất lượng kém. Bạn cần ẩn một thời gian để sửa lại nội dung, sau đó sẽ nhờ Google thu thập lại dữ liệu.

# Không nên sử dụng Remove URL để:

  • Dọn dẹp các page cũ bị not found: sau khi chỉnh sửa hoặc thiết kế lại website, chắc chắn sẽ xuất hiện những URL không còn tồn tại. Tuy nhiên đừng lo lắng, vì trong quá trình Google thu thập dữ liệu, những URL 404 sẽ dần dần bị loại khỏi kết quả tìm kiếm của Google.
  • Sử dụng sau khi web của bạn bị hack: sau khi website của bạn bị hack, chắc chắn sẽ có khá nhiều URL xấu đã được Google index. Đừng sử dụng công cụ ẩn tạm thời này, mục thứ ba của bài viết này sẽ hướng dẫn bạn cách sửa.

b. Cách sử dụng Remove URL

B1:  Đăng nhập tài khoản Google webmaster tool và vào trang https://www.google.com/webmasters/tools/url-removal

remove-url-1

B2: Nhấn vào “Please select a property”, và chọn website bạn muốn thực hiện remove URL. Xuất hiện màn hình Remove URL.

remove-url-2

(bấm vào để xem hình lớn)

B3: Nhấn vào Temporarily hide.

B4: Nhập URL mà bạn muốn ẩn, và nhấn Continue.

B5: Chọn một trong các lựa chọn sau:

  • Temporarily hide page from search results and remove from cache: ẩn nội dung đó khỏi kết quả tìm kiếm của Google trong vòng 90 ngày, đồng thời xoá cache và snippet. Trong khoảng thời gian này, Google vẫn thu thập dữ liệu  và sẽ làm mới lại bản cache và snippet. Sau 90 ngày, nội dung đó sẽ xuất hiện trở lại trên kết quả tìm kiếm.
  • Remove page from cache only:  xoá cache và snippet của nội dung, nhưng không ẩn trong kết quả tìm kiếm. Google sẽ làm mới cache và snippet của nội dung.
  • Temporarily hide directory: ẩn toàn bộ danh mục khỏi kết quả tìm kiếm của Google trong vòng 90 ngày, đồng thời xoá cache và snippet. Trong khoảng thời gian này, Google vẫn thu thập dữ liệu  và sẽ làm mới lại bản cache và snippet. Sau 90 ngày, nội dung đó sẽ xuất hiện trở lại trên kết quả tìm kiếm.

B6: Nhấn Submit Request. Yêu cầu của bạn cần khoảng 1 ngày để được Google đáp ứng. Tuy nhiên có một số trường hợp yêu cầu bị từ chối. Nhớ quay lại kiểm tra status của yêu cầu. Nếu xuất hiện chữ “denied”, hãy bấm vào “Learn more” để xem lý do.

# Để tắt Remove URL

Nếu bạn muốn tắt remove URL trước 90 ngày. Bạn nhấn vào “Reinclude”. Yêu cầu sẽ mất vài ngày để có hiệu lực.

remove-url-3

(bấm vào để xem hình lớn)

c. Hiểu lầm về Remove URL

Remove URL không làm thay đổi lịch thu thập dữ liệu của Google bot. Vì URL đó vẫn tồn tại, và không được chặn (ví dụ không bị chặn bởi thẻ noindex).

Bởi vậy, nội dung của bạn sẽ được thu thập, và xuất hiện trên trang kết quả tìm kiếm sau khi 90 ngày kết thúc.

Nếu Google bot không thể tiếp cận URL của bạn, Google sẽ cho rằng nội dung đó không còn và yêu cầu remove URL của bạn sẽ kết thúc.

# Để loại bỏ nội dung hoặc URL khỏi Google hoàn toàn, bạn có thể làm theo 1 trong các cách sau:

  • Xoá nội dung đó, lúc này khi Google vào URL, server sẽ trả về thông báo 404.
  • Chặn truy cập, ví dụ như bắt phải nhập password.
  • Chặn index bằng thẻ noindex.

2. Sử dụng Remove outdated content

Đây là nơi bạn yêu cầu Google loại bỏ những link bạn đã xoá khỏi source website nhưng vẫn còn hiển thị trên kết quả tìm kiếm.

– Vào đường link: https://www.google.com/webmasters/tools/removals

remove-url-6

– Nhập URL vào khung và nhấn Request Removal.

– Lúc này Google sẽ tiến hành đánh giá URL đó.

– Google sẽ xác nhận URL không còn tồn tại trên website.

– Bạn yêu cầu Google loại bỏ những link này bằng cách nhấn vào nút “Request Removal”.

remove-url-7

3. Remove URL những link bị hack đã được Google index

Sẽ thật không may khi website của bạn bị hack, và những link spam đó đã được Google index. Hãy thực hiện theo những bước sau để đẩy nhanh thời gian loại bỏ các URL đó.

B1: Dọn sạch source và link bị hack, bằng cách restore lại source và database cũ, hoặc nhờ bên thiết kế website hỗ trợ.

B2: Kiểm tra các URL bị hack đã được index. Vào google và search từ khoá:

site:[tên miền website]

Ví dụ: site:gobranding.com.vn

Kết quả sẽ liệt kê các URL đã được Google index, hãy rà xem các URL bị hack có xuất hiện trong danh sách đó không, nếu có hãy tiếp tục các bước sau.

B3: Submit lại sitemap

Sitemap là file chứa các danh sách các bài viết của bạn trên website. Submit lại sitemap để Google thu thập lại những URL đúng của website.

Vào Google webmaster tool –> Crawl –> Sitemap –> Nhấn Resubmit

remove-url-5

B4: Sử dụng Remove outdated content như mục 2 của bài viết.

B5: Sử dụng fetch as Google

Hacker có thể hack website của bạn rất nhiều kiểu: up thêm source, thay đổi code….

Đối với những source xấu, bạn có thể rà và xoá đi, nhưng thay đổi code thì đây là lỗi rất khó phát hiện. Nếu chỉ nhìn bằng mắt thường kiểm tra giao diện bên ngoài website thì sẽ không thể thấy được.

Google cung cấp công cụ Fetch as Google, cho phép bạn biết được dưới con mắt của Google bot trang web đó sẽ hiển thị như thế nào.

Ví dụ: một website của một nhạc sĩ nổi tiếng bị hack, người quản trị sau khi kiểm tra mọi thứ, đã thông báo với Google rằng website đã được dọn sạch. Tuy nhiên Google báo lại web vẫn bị hack, bằng chứng là khi sử dụng Fetch as Google bot, sẽ thấy có một đoạn code được chèn vào website là:

<title>Generic synthroid bad you :: Canadian Pharmacy</title>

Vào Google webmaster tool –> Crawl –> Fetch as Google, và tiến hành kiểm tra

Trang Lê