Loại bỏ kết quả cũ, sai trên Google Search Index

07/01/2026  |  Đinh Tiến Vũ
Google Search Index Removal

Trong quá trình quản hành website, không ít lần chúng ta cần gỡ bỏ các bài viết cũ, nội dung không còn chính xác hoặc các trang rác phát sinh ngoài ý muốn. Tuy nhiên, việc chỉ xóa bài viết trên website là chưa đủ, vì thông tin vẫn có thể tồn tại trên bộ nhớ đệm (cache) và kết quả tìm kiếm của Google trong một thời gian dài.

Tại sao cần xóa kết quả tìm kiếm nhanh chóng?

  • Bảo mật thông tin: Gỡ bỏ các trang lộ dữ liệu hoặc thông tin nhạy cảm.
  • Trải nghiệm người dùng: Tránh việc người dùng truy cập vào các liên kết hỏng (Broken links).
  • SEO: Tập trung sức mạnh (link juice) vào các nội dung chất lượng, tránh "pha loãng" index bởi các trang kém chất lượng.

410 Gone vs 404 Not Found: Sự khác biệt mấu chốt

Đây là điểm mà nhiều Webmaster thường nhầm lẫn. Cả hai đều báo hiệu trang web không tồn tại, nhưng cách Googlebot xử lý chúng lại rất khác nhau:

  • 404 Not Found: Google hiểu là trang web không tìm thấy. Tuy nhiên, Googlebot sẽ nghĩ "Có thể trang này chỉ bị lỗi tạm thời" và sẽ quay lại kiểm tra thêm vài lần nữa trước khi thực sự gỡ bỏ khỏi index.
  • 410 Gone: Đây là thông báo "Trang này đã biến mất vĩnh viễn". Khi nhận mã 410, Googlebot sẽ hiểu ngay lập tức và tiến hành gỡ bỏ kết quả khỏi Search Index nhanh hơn rất nhiều so với 404.

Cách thiết lập mã 410 Gone

Bạn có thể cấu hình thông qua file .htaccess (Apache) hoặc file cấu hình Nginx.

Dành cho Apache (.htaccess)

# Chuyển hướng một URL cụ thể sang 410
Redirect gone /duong-dan-bai-viet-cu/

# Hoặc dùng RewriteRule
RewriteEngine On
RewriteRule ^duong-dan-bai-viet-cu/ - [L,R=410]

Dành cho Nginx

location /duong-dan-bai-viet-cu/ {
    return 410;
}

Dành cho Vercel (vercel.json)

Nếu bạn sử dụng Vercel, bạn có thể cấu hình trong file vercel.json như sau:

{
    "routes": [
        {
            "src": "^/(app|shop-yjf|hot|shop-nxp)(/.*)?$",
            "dest": "/404.html",
            "status": 410
        }
    ]
}

Kết hợp với robots.txt

Để đảm bảo Googlebot không phí tài nguyên crawl các trang đã gỡ bỏ, bạn nên chặn chúng trong file robots.txt:

User-agent: *
Disallow: /app/
Disallow: /shop-yjf/
Disallow: /hot/
Disallow: /shop-nxp/

Mẹo nhỏ: Nếu bạn có hàng loạt URL cần xóa, hãy tập hợp chúng vào một danh sách và sử dụng Regex trong file cấu hình để xử lý hàng loạt, giúp tiết kiệm thời gian đáng kể.

Luôn thiết lập trang 404 chất lượng

Dù bạn sử dụng 410 để xóa nhanh kết quả cũ, việc có một trang 404 được thiết kế tốt vẫn là bắt buộc. Trang 404 không chỉ giúp giữ chân người dùng khi họ gõ sai URL mà còn cung cấp các lựa chọn điều hướng hữu ích như: quay lại trang chủ, danh sách dịch vụ, hoặc thanh tìm kiếm.

Một trang 404 "Sang - Sáng - Thoáng" sẽ giúp website của bạn trông chuyên nghiệp hơn ngay cả khi người dùng gặp lỗi.

Hy vọng thủ thuật nhỏ này sẽ giúp bạn quản lý Google Search Index hiệu quả hơn!