Xử lý lỗi 404 Not Found
Bạn đã thay đổi tên một trang trong website hoặc đã xóa bỏ một trang nhưng Google vẫn cached đường dẫn đó. Khi người dùng truy cập vào địa chỉ này sẽ xuất hiện lỗi 404 không tìm thấy trang. Việc này khiến website của bạn bị mất một lượng truy cập vì khi không tìm thấy trang nhiều khả năng người dùng sẽ truy cập vào một site khác, hơn nữa việc xuất hiện nhiều trang lỗi 404 trên website của bạn sẽ ảnh hướng đến thứ hạng của website cũng như sự xuất hiện ưu tiên trên kết quả tìm kiếm của Search Engines. Có rất nhiều cách để xử lý lỗi này hiệu quả.
Trước tiên bạn nên add website của mình vào Google Webmaster Tools để dễ dàng nhìn thấy những trang báo lỗi 404 trong phần ‘Crawl errors’. Và dưới đây tôi sẽ lần lượt giới thiệu đến bạn các cách xử lý lỗi 404.
1) Bạn có thể tạo ra trang thông báo lỗi 404 một cách tùy biến, việc này có thể làm được trong Cpanel của Host. Trên trang này hãy chỉ rõ thông tin lỗi và hướng người dùng đến trang thay thế hoặc trang chủ.
2) Nếu lỗi 404 sinh ra do bạn đã thay đổi đường dẫn của trang web, hãy redirect 301 tới địa chỉ mới. Việc này bạn có thể edit trong file .htaccess đối với PHP.
3) Bạn cũng có thể không cho Google index những trang lỗi 404 này bằng cách edit trong file robots.txt.
4) Và một cách đơn giản là trong Google Webmaster Tools bạn hãy sử dụng công cụ Remove URL và thêm vào đó những địa chỉ cần loại bỏ.
Nguồn : ddth
—————————–
Xử lý Crawl Errors với Google Webmaster Tools
Các webmasters luôn mong muốn được các SE Crawler và index vào site càng nhiều càng tốt nhưng nhiều khi nó lại không đúng chỗ đúng lúc đối với 1 vài trường hợp : ví dụ đó là thông tin nhạy cảm của website hay 1 vài lý do khác bạn không muốn người tìm kiếm thấy các thông tin này trừ các SE. Để loại bỏ một thư mục và nội dung của nó, hoặc toàn bộ trang web của bạn, bạn xóa URL, change nội dung nhưng các SE đã index và lưu vào cache…Giải quyết sao đây…Trường hợp này mình cũng đã từng gặp và hôm nay chia sẻ cùng anh em.
Nếu bạn muốn xoá nội dung trang web của bạn sử dụng công cụ yêu cầu xoá URL trong Google Webmaster Tools của google: Login vào google webmaster tool chọn :Site configuration/Crawler access/Remove Url/New removal request
Reason: – Remove page from search results and cache : Loại bỏ trang khỏi công cụ tìm kiếm và cache
- Remove page from cache only : Loại bỏ trang khỏi bộ nhớ cache
- Remove directory : Loại bỏ các thư mục
Tick chọn The page returns a 404/410, or has been blocked by robots.txt or a noindex meta tag
Và bạn phải đáp ứng các tiêu chí được liệt kê dưới đây.
Hãy chắc chắn rằng nội dung không còn sống trên web. Yêu cầu trang phải trả lại một mã trạng thái HTTP 404 (không tìm thấy) hoặc 410.
Chặn nội dung bằng cách sử dụng một tập tin robots.txt.
Hoặc
Chặn nội dung bằng cách sử dụng một thẻ meta ngăn lập chỉ mục.
Bạn phải đảm bảo rằng trang bạn muốn xoá – đã bị chặn bằng cách sử dụng một tập tin robots.txt. Trả về một 404 là không đủ, bởi vì nó có thể cho một thư mục để trả lại mã trạng thái 404, nhưng vẫn phục vụ trong các tập tin bên dưới nó. Sử dụng robots.txt để chặn thư mục.
Trong tập tin robots.txt
User-agent: *
Disallow: /blog/post/940/
Disallow: /blog/post/937/
Mỗi url, thư mục các bạn làm tương tự như trên trong tập tin robots.txt
Chúc các bạn thành công!
Nguồn : diendanvungtau









