tailieunhanh - Tìm Hiểu Thẻ META Robots Và Tập Tin Robots.txt
Tìm Hiểu Thẻ META Robots Và Tập Tin Có đôi lúc chúng ta không muốn spider/robot thu thập những thông tin không cần thiết hoặc không muốn “show” những thông tin nào đó trong website, vậy chúng ta phải làm sao? Bài viết này sẽ thảo luận về chủ đề này. Có 2 cách để ngăn chặn robot thu thập thông tin của website. Đầu tiên, đặt thẻ META Robots vào trong phần HEAD của tập tin HTML (trang nào có chèn thẻ META robots thì chỉ trang đó mới ảnh hưởng). Cách thứ 2 là viết ra một. | Tìm Hiểu Thẻ META Robots Và Tập Tin Có đôi lúc chúng ta không muốn spider robot thu thập những thông tin không cần thiết hoặc không muốn show những thông tin nào đó trong website vậy chúng ta phải làm sao Bài viết này sẽ thảo luận về chủ đề này. Có 2 cách để ngăn chặn robot thu thập thông tin của website. Đầu tiên đặt thẻ META Robots vào trong phần HEAD của tập tin HTML trang nào có chèn thẻ META robots thì chỉ trang đó mới ảnh hưởng . Cách thứ 2 là viết ra một tập tin đặc biệt được gọi là và đặt nó vào thư mục gốc của website. Robots thực sự có ích từ khi các SE công bố chỉ thu thập giới hạn một số trang của webiste để đánh chỉ mục từ đó Robots được ứng dụng để tránh cho các robot thu thập những trang chưa tối ưu hoặc những thông tin không muốn trình bày. Ngoài ra robots cũng được dùng trong các trường hợp trùng lắp nội dung để tránh các robot đánh chỉ mục nội dung trùng lặp. Cuối cùng các webmaster muốn loại bỏ nội dung của những thư mục riêng tư bí mật . trên website. Thẻ META Robots Thẻ META robots là một thẻ bên trong mã HTML có tác dụng điều hướng những robot thu thập thông tin những trang nên đánh chỉ mục và những trang nên loại trừ của một website. Trong mã HTML của một trang web bất kỳ thẻ META Robots sẽ xuất hiện như sau index có nghĩa là các robot thu thập thông tin được phép đánh chỉ mục trang này và follow có nghĩa là cho phép các robot dựa vào những liên kết trên trang hiện tại để khám phá các trang khác có liên quan đến trang này. Bạn có thể hướng dẫn các robot không đánh chỉ mục một trang bất kỳ nếu chuyển content noindex follow hoặc content noindex nofollow . follow và nofollow là cho phép hoặc không cho phép các robot dựa vào những liên kết trên trang hiện tại để khám phá thêm các trang liên quan. Thẻ META Robots phải được đặt trong phần HEAD của mã HTML. Một vài SE không hỗ trợ thẻ này mà chỉ hỗ trợ Robots Exclusion Protocol. Googlebot và MSNBot Các spider robot của Google được gọi là Googlebot các spider robot của MSN được
đang nạp các trang xem trước