Sitemaps là gì? Có nên dùng sitemaps khi SEO?

Rate this post

sitemap là gì

Sitemaps là gì?

Sitemaps là một tập tin chuyên dụng trên trang web mà các nhà quản trị web có thể sử dụng để liệt kê tất cả các trang web con trên website cho các con bot của công cụ tìm kiếm, để các công cụ  này nắm được sơ đồ tổ chức nội dung trên trang web, đồng thời hướng dẫn chúng crawlindex dữ liệu một cách thông minh hơn, với thời gian nhanh nhất có thể.

Như vậy, câu hỏi được đặt ra là “Có phải không có sitemaps thì công cụ tìm kiếm sẽ không thu thập thông tin được đẩy đủ?” Trong trường hợp lý tưởng nhất của một website bất kỳ tức nếu tất cả các trang web trên site được liên kết đúng theo một bố cục rõ ràng, thì trình thu thập dữ liệu web của công cụ tìm kiếm (các con bot) sẽ có thể phát hiện và thu thập dữ liệu hầu hết tất cả các trang web hiện có. Và các nhà đầu tư SEO cũng có thể bỏ qua sitemaps như là một tính năng phụ thêm không thiết yếu của website.

Tuy nhiên, sitemaps sẽ thực sự có ích và là một công cụ không thể thiếu của website để cải thiện khả năng và tốc độ thu thập dữ liệu của trang web nếu trang web của các nhà đầu tư rơi vào một các trường hợp sau:

Các trường hợp nên sử dụng sitemaps

  • Đối với những website có kho tàng nội dung thực sự lớn, dẫn đến việc các web crawler có nhiều khả năng sẽ bỏ sót các trang có nội dung mới cập nhật hoặc mới tạo gần đây trong quá trình thu thập dữ liệu website.
  • Nếu website đang lưu trữ một số lượng lớn các trang nội dung đang bị cô lập hoặc không liên quan đến nhau. Nếu trang con trên site không có liên kết chặt chẽ với nhau và giới thiệu lẫn nhau, nhà đầu tư SEO có thể liệt kê chúng trong một sitemap để đảm bảo rằng Google không bỏ qua bất kỳ trang web bị cô lập nào trong quá trình crawl dữ liệu.
  • Trong trường hợp các website là các trang mới tạo và mới chỉ có một vài liên kết bên ngoài (external link) trỏ về site, Googlebot và các phần mềm thu thập dữ liệu web khác của Google sẽ chỉ có thể thu thập dữ liệu của website thông qua các external link đó từ các trang khác đi đến site. Và nếu không có một liên kết từ các trang bên ngoài nào đến trang trên site thì Googlebot hoàn toàn có thể không phát hiện ra các trang đó, đặc biệt là các trang mới được tạo.
  • Website sử dụng rất nhiều các nội dung đa phương tiện như video, hình ảnh,… với nhiều các thông tin của các nội dung này không thể hiển thị hết trong phần mô tảtrên SERP như thời lượng video, bản quyền hình ảnh, chủ đề hình ảnh,…

Tạo sitemaps như thế nào?

Hiện nay có tất nhiều các công cụ có thể giúp nhà đầu tư SEO tạo một hoặc nhiều các sitemaps khác nhau cho website, tuy nhiên có một công cụ khá quan trọng hỗ trợ rất nhiều tính năng hữu ích cho SEO, trong đó có cả sitemaps, đó là plugin Yoast’s WordPress SEO.

Sau khi cài đặt plugin này, sitemaps sẽ được tự động tạo dựa trên các tùy chọn của nhà đầu tư.  Ví dụ:

sitemap

Chọn SEO >> XML  sitemaps , sau đó tùy chọn các dữ liệu của website cần thêm hoặc cần bỏ tại các mục:  General, User sitemap, Post  Types, Taxonomies (chọn tick vào ô của các mục để ẩn các mục đó khỏi sitemap).

Chú ý:

  • đừng quên không tích vào ô “check this box to enable XML sitemap functionality” trên đầu để sitemap được tạo và sử  dụng.
  • Submit  đường dẫn này cho Google Search Console tại: Thu thập dữ liệu >> Sơ đồ trang web để hoàn tất việc gửi sitemap tời google.
  • Một website có thể có và nên có nhiều sitemap, nhất là đối với những trang web có dữ liệu quá lớn. Bởi thông thường một site map chỉ có thể chứa 50.000 liên kết, vì vậy nếu website có nhiều hơn 50.000 trang con, việc tạo nhiều hơn 1 site map là việc làm cần thiết.
  • Trong hầu hết tất cả trường hợp, các webmaster sẽ được hưởng lợi từ việc gửi sitemaps cho Google và sẽ không phải chịu bất cứ hình phạt gì bắt  nguồn từ việc gửi sitemap này. Tuy nhiên, Google cũng sẽ không đảm bảo 100% tất cả các trang trên site được liệt kê trong sitemap sẽ được Google crawl hoặc index.

Có nên dùng sitemaps khi SEO?

Sitemap đem lại rất nhiều lợi ích cho website, và là một công cụ trợ giúp đắc lực cho SEO. Cụ thể:

Gia tăng tốc độ index: Tốc độ index nhanh là vấn đề sống còn đối với một số các website tin tức, nhất là các trang báo điện tử thời nay. Không chỉ là một bài viết, việc tạo sitemap rõ ràng còn có thể giúp các gia tăng tốc độ index của tất cả các trang web trên site. Các trang báo cũng là một trong những site mà sitemap thể hiện rõ ràng tầm quan trọng của mình.

– Cải thiện khả năng index của website: Với sitemap, tất cả những thay đổi dù là nhỏ nhất trên các site con cũng sẽ được Spider chú ý và thu thập dữ liệu. Sitemap sẽ thông báo cho Googlebot những  trang nào trên site không có thay đổi gì, có thể bỏ qua và những trang mới tạo hay có sự thay đổi về nội dung mà nó cần thu thập dữ liệu. Nhà đầu tư SEO cũng có thể tạo một sitemap riêng chỉ bao gồm những trang mới trên site và submit sitemap này cho Google để đạt được hiệu quả tốt nhất trong crawl và index website.

– Cung cấp các siêu dữ liệu của từng trang web đến Google: bao gồm các thông tin về trang web như lần cuối trang được cập nhật là khi nào?, mức độ thường xuyên thay đổi của trang, tầm quan trọng của trang đó đối với các url khác trên site. Ngoài ra, nhà đầu tư cũng có thể sử dụng sitemap để cung cấp các siêu dữ liệu của các loại nội dung đặc biệt như video, hình ảnh,… cho Google (ví dụ: thời lượng video, chủ đề hình ảnh, loại hình ảnh, giấy phép,…)

– Phát hiện được những lỗi phát sinh tiềm ẩn trên site: Trong quá trình làm website, sẽ khó tránh được việc phát sinh các lỗi thu thập dữ liệu trên toàn site của Googlebot và sẽ rất khó khăn cho các nhà đầu tư SEO nếu phải kiểm tra từng liên kết một.

Vậy  qua bài viết trên, chắc hẳn mọi người – những nhà đầu tư SEO đã có một câu trả lời phù hợp cho 2 câu hỏi, 2 vấn đề được đặt ra ở đầu bài. theo dõi thêm các kiến thức SEO khác tại: Kiến thức SEO | Thủ thuật SEO | Thuật ngữ SEO.

Bài viết “Sitemaps là gì? Có nên dùng sitemaps khi SEO?
Tác giả: Tú DA – VietMoz SEO Junior
Ghi rõ nguồn www.dautuseo.com khi đăng tải lại bài viết này

Các nguyên tắc thiết yếu dành cho các webmaster 2015

Add a Comment

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *