Duplicate Content – Nội dung trùng lặp

Duplicate Content – Nội dung trùng lặp
5 (100%) 2 votes

Ai cũng biết nội dung trùng lặp gây ra nhiều ảnh hưởng tệ hại đến website như giảm thứ hạng, giảm lượng truy cập và nặng nề nhất bị Google Panda phạt. Bài viết sẽ đi sâu vào bản chất và phân loại nội dung trùng lặp.

Định nghĩa của Duplicate Content

Nội dung trùng lặp (Duplicate Content) là những nội dung giống nhau xuất hiện ở nhiều vị trí trên Internet. Khi có nhiều phiên bản giống nhau, sẽ rất khó khăn cho công cụ tìm kiếm trong việc phân biệt phiên bản nào liên quan nhiều hơn tới truy vấn tìm kiếm của người dùng. Do đó, công cụ tìm kiếm sẽ ít khi hiển thị những trang bị trùng lặp nội dung mà thay vào đó buộc phải chọn những bài viết có khả năng là phiên bản gốc hoặc chọn phiên bản phù hợp nhất.

nội dung trùng lặp là gì

Các loại nội dung trùng lặp

1. Sao chép nội dung bài viết

Những bài viết sao chép hoàn toàn hoặc một phần từ trang khác hoặc chia nhỏ bài viết trên nhiều website là nguyên nhân chính dẫn đến điểm chất lượng domain sụt giảm. Hiện nay, đa số bài viết bị sao chép mà không có trích nguồn dẫn, ghi tên tác giả đều bị Google Panda phát hiện và phạt nặng.

2. Trùng lặp thông tin sản phẩm

Đối với các trang web thương mại bán lẻ, thông thường nhà sản xuất sẽ cung cấp thêm thông tin sản phẩm như tiêu đề, mô tả sản phẩm, hình ảnh. Vô tình hay cố ý thì những website đó đã gây ra sự trùng lặp nội dung rất lớn.

nội dung trùng lặp là gì

3. Chức năng phân loại và website  nhiều sản phẩm

Trang thương mại thường có chức năng phân loại theo đặc tính sản phẩm, giá, thương hiệu và điều đó cũng sẽ tạo ra nội dung trùng lặp trên URL. Hoặc danh mục sản phẩm chứa nhiều sản phẩm con gây ra tình trạng trùng lặp URL danh mục gốc.

nội dung trùng lặp là gì

4. WWW và non-WWW

Vấn đề này ít được SEOer lưu tâm so với các loại khác. URL của website có thể xuất hiện ở cả hai dạng www hoặc non-www như www.dautuseo.com hoặc dautuseo.com trong bảng xếp hạng kết quả tìm kiếm (SERP). Điều này sẽ tạo ra nội dung trùng lặp và có thể chuyển người dùng đến nhầm URL.

5. Trùng lặp tham số URL

Khi nhấp chuột hoặc có các mã theo dõi như marketing campaign IDs, analytics IDs sẽ tạo ra trùng lặp nội dung. Ví dụ như

www.example.com/page1

www.example.com/page1?source=organic

www.example.com/page1?campaignid=3532

6. Trang in ấn

Một số trang web sẽ đưa thêm tùy chọn in trang và sẽ gây ra nội dung trùng lặp. Ví dụ như:

www.example.com/page1

www.example.com/printer/page1

7. Session IDs

Nhà đầu tư thường muốn theo dõi người dùng thông qua tài khoản của họ. Do đó, mỗi khi người dùng vào và thoát trang sẽ để lại tài khoản của họ trên URL. Ví dụ như:

www.example.com/page1

www.example.com/page1?sessionid=12455

Ảnh hưởng nội dung trùng lặp tới công cụ tìm kiếm

Trung-lap-noi-dung

_ Google không biết lập chỉ mục cho phiên bản nào từ đó không thể xếp hạng trang được.

_ Google không phân biệt được trang nào là trang gốc, trang nào là phiên bản sao chép.

_ Google không thể biết được nên chọn phiên bản nào để trả lại cho truy vấn của người dùng.

Tác giả: Tuấn Anh – VietMoz SEO Junior
Ghi rõ nguồn www.dautuseo.com khi đăng tải lại bài viết này

Xem thêm các kiến thức SEO khác tại đường dẫn Kiến thức SEO

Danh mục bài viết liên quan:

7 vấn đề thường gặp trong SEO

8 loại nội dung hấp dẫn người đọc

Add a Comment

Thư điện tử của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *