Sử dụng nội dung trùng lặp an toàn với thẻ Canonical

v2SEO · 17 Tháng chín 2014

Vài ngày trước đây mình có đăng tải 1 bài viết nói về Vấn đề trùng lặp nội dung gây hại trên website thương mại điện tử và đã có rất nhiều câu hỏi và những ý kiến trái chiều về việc xử lý cũng như khắc phục hiện tượng trên. Bài viết này sẽ giúp các bạn giải quyết vấn đề thắc mắc trên.

Kể từ khi bản cập nhật Panda được ra mắt vào năm 2011, Google đã tiến hành một cuộc chiến chống lại nội dung trùng lặp. Đối với hầu hết các chủ sở hữu trang web thì vấn đề này cũng không tác động nhiều đến họ, còn lại một số ít đã phải thay đổi chiến lược kinh doanh của mình. Đối với một số doanh nghiệp nhỏ, họ có thể sống dựa vào việc rao bán nội dung được sao chép và họ phải đối mặt với những hậu quả mà họ đã gây ra. Tuy nhiên, ngày nay vẫn còn nhiều doanh nghiệp bị đánh dấu với nội dung trùng lặp mà không biết lý do tại sao. Làm thế nào bạn có thể giải quyết vấn đề này?

Tại sao nội dung trùng lặp là xấu?

Google cho rằng nội dung trùng lặp là xấu và chúng ta phải chấp nhận điều này mà không biết lý do tại sao. Nếu gã khổng lồ tìm kiếm đưa ra các hình phạt cho nội dung trùng lặp thì các webmaster cũng vẫn phải tuân thủ theo. Khi bạn nhận được hình phạt thì đồng nghĩa với việc bạn sẽ mất đi lưu lượng truy cập, bảng xếp hạng và doanh thu. Vậy lý do vì sao mà Google lại đưa ra các hình phạt về nội dung trùng lặp?

Câu trả lời nằm ở cách công cụ tìm kiếm đọc và index nội dung. Trình thu thập web có có một số cách khác nhau để tìm kiếm nội dung mới chẳng hạn như nó dựa vào các liên kết tồn tại trên các trang được index và các bài viết truyền thông xã hội và một vài cách khác nữa. Khi bạn post nội dung, nó có thể không được nhìn thấy ngay lập tức. Và trong một số trường hợp, scraper nội dung có thể ăn cắp nội dung của bạn và đăng trên một trang web khác và trang web đó có thể được phát hiện ra trước tiên.

Google luôn luôn phải đối mặt với những quyết định khó khăn. Khi cùng một phần nội dung được đăng tải trên hai, ba hoặc nhiều các trang web khác nhau thì trang web có nội dung gốc sẽ như thế nào? Kể cả Timestamps của bạn có chỉnh sửa thế nào đi chăng nữa hoặc PageRank của bạn có cao đi chăng nữa thì bạn vẫn có thể bị Google kết tội ăn cắp nội dung từ những trang đối thủ cạnh tranh nhỏ hơn.

*** TimeStamps: Là số giây được tính từ thời điểm từ lúc 0 giờ 0 phút 0 giây theo giờ GMT.

Có phải tất cả nội dung trùng lặp đều xấu? Câu trả lời tùy thuộc vào cách sao chép như thế nào. Matt Cutts tuyên bố rằng hầu hết nội dung trùng lặp không phải là một vấn đề. Đa số các trang web liên quan đến vấn đề nội dung trùng lặp là rất ít với xác suất nhỏ. Nếu một trang web cố ý sử dụng nội dung trùng lặp giống như kiểu spam thì chắc chắn nó sẽ nhận được một hình phạt.

Đó là chưa kể đến việc bạn sử dụng nội dung trùng lặp với mục đích xấu. Là một webmaster và bạn muốn tối ưu hóa trang web để nó được xếp hạng tốt nhất có thể. Nội dung trùng lặp có thể không phải nhận một hình phạt nhưng nó sẽ cản trở sự tăng trưởng SEO tự nhiên của bạn.

Sự sao chép không có chủ định đến từ đâu

Như đã đề cập ở trên, nhiều trang web đã có vấn đề với nội dung trùng lặp và thường các webmaster không biết chuyện gì đang xảy ra. Nó xảy ra như thế nào:

- Việc các trang web xử lý URL có thể gây ra nội dung trùng lặp. Một URL tại www.example.com/subsite và một trang web tạiwww.example.com/subsite?category=option. Với Google, cả hai trang là khác nhau. Đối với người dùng thì chúng là như nhau. Công cụ tìm kiếm xem nội dung trùng lặp không thực sự tồn tại.

- Theo dõi ID Session. Một số form gắn theo dõi ID session vào URL. Khi mỗi người truy cập vào www.example.com, URL sẽ trông giống như www.example.com/SESSID=12481632. Điều này làm cho công cụ tìm kiếm xem nó là 2 URL khác nhau khi mỗi lần nó được index.

Nội dung thường được xác định bởi URL, vì vậy với bất kỳ thủ thuật mã hóa để thay đổi sự xuất hiện của URL thì nó được coi như là nội dung trùng lặp.

Làm thế nào để quản lý nội dung trùng lặp?

Có một số cách để đối phó với nội dung trùng lặp. Trước tiên, bạn cần phải chắc chắn vấn đề nội dung trùng lặp không phải là một chiến dịch SEO mũ đen của bạn. Nếu bạn đang cố tình gửi cùng một nội dung trên một số trang web, nghĩa là bạn đang nhân rộng nó ra thì vấn đề này là hoàn toàn hợp pháp. Nhưng bạn cũng cần biết rằng việc nhân rộng bài viết của bạn sẽ được Google giám sát và nếu bạn có bất kỳ hành động nào vi phạm nguyên tắc của họ thì họ sẽ phất cờ cảnh báo bạn. Khi bạn tự tin các vấn đề nội dung trùng lặp là hợp pháp, bạn có 3 quyền lựa chọn:

- Bỏ qua nó
- Chuyển hướng 301
- Sử dụng thẻ Rel = "Canonical"

Tùy chọn đầu tiên, bạn có thể bỏ qua vấn đề này. Matt Cutts tuyên bố rằng 25% nội dung trên Internet là được nhân bản và Google không liên quan đến bản thân nội dung trùng lặp bình thường đó. Bạn sẽ không có nguy cơ bị phạt và trang web của bạn sẽ là tốt nếu bạn chỉ cần bỏ qua vấn đề này.

- Chuyển hướng 301 là giải pháp phức tạp nhất. Thiết lập chuyển hướng 301 là một quá trình phức tạp và đâu phải lúc nào nó cũng làm việc cho vấn đề nội dung trùng lặp cụ thể. Tuy nhiên, có một công cụ giúp cho việc cập nhật URL mới một cách dễ dàng. Kết hợp chuyển hướng 301 và PageRank của hai trang có nội dung trùng lặp sẽ tạo thành một loại super-page. Tuy nhiên nó không phải là giải pháp hữu hiệu nhất và không phải lúc nào nó cũng làm việc.

Thẻ Canonical

Thẻ Canonical là một loại thẻ tham chiếu mà Google khuyến cáo nên dùng, nó là giải pháp tốt nhất để giải quyết vấn đề nội dung trùng lặp. Trong tiêu đề HTML của trang web, ví dụ, bạn có hai URL, một là www.example.com / realpage và một làwww.example.com / realpageduplicate. Trong trường hợp này, trong realpageduplicate bạn có thể thêm mã header là “link href=”www.example.com/realpage/” rel=”canonical”.

Đoạn mã này thông báo cho công cụ tìm kiếm Link juice, PageRank hoặc SEO. Thật nhanh chóng và dễ dàng để thực hiện nó và nó là một giải pháp tốt cho vấn đề phức tạp này.

Đối phó với nội dung trùng lặp mũ đen

Đôi khi cũng có một số trang web sao chép nội dung của bạn để phục vụ cho các mục đích xấu xa của họ. Rất ít khi các trang web này có được sự hiện diện lớn và quyền lực SEO cao hơn và xếp hạng tìm kiếm cao hơn so với trang web của bạn. Điều này làm cho bạn cảm thấy rất tức giận bởi các trang web đó được xếp hạng cao hơn trang web của bạn. Giải pháp cho vấn đề này là công cụScraper Report mới của Google giúp bạn xác định và báo cáo vấn đề scrap nội dung. Điều này không có tác dụng ngay lập tức trên trang web của bạn hay của họ nhưng nó sẽ giúp Google xác định các trang scraper để phân tích và loại bỏ nó trong tương lai.

Nội dung trùng lặp có thể là một vấn đề đối với một số trang web nhưng thẻ canonical sẽ là một cách khắc phục nhanh chóng và có thể dễ dàng áp dụng cho tất cả các trường hợp. Nếu bạn lo sợ rằng nội dung trùng lặp ảnh hưởng đến bạn, bạn hãy dành thời gian để thực thi các thẻ và xem thứ hạng của bạn được cải thiện như thế nào.

(Nguồn : the giới seo)

Sử dụng nội dung trùng lặp an toàn với thẻ Canonical

v2SEO Well-Known Member

Chia sẻ trang này

Tìm kiếm hữu ích

Sử dụng nội dung trùng lặp an toàn với thẻ Canonical

v2SEO Well-Known Member

Chia sẻ trang này