Logo TIEN ZIVEN
  • Dịch Vụ Digital Marketing
    • Dịch vụ SEO Tổng Thể
    • Báo Giá SEO
  • Đào Tạo SEO
    • Khóa Học SEO SEAL
    • Khóa học SEO SOLDIER
    • TIEN ZIVEN SEO Checklist
  • Thư Viện Digital Marketing
    • Digital Marketing
      • Digital Marketing căn bản
      • Chiến lược
      • Marketing online
      • Social Media Marketing
    • Content Marketing
      • Tổng quan Content Marketing
      • Triển khai Content Marketing
    • SEO
      • SEO Cơ bản
      • Keyword Research
      • SEO Content
      • SEO Onpage
      • SEO Offpage
      • Crawling & SEO Technical
      • SEO Nâng cao
      • Phân tích & Báo cáo
      • SEO Tools
      • Thuật toán Google
      • Website
      • Kinh nghiệm
    • Google Ads
      • Google Ads Cơ bản
      • Thủ thuật Google Ads
    • Email Marketing
      • Email Marketing cơ bản
      • Phần mềm Email Marketing
    • Facebook Marketing
      • Facebook Marketing căn bản
    • Ebook
  • Về TIEN ZIVEN
    • Liên Hệ
    • Tuyển Dụng
Liên Hệ
Search
Close
icon category

SEO Cơ bản

  • SEO là gì trong Marketing? Tất tần tật về SEO
  • Cách SEO website hiệu quả độc quyền từ TIEN ZIVEN
  • Quy trình SEO Website Cơ bản
  • Hướng dẫn lập chiến lược SEO nâng cao thứ hạng nhanh chóng
  • Các thuật ngữ trong SEO thông dụng nhất mà SEOer nào cũng phải biết
  • SERP là gì? Tất tần tật SERP Features bạn sẽ gặp
  • SEO tổng thể là gì? Cách SEO Website tổng thể của TIEN ZIVEN
  • Domain Authority là gì? Cách tăng điểm DA hiệu quả
icon category

Keyword Research

  • Tổng quát về từ khóa SEO và cách chọn từ khóa SEO hiệu quả
  • Keyword Research: Hướng dẫn nghiên cứu từ khóa chi tiết
  • SERP Analysis là gì? Tại sao cần phân tích SERP?
  • Search Intent là gì? Cách phân loại Search Intent phù hợp
  • Allintitle là gì? Cách sử dụng allintitle hiệu quả trong SEO
  • Phantom Keyword là gì? Cách tìm từ khoá bóng ma nhanh và đơn giản nhất
  • Từ khoá LSI là gì? Cách dùng LSI keywords để tối ưu bài viết
  • Keywordtool.io là gì? Hướng dẫn cách sử dụng phân tích từ khoá
icon category

SEO Content

  • SEO Content là gì? Cách lập kế hoạch Content SEO hoàn chỉnh
  • Bài viết chuẩn SEO là gì? Cách viết nội dung chuẩn SEO
  • Entity là gì? 6 bước xác thực Entity building cho website
  • Cách triển khai Topic Cluster để xây dựng nội dung website
  • Content Pillar là gì? Tất tần tật về Content Pillar mới nhất
  • Content Audit là gì? Hướng dẫn Audit Content từ A – Z
  • Duplicate content là gì? Cách xử lý trùng lặp nội dung
  • DMCA protected là gì? 5 bước đơn giản đăng ký DMCA cho website
icon category

SEO Onpage

  • SEO Onpage là gì? Hướng dẫn tối ưu Onpage chi tiết
  • Hướng dẫn sử dụng Yoast SEO cơ bản từ A đến Z (cập nhật 2021)
  • Slug là gì? 5 yếu tố giúp tối ưu Slug trong WordPress
  • Meta Title là gì? Hướng dẫn tối SEO tiêu đề trang chi tiết
  • Meta description là gì? Cách viết meta description thu hút
  • Thẻ Heading là gì? Hướng dẫn tối ưu SEO cho Heading
  • Cách SEO hình ảnh lên Google từ cơ bản đến nâng cao
  • Alt text là gì? Hướng dẫn triển khai Alt text tốt nhất cho SEO
icon category

SEO Offpage

  • SEO Offpage là gì? Hướng dẫn tối ưu SEO Offpage 2022
  • Backlink là gì? 13 cách đặt backlink chất lượng 2022
  • Anchor text là gì? Cẩm nang sử dụng Anchor text hiệu quả
  • Đường link là gì? Cách triển khai link tối ưu SEO Website
  • Linkbuilding là gì? Tìm hiểu cách xây dựng liên kết tốt nhất 2021
  • Link juice là gì? Làm sao để tối ưu Link juice hiệu quả
  • Link Wheel là gì? Cách xây dựng mô hình link wheel hiệu quả nhất
  • Domain Rating là gì? Ứng dụng của chỉ số DR trong SEO
  • Trust Flow là gì? Citation Flow là gì? Cách check TF CF
  • Contextual Link là gì? Lợi ích của liên kết ngữ cảnh
  • Textlink là gì? 4 bí kíp sử dụng textlink hiệu quả nhất cho SEO
  • Cách xây dựng Private Blog Network (PBN) chất lượng cho website
  • Guest Post là gì? Lưu ý khi triển khai Guest posting
  • 3 bí kíp tạo blog comment xây dựng backlink miễn phí
  • Rút gọn link là gì? Tổng hợp website rút ngắn link miễn phí tốt nhất
icon category

Crawling & SEO Technical

  • Technical SEO là gì? Hướng dẫn cải thiện các yếu tố kỹ thuật SEO
  • Crawl dữ liệu là gì? Cách tối ưu quá trình Crawl data chi tiết
  • Crawl Budget là gì? Cách tối ưu ngân sách cào của website
  • Google Index là gì? Những yếu tố ảnh hướng đến index Google
  • Robots.txt là gì? Hướng dẫn tạo robots.txt cho website
  • Sitemap là gì? Cách tạo Sitemap website hiệu quả nhất
  • Cách Submit URL lên Google index nhanh nhất (Update 2022)
  • 6 Bước tạo nên cấu trúc website chuẩn SEO
  • Cấu trúc Silo là gì? Cách xây dựng cấu trúc silo
  • Internal Link là gì? 3 Cách đi link nội bộ hiệu quả nhất
  • Breadcrumb là gì? Tại sao tối ưu Breadcrumbs cho SEO
  • Pagination là gì? Thực hiện phân trang thế nào để đạt hiệu quả SEO nhất
  • Redirect là gì? Tất tần tật về 301 Redirect cho bạn tìm hiểu
  • Thẻ hreflang là gì? Khi nào cần dùng hreflang
  • Canonical URL là gì? 3 sai lầm khi dùng thẻ Canonical trong SEO
  • Dofollow và nofollow link là gì? Cách sử dụng chi tiết
  • Thẻ meta robots là gì? Cách thiết lập robots meta tag cho trang web
  • AMP là gì? Hướng dẫn cài đặt Google AMP cho WordPress
icon category

SEO Nâng cao

  • Keyword Cannibalization là gì? Cách phát hiện nhanh và xử lý tận gốc
  • Schema là gì? Hướng dẫn sử dụng Schema Markup chi tiết nhất
  • Featured snippet là gì? Hướng dẫn cách tối ưu featured snippet
  • Disavow link là gì? Cách sử dụng disavow tool để từ chối liên kết
  • Core Web Vitals là gì? Tối ưu Page Experience cho GG update 2022
  • Trải nghiệm người dùng là gì? Hướng dẫn tối ưu UX/UI website
  • PageSpeed Insights là gì? Bí kíp tối ưu tốc độ website hiệu quả
  • 5 cách xóa JavaScript chặn hiển thị WordPress cho website
icon category

Phân tích & Báo cáo

  • SEO Audit là gì? Cách thực hiện Website Audit chi tiết
  • ROI là gì? Công thức tính ROI trong SEO, Marketing và Content
  • Webmaster Tool là gì? Hướng dẫn sử dụng hiệu quả và chi tiết nhất
  • Google Analytics là gì? Cách sử dụng Google Analytics chi tiết
  • Traffic là gì? 7 Cách tăng traffic website hiệu quả
  • Bounce rate là gì? Các cách tối ưu giảm tỷ lệ thoát web
  • Google Tag Manager là gì? Cách sử dụng Google Tag Manager hiệu quả
  • Giới thiệu 16 công cụ kiểm tra thứ hạng từ khoá mạnh nhất 2021
icon category

SEO Tools

  • Checklist 28 phần mềm SEO website chất lượng nhất hiện nay
  • Ahrefs là gì? Hướng dẫn sử dụng Ahrefs với các chỉ số cơ bản
  • Cách sử dụng Addon SEOQuake hiệu quả cho website
  • Hướng dẫn sử dụng phần mềm SEO PowerSuite từ A-Z (2021)
  • Majestic SEO là gì? Hướng dẫn sử dụng Majestic tối ưu
  • Hướng dẫn sử dụng phần mềm GSA SEO backlink mới nhất
  • IFTTT là gì? Hướng dẫn sử dụng IFTTT SEO từ A – Z
  • Google xu hướng là gì? Hướng dẫn sử dụng Google Trends chi tiết
icon category

Thuật toán Google

  • Google Rankbrain là gì và hoạt động như thế nào?
  • Semantic là gì? Tìm hiểu chi tiết về Semantic Search
  • E-A-T SEO là gì? Tầm quan trọng của EAT trong SEO website
  • Google Panda là gì? Tìm hiểu các yếu tố của thuật toán Panda
  • Thuật toán Google Hummingbird đánh vào yếu tố SEO nào?
  • Google Sandbox là gì? Cách thoát án phạt Sandbox Google
  • Cách kiểm tra Pagerank và cải thiện Page rank của website
  • Thuật toán Penguin: Dấu hiệu nhận biết và giải pháp khắc phục
icon category

Website

  • Lỗi Error 404 là gì? Cách khắc phục lỗi 404 not found
  • Domain là gì? Tất tần tật các vấn đề về tên miền website
  • Mua tên miền ở đâu tốt nhất, uy tín nhất? (cập nhật 2021)
  • Subdomain là gì? Tạo subdomain cho website như thế nào?
  • Addon domain là gì? Cách tạo Addon domain cho website
  • Quản trị website là gì? 6 Công việc của người quản lý trang web
  • Tổng hợp 20 mẫu trang admin cho website hot nhất hiện nay
  • Web navigation là gì? Tầm quan trọng của Web navigation
icon category

Kinh nghiệm SEO

  • TOP 10 trung tâm đào tạo SEO uy tín tại TPHCM
  • Top 10 công ty SEO chuyên nghiệp, uy tín tại TPHCM
  • Checklist 15 Thủ thuật SEO link hot nhất năm 2021
  • Thiết kế Website chuẩn SEO là gì? Tìm hiểu để thiết kế Web SEO
  • Hootsuite và các công cụ quản lý mạng xã hội hỗ trợ SEO tốt nhất
  • 7 Cách tăng traffic cho website bền vững và hiệu quả
  • Cách kiểm tra website có bị google phạt đơn giản chỉ với 2 bước
  • Google My Business là gì? Lợi ích của GMB trong SEO
  • Hướng dẫn cách SEO Google Map chi tiết nhất 2021
  • SEO Youtube là gì? Cách SEO Video Youtube hiệu quả nhất
  • Page Authority (PA) là gì? Cách hoạt động của chỉ số PA
  • PPC marketing là gì? Nên chọn quảng cáo PPC hay SEO?
  • Học SEO có khó không? Nếu đam mê hãy bắt tay vào ngay!
  • Dịch vụ SEO website giá rẻ có tốt như lời đồn?
  • Nên thuê SEO hay xây đội ngũ SEO nội bộ để hiệu quả nhất
  • SEO mũ trắng là gì? White hat SEO có là sự lựa chọn tốt nhất?
  • TOP 3 kỹ năng cần thiết để trở thành một chuyên gia SEO
  • Referral là gì? 9 Cách tăng referral traffic hiệu quả cho website
  • 5 công cụ phân tích website đối thủ SEO toàn diện
  • SEO Facebook là gì? Cách SEO Fanpage hiệu quả nhất
  • Trang chủ
  • SEO
  • SEO Content
  • Duplicate content là gì? Cách xử lý trùng lặp nội dung

Duplicate content là gì? Cách xử lý trùng lặp nội dung

Cập nhật vào Tháng Mười Hai 30, 2021

Có lẽ ai làm SEO đều đã từng nghe đến khái niệm Duplicate content và tình trạng này là không tốt cho SEO. Nhưng cụ thể thì Duplicate content là gì và làm thế nào để khắc phục nó? Tất cả các thắc mắc trên sẽ được làm rõ với bài viết này!

1. Duplicate content là gì?

Duplicate Content là nội dung trùng lặp, là tình trạng phần lớn nội dung trang trùng lặp giống với nội dung trang khác trên website của bạn. Hoặc cũng có thể là với nội dung trang của website khác.

duplicate content la gi
Bạn sẽ thường thấy duplicate content xuất hiện trên các URL khác nhau

Tuy nhiên đôi khi là trên một tên miền khác. Ví dụ như trong trường hợp website của bạn có sẵn trên cả www và không www hoặc HTTP và HTTPS (cũng có thể là cả hai cùng một lúc).

Tình trạng duplicate content đa phần xảy ra là do vô tình hoặc là do lỗi kỹ thuật. (Google nói rằng hầu hết duplicate content không phải là sự gian dối về nguồn gốc nội dung). Nếu bạn sao chép và spin nội dung đã xuất bản trước đó với ý định đánh lừa công cụ tìm kiếm thì Google gọi đây là Copied Content.

2. Tại sao Duplicate không tốt cho SEO?

Duplicate Content sẽ không tốt cho nỗ lực tối ưu SEO Content của bạn? Bởi vì:

  • Khi có nhiều phiên bản nội dung hoàn toàn giống nhau hoặc rất giống nhau thì Google sẽ trở nên bối rối để xác định nên index phiên bản nào, hiển thị phiên bản nào cho người dùng…
  • Nhiều phiên bản cùng tập trung vào một nhóm từ khóa giống nhau, chẳng phải chúng lại đang cạnh tranh lẫn nhau hay sao. Có thể gọi là cạnh tranh nội bộ.
  • Công cụ tìm kiếm gặp khó khăn trong vấn đề hợp nhất số liệu về mức độ liên quan, tin cậy của nội dung… (nhất là khi các website khác liên kết với nhiều phiên bản nội dung đó).

> Tham khảo: SEO là gì trong Markeing? và Cách viết bài chuẩn SEO!

3. Nguyên nhân và cách khắc phục

Nguyên nhân dẫn đến tình trạng Duplicate Content rất nhiều, dưới đây là những nguyên nhân phổ biến và hướng dẫn cách giải quyết cho từng nguyên nhân để bạn tham khảo.

3.1. Faceted Navigation (Điều hướng nhiều chiều)

Đây là tình huống Duplicate Content thường thấy ở các website thương mại điện tử bởi chúng phổ biến với việc cung cấp các tùy chọn để người dung có thể lọc và sắp xếp các mục. Người dùng khi mua sắm lại hay có nhiều sự kết hợp các bộ lọc với nhau nên.

duplicate content
Faceted Navigation dẫn đến Duplicate Content

Bạn sẽ hiểu rõ hơn về vấn đề này với ví dụ trên một website bán dây giày sau đây:

  • example.com/product-category?filter_color=black (Đây là trang kết quả hiển thị những dây giày có màu đen).
  • example.com/product-category?filter_color=black&filter_size=60-inch (Đây là trang kết quả hiển thị những dây giày kết hợp 2 tùy chọn: màu đen và kích thước 60 inch).

Các URL ở ví dụ trên đều là duy nhất, nhưng nội dung lại gần giống nhau vì những sản phẩm ở link số 2 là “tập hợp con” của sản phẩm ở link số 1. Bên cạnh đó, thay đổi thứ tự của các tham số cũng tạo rạ 2 URL khác nhau nhưng nội dung thì lại giống nhau. Ví dụ như 2 URL dưới đây:

  • example.com/product-category?filter_color=black&filter_size=60-inch
  • example.com/product-category?filter_size=60-inch&filter_color=black

Cách khắc phục:

  1. Thực ra Faceted navigation không phải là vấn đề đơn giản trong SEO. Nếu bạn có lý do để cho rằng đây là nguyên nhân dẫn đến Duplicate Content trên website của mình thì hãy quyết định đâu là những trang mà bạn muốn Google index.
  2. Tiếp theo đó, bạn tăng số lượng trang hữu ích được index và bỏ đi những trang không cần thiết.

3.2. Tracking Parameters (Các thông số theo dõi)

Nếu URL của bạn được tham số hóa cũng có thể là nguyên nhân dẫn đến trùng lặp nội dung. Ví dụ: example.com/page?utm_source=newsletter. Ở ví dụ này, URL sử dụng thông số UMT để theo dõi lượt truy cập.

Cách khắc phục:

Hãy chuẩn hóa các URL này để có được các phiên bản không cần thông số theo dõi và vẫn thân thiện với SEO.

> Đọc thêm: DMCA là gì?

3.3. HTTPS với HTTP và non-www với www

Bạn có thể truy cập vào website bằng 1 trong 4 biến thể dưới đây (Biến thể thứ 1 và thứ 2 sử dụng HTTPS và dù là với biến thể có www hay không có www thì chúng ta vẫn có thể truy cập được vào website):

  • https://www.example.com (HTTPS, www)
  • https://example.com (HTTPS, non-www)
  • http://www.example.com (HTTP, www)
  • http://example.com (HTTP, non-www)

Vậy vấn đề ở đây là gì? Nếu như bạn không cấu hình chính xác máy chủ thì người dùng có thể truy cập vào website của bạn bằng các biến thể trên và điều này có thể dẫn đến Duplicate Content.

nguyen nhan duplicate content

Cách khắc phục:

Cài đặt chuyển hướng để chắc chắn rằng website của bạn chỉ có một phiên bản duy nhất.

3.4 Session IDs

Session IDs lưu trữ thông tin về khách truy cập vào website và chúng thường thường được nhìn thấy với một chuỗi dài nối vào URL.

Ví dụ: example.com?sessionId=jow1234567hnfn8910

Cách khắc phục:

Cách khắc phục Duplicate Content do Session IDs được dùng phổ biến là chuẩn hóa các URL này để chúng thân thiện hơn với SEO.

3.5. URL phân biệt giữa chữ viết hoa và viết thường

Dưới đây là ví dụ về các URL phân biệt chữ viết hoa và chữ viết thường, tức là cả 3 URL này đều khác nhau:

  • example.com/page
  • example.com/PAGE
  • example.com/pAgE

Cách khắc phục:

  1. Không tạo các liên kết nội bộ với nhiều phiên bản URL để có sự nhất quán.
  2. Chuẩn hóa hoặc chuyển hướng URL.

Tham khảo bài viết về Topic Cluster và Pillar là gì?

3.6. Có hoặc không có dấu gạch chéo theo sau

Google sẽ không xem xét đến việc URL có dấu gạch chéo theo sau hay là không có dấu gạch chéo theo sau. Do đó, Google cho rằng 2 URL như dưới đây là một:

  • example.com/page/
  • example.com/page

Do đó, nếu nội dung của bạn có thể được truy cập bằng cả 2 URL (có và không có dấu gạch chéo theo sau) thì sẽ xảy ra lỗi Duplicate Content. Bạn có thể lần lượt thử truy cập bằng 2 URL này để kiểm tra.

Cách khắc phục:

Trong 2 phiên bản, chọn phiên bản mà bạn muốn và chuyển hướng phiên bản còn lại sang phiên bản mà bạn muốn. Đồng thời, hãy tạo sự nhất quán bằng cách sử dụng một toàn bộ một phiên bản (có hoặc không có dấu gạch chéo theo sau) cho tất cả các URL trên website của bạn.

3.7. URL AMP (Accelerated Mobile Pages)

Đây cũng là một trong những trường hợp có thể dẫn đến trùng lặp. Bên dưới là ví dụ về 2 URL gốc và URL AMP:

  • example.com/page
  • example.com/amp/page

Cách khắc phục:

  • Chuẩn hóa phiên bản AMP thành phiên bản không sử dụng AMP. Sử dụng thẻ rel=”amphtml” để thông báo với Google rằng các URL AMP là phiên bản thay thế cho các nội dung không chứa AMP.
  • Nếu chỉ có nội dung AMP thì bạn hãy sử dụng self-referencing canonical tag hay còn gọi là thẻ canonical tự tham chiếu.

3.8. URL thân thiện với bản in

URL thân thiện với bản in là một URL khác với bản gốc nhưng về nội dung giống nhau. Dưới đây là ví dụ về URL gốc (URL thứ 1) và URL thân thiện với bản in (URL thứ 2).

  • example.com/page
  • example.com/print/page

Cách khắc phục:

Chuẩn hóa phiên bản thân thiện với bản in thành phiên bản bản gốc.

> Đọc ngay: Audit Content là gì?

3.9. URL thân thiện với thiết bị di động

Tương tự URL thân thiện với bản in, URL thân thiện với thiết bị di động cũng có thể là nguyên nhân xuất hiện Duplicate Content cho website của bạn. Ví dụ như 2 URL dưới đây (URL trên là bản gốc, URL dưới là URL thân thiện với thiết bị di động):

  • example.com/page
  • m.example.com/page

Cách khắc phục:

Chuẩn hóa phiên bản thân thiện với thiết bị di động thành phiên bản gốc. Bạn có thể dùng cú pháp rel=“alternate” để thông báo với Google rằng URL thân thiện với thiết bị di động là phiên bản thay thế cho phiên bản nội dung trên desktop (máy để bàn).

3.10. Tag và Category Pages

*Đối với Tag:

Hầu hết với các CMS (Content Management System – Hệ quản trị nội dung), bạn đều có thể tạo các thẻ chuyên dụng.

Ví dụ: Bạn có một bài viết về “ví mini cho nam giới” và bạn sử dụng 2 tag gồm: ví nam và ví mini thì sẽ có 2 URL như sau:

  • example.com/tag/vi-nam/
  • example.comtag/vi-mini/

Mặc dù không phải trong tất cả các trường hợp nhưng đôi khi việc sử dụng thẻ tag như thế này cũng có thể gây ra Duplicate Content. Giả sử chỉ có một trang trên website có hai thẻ này thì cả 2 URL trên đều giống hệt nhau.

Cách khắc phục:

  • Không sử dụng tag (vì việc dùng thẻ này hầu như không có giá trị gì)
  • Không index những trang có nhiều thẻ.
duplicate content tag
Các trang Tag và Category cũng thường gây ra trùng lặp nội dung

*Đối với Category Pages:

Tương tự việc dùng thẻ, các trang danh mục cũng có thể dẫn đến vấn đề trùng lặp nội dung.

Cách khắc phục:

Cân nhắc việc sử dụng các danh mục trên website với số lượng ít hoặc nếu cần thiết có thể không index các trang danh mục này.

3.11. URL hình ảnh đính kèm

Nhiều CMS tạo ra các trang dành riêng cho tệp đính kèm hình ảnh và đa phần chúng sẽ không hiển thị gì ngoài hình ảnh và một số bản sao. Tình trạng Duplicate Content xảy ra bởi vì các bản sao này giống nhau tại tất cả các trang được tạo tự động

Cách khắc phục:

Tắt các trang dành riêng cho hình ảnh trong CMS (Nếu sử dụng WordPress, bạn có thể dùng plugin Yoast để xử lý vấn đề này).

3.12. Comment được phân trang

Nhiều CMS (trong đó có WordPress) cho phép comment được phân trang. Do đó, có thể sẽ tạo ra nhiều phiên bản của cùng một URL và dẫn đến Duplicate Content. Bên dưới là một số ví dụ để bạn có thể hình dung rõ hơn về trường hợp này:

  • example.com/post/
  • example.com/post/comment-page‑2
  • example.com/post/comment-page‑3

Cách khắc phục:

Tắt phân trang comment hoặc không lập chỉ mục những trang được phân trang (Với WordPress, bạn có thể sử dụng plugin Yoast).

Bài viết đề xuất: Entity là gì? Hướng dẫn triển khai Entity Building

3.13. Trang kết quả tìm kiếm nội bộ

Việc có một hộp tìm kiếm ngay trên website có lẽ khá phổ biến. Khi dùng các hộp này thì chúng ta sẽ có một URL tìm kiếm được tham số hóa.

duplicate content tim kiem noi bo
Trang tìm kiếm nội bộ cần được xử lý phù hợp để tránh Duplicate Content

Cách khắc phục:

  • Xóa các trang tìm kiếm khỏi danh sách chỉ mục của Google hoặc chặn quyền truy cập vào các trang này trong tệp robots.txt.
  • Đồng thời, hạn chế tạo các internal link (liên kết) nội bộ đến các trang chứa kết quả tìm kiếm trên website của bạn.

3.14. Localization (Bản địa hóa ngôn ngữ)

Tình huống có thể dẫn đến trùng lặp nội dung với Localization là khi bạn phân bổ một nội dung tương tự người dùng ở nhiều quốc gia nhưng họ sử dụng chung một ngôn ngữ (tiếng Anh chẳng hạn).

Ví dụ: Website của bạn có nhiều phiên bản khác nhau cho người dùng ở Mỹ, Anh và Úc. Lúc này, mỗi phiên bản sẽ gần như trùng lặp bởi ngôn ngữ của họ. Tuy nhiên, theo John Mueller (Nhà phân tích xu hướng Webmaster cấp cao tại Google) thì nội dung bản dịch không phải là Duplicate Content.

Cách khắc phục:

Sử dụng thẻ Hreflang để thông báo cho Google về mối quan hệ giữa các phiên bản.

3.15. Môi trường Staging

Khi bạn muốn thực hiện một vài thay đổi trên website của mình về code hoặc Plugin nhưng bạn không muốn hiển thị chúng công khai khi chúng vẫn chưa hoàn thiện (vì website của bạn hiện đang có rất nhiều khách truy cập mỗi ngày).

Do đó, bạn sử dụng môi trường Staging, đây là một phiên bản trùng (hoặc gần trùng lặp) của website được tạo ra với mục đích thử nghiệm. Và môi trường Staging lại ảnh hưởng đến SEO (Google vẫn index chúng) nên dẫn đến tình trạng Duplicate Content.

Cách khắc phục:

  • Xác thực HTTP, danh sách trắng các địa chỉ IP hoặc quyền truy cập VPN.
  • Sử dụng lệnh ngăn index tự động để xóa nó (nếu áp dụng cách trên nhưng nó vẫn được index)

*Lưu ý rằng sau khi xử lý hết tất cả các nội dung trùng lặp, bạn hãy redirect 301 URL trùng lặp về URL gốc nhé!

4. Cách phát hiện Duplicate content

Để kiểm tra xem nội dung của bạn có bị lỗi Duplicate Content hay không, bạn có thể sử dụng Google hoặc các công cụ khác.

xac dinh duplicate content
Dưới đây là hướng dẫn xác định nội dung trùng lặp cụ thể

4.1. Check Duplicate Content bằng Google

Đây là cách check Duplicate Content do Google đề xuất. Với cách này, bạn copy một đoạn nhỏ (khoảng hơn nửa dòng một chút) và đặt vào giữa dấu ngoặc kép. Tiếp đó, bạn dán chúng (đoạn vừa copy được đặt trong dấu ngoặc kép) vào hộp tìm kiếm của Google và nhấn enter. Bạn kiểm tra lại trong các kết quả được trả về sẽ thấy nội dung trùng lặp (nếu có).

Nếu như có một hoặc nhiều website khác hiển thị nội dung tương tự của bạn thì Google sẽ đánh giá đâu là trang gốc và ưu tiên hiển thị trang đó trước. Do đó, nếu website của bạn không phải là TOP 1 thì bạn đang gặp vấn đề Duplicate Content.

> Đọc thêm: Sitemap là gì?

4.2. Check Duplicate Content bằng công cụ miễn phí

Một cách khác cũng có thể giúp bạn check Duplicate Content đó là sử dụng các công cụ kiểm tra đạo văn. Bạn có thể tham khảo các công cụ online miễn phí dưới đây:

  • Copyscape: Đây là công cụ kiểm tra Duplicate Content với những nội dung đã được xuất bản. Rất nhanh, bạn có thể biết trang của mình có có trùng lặp nội dung với những trang nào khác hay không? Bạn sẽ thấy các nội dung trùng lặp được làm nổi bật với số liệu trùng lặp tỷ lệ bao nhiêu %.
  • Duplichecker: Cũng là một công cụ online kiểm tra trùng lặp nội dung nhưng là với bài viết bạn chỉ mới dự định đăng lên website. Với tính năng miễn phí không cần đăng ký, bạn có check văn bản dưới 1000 ký tự/lần.
  • Plagspotter: Công cụ này sẽ giúp bạn biết những trang nào đang có nội dung trùng lặp với nội dung trên website của bạn. Ngoài ra, nó còn có tính năng tự động theo dõi các URL mỗi tuần để xác định Duplicate Content.
  • Smallseotools: Đây là một bộ công cụ gồm nhiều công cụ dành cho SEO, trong đó có kiểm tra đạo văn. Do đó, bạn cũng có thể sử dụng để tìm các đoạn nội dung giống với của bạn.
  • Siteliner: Công cụ này sẽ giúp bạn phát hiện Duplicate Content bằng cách kiểm tra toàn bộ website mỗi tháng 1 lần.

> Đọc về Keyword Cannibalization và cách khắc phục ăn thịt từ khoá!

5. Kết luận

Trên đây là những nội dung giúp bạn biết được Duplicate Content là gì và tại sao nó lại không tốt cho SEO, từ đó tìm hiểu chi tiết các nguyên nhân và cách khắc phục đối với tình trạng này. Để hạn chế Duplicate Content, bạn hãy dành một chút thời gian kiểm tra trùng lặp nội dung trước khi xuất bản, có thể là với các công cụ miễn phí được gợi ý phía trên. Hy vọng hướng dẫn này đã có ích với bạn, chúc bạn thành công!

Nguồn tham khảo:

  • Avoid Duplicate Content | Google Search Central & Google Developers
  • Duplicate Content [SEO 2021] – Moz

Tham khảo thêm Dịch vụ SEO Tổng thể của TIEN ZIVEN!

Quy Tran
Quy Tran

Tôi là Quy Tran, SEO Expert đến từ TIEN ZIVEN. Mong rằng những kiến thức SEO mà tôi truyền đạt có thể giải đáp những thắc mắc, cải thiện quá trình SEO và giúp bạn gặt hái được kết quả SEO mong muốn.

icon category

SEO Cơ bản

  • SEO là gì trong Marketing? Tất tần tật về SEO
  • Cách SEO website hiệu quả độc quyền từ TIEN ZIVEN
  • Quy trình SEO Website Cơ bản
  • Hướng dẫn lập chiến lược SEO nâng cao thứ hạng nhanh chóng
  • Các thuật ngữ trong SEO thông dụng nhất mà SEOer nào cũng phải biết
  • SERP là gì? Tất tần tật SERP Features bạn sẽ gặp
  • SEO tổng thể là gì? Cách SEO Website tổng thể của TIEN ZIVEN
  • Domain Authority là gì? Cách tăng điểm DA hiệu quả
icon category

Keyword Research

  • Tổng quát về từ khóa SEO và cách chọn từ khóa SEO hiệu quả
  • Keyword Research: Hướng dẫn nghiên cứu từ khóa chi tiết
  • SERP Analysis là gì? Tại sao cần phân tích SERP?
  • Search Intent là gì? Cách phân loại Search Intent phù hợp
  • Allintitle là gì? Cách sử dụng allintitle hiệu quả trong SEO
  • Phantom Keyword là gì? Cách tìm từ khoá bóng ma nhanh và đơn giản nhất
  • Từ khoá LSI là gì? Cách dùng LSI keywords để tối ưu bài viết
  • Keywordtool.io là gì? Hướng dẫn cách sử dụng phân tích từ khoá
icon category

SEO Content

  • SEO Content là gì? Cách lập kế hoạch Content SEO hoàn chỉnh
  • Bài viết chuẩn SEO là gì? Cách viết nội dung chuẩn SEO
  • Entity là gì? 6 bước xác thực Entity building cho website
  • Cách triển khai Topic Cluster để xây dựng nội dung website
  • Content Pillar là gì? Tất tần tật về Content Pillar mới nhất
  • Content Audit là gì? Hướng dẫn Audit Content từ A – Z
  • Duplicate content là gì? Cách xử lý trùng lặp nội dung
  • DMCA protected là gì? 5 bước đơn giản đăng ký DMCA cho website
icon category

SEO Onpage

  • SEO Onpage là gì? Hướng dẫn tối ưu Onpage chi tiết
  • Hướng dẫn sử dụng Yoast SEO cơ bản từ A đến Z (cập nhật 2021)
  • Slug là gì? 5 yếu tố giúp tối ưu Slug trong WordPress
  • Meta Title là gì? Hướng dẫn tối SEO tiêu đề trang chi tiết
  • Meta description là gì? Cách viết meta description thu hút
  • Thẻ Heading là gì? Hướng dẫn tối ưu SEO cho Heading
  • Cách SEO hình ảnh lên Google từ cơ bản đến nâng cao
  • Alt text là gì? Hướng dẫn triển khai Alt text tốt nhất cho SEO
icon category

SEO Offpage

  • SEO Offpage là gì? Hướng dẫn tối ưu SEO Offpage 2022
  • Backlink là gì? 13 cách đặt backlink chất lượng 2022
  • Anchor text là gì? Cẩm nang sử dụng Anchor text hiệu quả
  • Đường link là gì? Cách triển khai link tối ưu SEO Website
  • Linkbuilding là gì? Tìm hiểu cách xây dựng liên kết tốt nhất 2021
  • Link juice là gì? Làm sao để tối ưu Link juice hiệu quả
  • Link Wheel là gì? Cách xây dựng mô hình link wheel hiệu quả nhất
  • Domain Rating là gì? Ứng dụng của chỉ số DR trong SEO
  • Trust Flow là gì? Citation Flow là gì? Cách check TF CF
  • Contextual Link là gì? Lợi ích của liên kết ngữ cảnh
  • Textlink là gì? 4 bí kíp sử dụng textlink hiệu quả nhất cho SEO
  • Cách xây dựng Private Blog Network (PBN) chất lượng cho website
  • Guest Post là gì? Lưu ý khi triển khai Guest posting
  • 3 bí kíp tạo blog comment xây dựng backlink miễn phí
  • Rút gọn link là gì? Tổng hợp website rút ngắn link miễn phí tốt nhất
icon category

Crawling & SEO Technical

  • Technical SEO là gì? Hướng dẫn cải thiện các yếu tố kỹ thuật SEO
  • Crawl dữ liệu là gì? Cách tối ưu quá trình Crawl data chi tiết
  • Crawl Budget là gì? Cách tối ưu ngân sách cào của website
  • Google Index là gì? Những yếu tố ảnh hướng đến index Google
  • Robots.txt là gì? Hướng dẫn tạo robots.txt cho website
  • Sitemap là gì? Cách tạo Sitemap website hiệu quả nhất
  • Cách Submit URL lên Google index nhanh nhất (Update 2022)
  • 6 Bước tạo nên cấu trúc website chuẩn SEO
  • Cấu trúc Silo là gì? Cách xây dựng cấu trúc silo
  • Internal Link là gì? 3 Cách đi link nội bộ hiệu quả nhất
  • Breadcrumb là gì? Tại sao tối ưu Breadcrumbs cho SEO
  • Pagination là gì? Thực hiện phân trang thế nào để đạt hiệu quả SEO nhất
  • Redirect là gì? Tất tần tật về 301 Redirect cho bạn tìm hiểu
  • Thẻ hreflang là gì? Khi nào cần dùng hreflang
  • Canonical URL là gì? 3 sai lầm khi dùng thẻ Canonical trong SEO
  • Dofollow và nofollow link là gì? Cách sử dụng chi tiết
  • Thẻ meta robots là gì? Cách thiết lập robots meta tag cho trang web
  • AMP là gì? Hướng dẫn cài đặt Google AMP cho WordPress
icon category

SEO Nâng cao

  • Keyword Cannibalization là gì? Cách phát hiện nhanh và xử lý tận gốc
  • Schema là gì? Hướng dẫn sử dụng Schema Markup chi tiết nhất
  • Featured snippet là gì? Hướng dẫn cách tối ưu featured snippet
  • Disavow link là gì? Cách sử dụng disavow tool để từ chối liên kết
  • Core Web Vitals là gì? Tối ưu Page Experience cho GG update 2022
  • Trải nghiệm người dùng là gì? Hướng dẫn tối ưu UX/UI website
  • PageSpeed Insights là gì? Bí kíp tối ưu tốc độ website hiệu quả
  • 5 cách xóa JavaScript chặn hiển thị WordPress cho website
icon category

Phân tích & Báo cáo

  • SEO Audit là gì? Cách thực hiện Website Audit chi tiết
  • ROI là gì? Công thức tính ROI trong SEO, Marketing và Content
  • Webmaster Tool là gì? Hướng dẫn sử dụng hiệu quả và chi tiết nhất
  • Google Analytics là gì? Cách sử dụng Google Analytics chi tiết
  • Traffic là gì? 7 Cách tăng traffic website hiệu quả
  • Bounce rate là gì? Các cách tối ưu giảm tỷ lệ thoát web
  • Google Tag Manager là gì? Cách sử dụng Google Tag Manager hiệu quả
  • Giới thiệu 16 công cụ kiểm tra thứ hạng từ khoá mạnh nhất 2021
icon category

SEO Tools

  • Checklist 28 phần mềm SEO website chất lượng nhất hiện nay
  • Ahrefs là gì? Hướng dẫn sử dụng Ahrefs với các chỉ số cơ bản
  • Cách sử dụng Addon SEOQuake hiệu quả cho website
  • Hướng dẫn sử dụng phần mềm SEO PowerSuite từ A-Z (2021)
  • Majestic SEO là gì? Hướng dẫn sử dụng Majestic tối ưu
  • Hướng dẫn sử dụng phần mềm GSA SEO backlink mới nhất
  • IFTTT là gì? Hướng dẫn sử dụng IFTTT SEO từ A – Z
  • Google xu hướng là gì? Hướng dẫn sử dụng Google Trends chi tiết
icon category

Thuật toán Google

  • Google Rankbrain là gì và hoạt động như thế nào?
  • Semantic là gì? Tìm hiểu chi tiết về Semantic Search
  • E-A-T SEO là gì? Tầm quan trọng của EAT trong SEO website
  • Google Panda là gì? Tìm hiểu các yếu tố của thuật toán Panda
  • Thuật toán Google Hummingbird đánh vào yếu tố SEO nào?
  • Google Sandbox là gì? Cách thoát án phạt Sandbox Google
  • Cách kiểm tra Pagerank và cải thiện Page rank của website
  • Thuật toán Penguin: Dấu hiệu nhận biết và giải pháp khắc phục
icon category

Website

  • Lỗi Error 404 là gì? Cách khắc phục lỗi 404 not found
  • Domain là gì? Tất tần tật các vấn đề về tên miền website
  • Mua tên miền ở đâu tốt nhất, uy tín nhất? (cập nhật 2021)
  • Subdomain là gì? Tạo subdomain cho website như thế nào?
  • Addon domain là gì? Cách tạo Addon domain cho website
  • Quản trị website là gì? 6 Công việc của người quản lý trang web
  • Tổng hợp 20 mẫu trang admin cho website hot nhất hiện nay
  • Web navigation là gì? Tầm quan trọng của Web navigation
icon category

Kinh nghiệm SEO

  • TOP 10 trung tâm đào tạo SEO uy tín tại TPHCM
  • Top 10 công ty SEO chuyên nghiệp, uy tín tại TPHCM
  • Checklist 15 Thủ thuật SEO link hot nhất năm 2021
  • Thiết kế Website chuẩn SEO là gì? Tìm hiểu để thiết kế Web SEO
  • Hootsuite và các công cụ quản lý mạng xã hội hỗ trợ SEO tốt nhất
  • 7 Cách tăng traffic cho website bền vững và hiệu quả
  • Cách kiểm tra website có bị google phạt đơn giản chỉ với 2 bước
  • Google My Business là gì? Lợi ích của GMB trong SEO
  • Hướng dẫn cách SEO Google Map chi tiết nhất 2021
  • SEO Youtube là gì? Cách SEO Video Youtube hiệu quả nhất
  • Page Authority (PA) là gì? Cách hoạt động của chỉ số PA
  • PPC marketing là gì? Nên chọn quảng cáo PPC hay SEO?
  • Học SEO có khó không? Nếu đam mê hãy bắt tay vào ngay!
  • Dịch vụ SEO website giá rẻ có tốt như lời đồn?
  • Nên thuê SEO hay xây đội ngũ SEO nội bộ để hiệu quả nhất
  • SEO mũ trắng là gì? White hat SEO có là sự lựa chọn tốt nhất?
  • TOP 3 kỹ năng cần thiết để trở thành một chuyên gia SEO
  • Referral là gì? 9 Cách tăng referral traffic hiệu quả cho website
  • 5 công cụ phân tích website đối thủ SEO toàn diện
  • SEO Facebook là gì? Cách SEO Fanpage hiệu quả nhất
Mục Lục
  1. 1. Duplicate content là gì?
  2. 2. Tại sao Duplicate không tốt cho SEO?
  3. 3. Nguyên nhân và cách khắc phục
    1. 3.1. Faceted Navigation (Điều hướng nhiều chiều)
    2. 3.2. Tracking Parameters (Các thông số theo dõi)
    3. 3.3. HTTPS với HTTP và non-www với www
    4. 3.4 Session IDs
    5. 3.5. URL phân biệt giữa chữ viết hoa và viết thường
    6. 3.6. Có hoặc không có dấu gạch chéo theo sau
    7. 3.7. URL AMP (Accelerated Mobile Pages)
    8. 3.8. URL thân thiện với bản in
    9. 3.9. URL thân thiện với thiết bị di động
    10. 3.10. Tag và Category Pages
    11. 3.11. URL hình ảnh đính kèm
    12. 3.12. Comment được phân trang
    13. 3.13. Trang kết quả tìm kiếm nội bộ
    14. 3.14. Localization (Bản địa hóa ngôn ngữ)
    15. 3.15. Môi trường Staging
  4. 4. Cách phát hiện Duplicate content
    1. 4.1. Check Duplicate Content bằng Google
    2. 4.2. Check Duplicate Content bằng công cụ miễn phí
  5. 5. Kết luận
TIEN ZIVEN

TIEN ZIVEN là SEO & Digital Marketing Agency tập hợp nhiều chuyên gia nổi bật. Liên hệ để được tư vấn dịch vụ digital marketing phù hợp!

CÔNG TY TNHH TIEN ZIVEN
  • Địa chỉ: 54B/9 Đường số 26,
    Hiệp Bình Chánh, Thủ Đức, TP. HCM
  • SĐT: 0938 211 040 (Zalo)
  • SĐT: 0357 626 620 (Gọi)
  • GPKD 0316640599 cấp ngày 15.12.2020
  • Nơi cấp: TP. Hồ Chí Minh
  • Website: https://tienziven.com
DỊCH VỤ
  • Dịch Vụ SEO
  • Đào Tạo SEO
  • Khoá học SEO
  • Thiết kế website
BÀI VIẾT ĐÁNG QUAN TÂM
  • Digital Marketing là gì?
  • SEO là gì?
  • Content Marketing là gì?
  • Google Ads là gì?
  • Email marketing là gì?
  • Facebook marketing là gì?
THÀNH VIÊN:
ziven-academy-logo
ziven-cv-logo
ziven-boss
THÔNG TIN WEBSITE
  • Chính Sách & Quy Định
  • Giới Thiệu
  • Liên hệ
  • Tuyển dụng
  • Thư viện Digital Marketing
THỜI GIAN HOẠT ĐỘNG
Monday 8:00 AM - 6:00 PM
Tuesday 8:00 AM - 6:00 PM
Wednesday 8:00 AM - 6:00 PM
Thursday 8:00 AM - 6:00 PM
Friday 8:00 AM - 6:00 PM
THEO DÕI CHÚNG TÔI TẠI
Facebook-f Twitter Youtube Linkedin Youtube

DMCA.com Protection Status

Chương trình đào tạo SEO
Xem Thêm
Liên hệ với chúng tôi
  • Facebook TIEN ZIVEN
  • Gọi cho chúng tôi