Canonical là gì? Cách sử dụng thẻ Canonical tối ưu nhất

Với những người làm SEO, chắc hẳn đã nghe về canonical. Nhưng không phải ai cũng hiểu rõ canonical URL là gì, cũng như cách sử dụng, thiết lập và kiểm tra thẻ canonical. Những điều này sẽ được giải đáp chi tiết trong bài viết dưới đây bạn hãy cùng khám phá nhé!

canonical url la gi
Tìm hiểu về Canonical URL

1. Canonical URL là gì?

Canonical URL được hiểu đơn giản là cách để khai báo với công cụ tìm kiếm về việc định danh cho nội dung thuộc một thủ thể đường dẫn (URL duy nhất). Dựa vào thẻ Canonical mà Google xác định được nội dung đó thuộc trang nào và sẽ không đánh giá là trùng lặp nội dung trên một trang web trong trường hợp bài viết của các bạn phát sinh nhiều URL.

Trong trường hợp có hai URL của một trang web hiển thị nội dung và không có Redirect đến một trang duy nhất. Điều đó có nghĩa là đã xảy ra vấn đề trùng lặp nội dung và rất có thể bạn sẽ bị Google phạt.

Hoặc trường hợp khác có hai URL trên một website cùng giao hiển thị giống nhau. Nếu như cả hai trang web này đều có cùng kết quả thì cũng xảy ra vấn đề. Và lỗi là do các đơn vị thiết kế website.

canonical la gi
Khái niệm Canonical URL là gì

Tuy bạn sẽ không chú ý lắm đến vấn đề này nhưng trên cùng 1 website việc tồn tại nhiều version khác nhau sẽ gây ra tình trạng duplicate content. Khi đó công cụ tìm kiếm sẽ lập chỉ mục với nhiều version khác nhau, dẫn đến tình trạng duplicate content và hậu quả là website bị thuật toán Panda phạt.

Bởi vậy, dùng thẻ rel = “canonical” sẽ có tác dụng thông báo cho công cụ tìm kiếm biết được đâu là bản gốc và đâu là bản sao của nó. Từ đó giúp bạn tránh khỏi bị phạt do nội dung trùng lặp.

2. Thẻ Canonical quan trọng như thế nào?

Thông thường một website khi có nhiều thông tin hơn và trở nên mạnh hơn sẽ dẫn đến việc nhiều trang có nội dung tương tự hoặc trùng lặp xuất hiện. Điều này sẽ dẫn đến việc “trùng lặp nội dung” và dễ bị những thuật toán của công cụ tìm kiếm phạt.

the canonical
Thẻ canonical quan trọng với SEO

Việc “nội dung trùng lặp” là một vấn đề vô cùng phức tạp. Khi thu thập các URL có nội dung giống hệt nhau hoặc tương tự nhau các công cụ tìm kiếm sẽ có thể lựa chọn xếp hạng URL mà bạn không mong muốn. Nếu như các URL đó có đủ điều kiện index và xếp hạng cho một cụm từ khóa nhất định. Do đó, Canonical URL chính là giải pháp cho vấn đề này.

Như vậy, thẻ Canonical trong SEO có công dụng nổi bật trong việc:

  • Chỉ định một URL chuẩn mà bạn muốn người dùng nhìn thấy trên kết quả tìm kiếm.
  • Đơn giản hoá việc theo dõi chỉ số cho một sản phẩm hay một chủ đề.
  • Hợp nhất URL với những nội dung tương tự hay trùng lặp.
  • Giúp quản lý nội dung được phân phối: Nếu nội dung của bạn được xuất bản trên những miền khác nhau và bạn muốn hợp nhất xếp hạng trang cho URL ưa thích.
  • Tránh bots của những công cụ tìm kiếm dành thời gian thu nhập dữ liệu của các trang trùng lặp. Lúc đó thay vì thu thập dữ liệu các phiên bản dành cho máy tính để bàn và thiết bị di động của cùng một trang. Các bots sẽ tiến hành khai thác tối đa trang web của bạn, dành nhiều hơn thời gian thu thập dữ liệu các trang mới (hoặc cập nhật) trên trang web.

3. Hướng dẫn sử dụng thẻ canonical

3.1. Canonical URL dùng trong những trường hợp nào?

Muốn biết khi nào nên dùng thuộc tính canonical thì đầu tiên bạn phải xem khi nào thì các trang sẽ bị đánh giá là trùng lặp nhau. Bên dưới là một số kiểu trùng lặp phổ biến nhất mà tôi thường thấy:

Phiên bản “www” và không “www” + phiên bản “http” và “https”

Phổ biến nhất chính là sự khác nhau về tiên miền phụ www và giao thức https. Hay với website có phiên bản điện thoại và phiên bản máy tính.

the canonical la gi
Phiên bản “http” và “https”

Chẳng hạn với website TIEN ZIVEN của chúng tôi, ở dưới đây sẽ được xem là trùng lặp khi có cùng nội dung:
“https://tienziven.com”
“https://tienziven.com”
“https://www.tienziven.com”
“https://www.tienziven.com”

Trong trường hợp như vậy thì tôi sẽ chỉ cho URL chuẩn thông qua cách đưa vào thẻ <head> đoạn câu lệnh: <link rel =”canonical”href =”https://tienziven.com/” />
Bên cạnh đó, bạn cần dùng một vài kỹ thuật khác liên quan đến điều hướng 301 để trỏ hết những phiên bản trên URL dùng https và không có www. Bạn cần có sự trợ giúp của nhân viên lập trình web nếu không biết thực hiện với website của bạn.

Phiên bản di động và máy tính

canonical trong seo
Phiên bản máy tính và phiên bản di động

Chẳng hạn như trang báo dân trí có 2 phiên bản riêng với 2 URL:
https://dantri.com.vn/
https://m.dantri.com.vn/

Nội dung của 2 trang này gần như giống nhau hoàn toàn. Vì thế, trong source code của dân trí cũng có dòng chỉ rõ đâu là URL chuẩn: <link rel=”canonical”href= “https://dantri.com.vn/” /

Phiên bản URL có và không có dấu gạch chéo ở phần cuối của URL

Trường hợp này cũng khá phổ biến, khi có 2 phương án trong cùng 1 trang là có hoặc không có dấu gạch chéo ở phần cuối URL. Nếu bạn truy cập vào 2 URL tương tự nhau chỉ khác có gạch chéo hay không có ở sau URL và chúng vẫn hoạt động bình thường thì có nghĩa là bị trùng lặp. Thú vị là trong code không chỉ rõ canonical URL.

Trang tìm kiếm nội bộ

Ví dụ như bạn tìm kiếm nội dung với những cụm từ khóa khác nhau trên trang luatvietnam.vn
http://luatvietnam.vn/tim-van-ban.html?keywords=abc
http://luatvietnam.vn/tim-van-ban.html?keywords=xyz
Cũng sẽ bị xem là trùng lặp khi cùng 1 trang bạn từ khóa khác nhau cho URL khác nhau.
Trong mã website này cũng chỉ rõ canonical URL trong trường hợp này cho Google biết đâu là chuẩn:
<link rel=”canonical”href= “https://luatvn.vn/tim-van-ban.html/” /
Bộ lọc và sắp xếp (Filter và Sorting)

Trùng lặp chéo giữa các miền

Điều này có nghĩa là bạn có 2 hay nhiều website có tên miền khác nhau nhưng lại có các trang bị trùng lặp nội dung. Do đó, muốn tránh bị đánh lỗi thì bạn nên chỉ rõ đâu là trang chuẩn nhất và các trang trùng lặp chỉ là bản sao và cần trỏ về trang chuẩn đó.

Trang đích trở tới từ 1 trang liên kết (Referral link)

Bạn thường đặt link từ trang của mình đến trang đích trong tiếp thị liên kết. Khi nhấp chuột vào link đó người dùng sẽ được dẫn đến trang đích có tham số giới thiệu. Đây vẫn là trang cũ về bản chất nhưng sẽ có thay đổi URL. Vì thế cũng bị lỗi trùng lặp. Vì thế, bạn cũng cần chỉ ra đâu là URL chuẩn.

3.2. Cấu trúc Canonical URL

Chắc hẳn bạn đang băn khoăn thẻ Canonical có cấu trúc thế nào? Cấu trúc Canonical là cú pháp đơn giản, nhất quán và thường được đặt trong phần của website. Ví dụ như:

su dung the canonical
Cấu trúc của thẻ Canonical

Trong đoạn mã Canonical URL, ý nghĩa của từng phần được hiểu như sau:

  •  link rel=“canonical”: Liên kết trong thẻ này là bản gốc của trang này.
  •  href=“https://example.com/sample-page/”: truy cập bản gốc tại đây.

3.3. Cách thiết lập thẻ Canonical

3.3.1. Thiết lập thẻ Canonical trong SEO bằng sử dụng HTML

Để chỉ định link gốc thì việc sử dụng thẻ rel = canonical là cách đơn giản và rõ ràng nhất. Bước thực hiện cực kỳ đơn giản: Bạn chỉ cần thêm mã sau <link rel=“canonical” href=“https://example.com/canonical-page/” /> vào phần <head> của bất kỳ trang trùng lặp nào.

cai dat the canonical
Cài đặt thẻ Canonical bằng cách dùng HTML rel = “canonical”

Ví dụ: Giả sử bạn có một web thương mại điện tử bán áo thun. Và bạn muốn chỉ định URL gốc là https://yourstore.com/tshirts/black-tshirts/. Ngay cả khi nội dung của trang đó có truy cập được qua những URL khác như: https://yourstore.com/offers/black-tshirts/. Khi đó, bạn chỉ cần thêm thẻ tag <link rel=“canonical” href=“https://yourstore.com/tshirts/black-tshirts/” /> vào bất kỳ trang trùng lặp nào.

Cài đặt thẻ Canonical bằng cách dùng HTML rel = “canonical”
Lưu ý bạn không cần phải lo lắng về mã code của trang nếu bạn đang dùng CMS.

3.3.2. Thiết lập Canonical URL với Yoast SEO trong WordPress

Việc gắn thẻ liên kết Canonical cho trang thực hiện tương đối đơn giản và nhanh chóng với website được xây dựng trên nền tảng CMS WordPress theo các bước sau:
Bước 1: Tiến hành cài đặt Plugins Yoast SEO.
Bước 2: Chỉnh sửa hay thêm mới bài viết (Điều này có thể áp dụng cho trang/danh mục/tags).
Nhấp chọn phần “Nâng cao” trên mỗi bài đăng hoặc trang để thêm các mục tùy chỉnh cho thẻ.

thiet lap URL chuan
Trong phần nâng cao của Yoast SEO thiết lập URL chuẩn

Lưu ý: Thiết lập đường dẫn tuyệt đối của URL trang chuẩn

4. Cách kiểm tra thẻ Canonical đã được thiết lập hay chưa?

Bạn có thể kiểm tra sau khi thiết lập canonical URL cho trang. Để có hiệu suất SEO tối ưu có một số hạng mục bạn nên kiểm tra. Cụ thể đó là:

  • Trang có được khai báo thẻ chuẩn hay không?
  • URL chuẩn có thể thu thập dữ liệu cũng như lập chỉ mục không?

Trỏ chính tắc vào một URL bị chặn bởi tệp robots.txt hoặc được đặt thành “noindex là một lỗi rất phổ biến. Việc này có thể khiến gửi tín hiệu hỗn hợp và các công cụ tìm kiếm sẽ thấy khó hiểu. Do đó, bạn hãy kiểm tra chúng:

4.1. Kiểm tra bằng cách xem nguồn trang

kiem tra canonical tag
Kiểm tra canonical bằng cách xem nguồn trang

Trong đa số các trình duyệt, để xem nguồn trang (View Page Source) bạn có thể nhấp chuột phải hoặc chỉ cần nhập vào thanh địa chỉ cấu trúc: view-source: https: //domain.com. Bạn chỉ cần tìm kiếm thẻ chuẩn trong <head> để Tab mã nguồn của trang sẽ hiển thị.

4.2. Kiểm tra bằng công cụ Mozbar, SeoQuake…

Hiện nay, để kiểm tra thẻ canonical có khá nhiều công cụ nhưng trong bài viết này chúng tôi sẽ giới thiệu với các bạn 2 công cụ SEO miễn phí đó là Mozbar và SeoQuake.

5. Những lỗi phổ biến khi dùng thẻ Canonical

Có thể khẳng định Canonicalization là một chủ đề hơi phức tạp. Trong những năm qua nó thường xuyên nằm trong TOP những lỗi kỹ thuật SEO thường gặp nhất.
Trên thực tế, có không ít hiểu lầm cũng như quan niệm sai lầm về việc dùng Canonical URL đúng cách. Dưới đây là một số sai lầm phổ biến khi sử dụng thẻ canonical trong SEO mà nhiều người thường mắc phải:

loi canonical tag
Lỗi phổ biến trong canonical tag

Sai lầm 1: Chặn URL được chuẩn hóa qua Robots.txt

Việc chặn một URL trong robots.txt sẽ ngăn không cho công cụ tìm kiếm thu thập dữ liệu. Điều này có nghĩa là họ không thể thấy bất kỳ thẻ Canonical nào trên đó. Như vậy sẽ khiến Google không tài nào chuyển hóa “link equity” từ Non-Canonical sang Canonical.

Sai lầm 2: Đặt URL được chuẩn hóa thành ‘noindex’

Bạn nên nhớ tốt nhất là không nên kết hợp noindex với thẻ canonical lại với nhau. Bởi đây là 2 yếu tố hoàn toàn đối lập nhau.
Thường thì Google sẽ ưu tiên thẻ Canonical hơn là thẻ “noindex”. Hãy sử dụng 301 redirects trong trường hợp bạn muốn thực hiện đồng thời noindex và gắn thẻ Tag. Còn không thì chỉ cần sử dụng rel = canonical mà thôi.

Sai lầm 3: Đặt mã trạng thái HTTP 4XX cho URL gốc

Tác động của việc đặt mã HTTP 4XX cho URL gốc cũng tương tự như việc sử dụng thẻ “noindex”. Khi đó, Google sẽ không thể nhìn thấy thẻ canonical để chuyển “link quity” sang bản gốc.

trang thai HTTP 4XX
Đặt mã trạng thái HTTP 4XX cho URL gốc

Sai lầm 4: Canonicalizing tất cả các Paginated Page đến Page gốc

Chúng ta sẽ sử dụng thẻ Tag tự tham chiếu trên những trang paginated page đầu tiên trong chuỗi chứ không nên sử dụng thẻ canonical đến đó.
Lời giải thích cho nghi vấn này John Mueller đưa ra như sau: Nếu page A không tương tự như page B. Thì việc page B đang sử dụng rel=canonical muốn trỏ đến page A sẽ không được chấp thuận dùng rel = canonical không đúng cách.

Để phân trang bạn cũng nên sử dụng thẻ rel=”prev” và rel=”next”. Tuy cấu trúc này không còn thịnh hành nhưng một số web khác, ví dụ như Bing, vẫn còn sử dụng nó.

Sai lầm 5: Không dùng Canonical URL với Hreflang

Để chỉ định target đối tượng dựa vào ngôn ngữ và vị trí địa lý của website Hreflang tags được sử dụng.

su dung canonical tag
Không dùng Canonical Tags với Hreflang

Khi sử dụng hreflang, Google khuyên rằng bạn nên chỉ định trang gốc có cùng một ngôn ngữ với website hoặc nếu không thể tìm ra ngôn ngữ chung cho cả 2 thì nên dùng ngôn ngữ thay thế tốt nhất.

Sai lầm 6: Có quá nhiều thẻ rel=canonical

Khi có quá nhiều thẻ rel = canonical sẽ khiến công cụ tìm kiếm Google dễ dàng bỏ qua tất cả. Điều này xảy ra do những thẻ được thêm vào hệ thống ở các điểm khác nhau: Ví dụ như bởi Theme, CMS, và (các) plugin. Đó cũng lý do vì sao nhiều plugin có tùy chọn ghi đè đảm bảo chúng là nguồn duy nhất cho những Canonical URL.

Cũng có không ít trường hợp thẻ rel = canonical được thêm vào bởi JavaScript. Chỉ khi URL gốc không xuất hiện trên HTML thì Google chấp thuận trường hợp này và sau đó bạn thêm thẻ rel = canonical với JavaScript.
Ngược lại, nếu bạn lại tiếp tục hoán đổi page khác ưa thích bằng JavaScript trong khi HTML đã có thẻ rồi. Thì bạn có thể đang làm khó Google bởi hàng loạt tín hiệu hỗn hợp. Hãy cẩn thận bạn nhé!

Sai lầm 7: Đặt rel=canonical trong phần Body

rel=canonical
rel=canonical

Chỉ nên xuất hiện Rel = canonical trong <head> của tài liệu. Trong phần <body> của web thẻ chuẩn rất dễ bị bỏ qua.
Tuy mã nguồn của một trang có thể có thẻ rel = canonical ở đúng vị trí. Nhưng trên thực tế khi thực sự nó được tạo trong trình duyệt hay được hiển thị bởi Google thì sẽ xảy ra nhiều vấn đề như: Thẻ không được đóng, JavaScript bị chèn hoặc <iframes> trong phần <head>,… khiến cho <head> phải kết thúc sớm trong khung trình duyệt.

Ở trường hợp này, thẻ Tag bị chuyển vào <body> của một trang đang hiển thị mà không được chấp nhận.

Lời kết

Hy vọng những chia sẻ ở trên sẽ giúp các bạn đang tìm hiểu về SEO hiểu rõ Canonical URL là gì, biết cách thiết lập, sử dụng và kiểm tra thẻ canonical trong SEO hợp lý giúp cho quá trình tối ưu trang web hiệu quả hơn.

Nếu có bất cứ băn khoăn hay thắc mắc về thẻ canonical, hãy comment bên dưới nhé!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *