Canonical URL là thành phần rất quan trọng trong quá trình xử lý tình trạng trùng lặp nội dung và nhiều lỗi khác trên website. Do đó, trong bài viết này mình sẽ chia sẻ tất tần tật về Canonical URL là gì, và cách sử dụng thẻ canonical một cách hiệu quả trong quá trình SEO Website.
Thẻ canonical là gì và vai trò của canonical URL trong website và SEO
1. Canonical URL là gì? Canonical (URL) là gì? Ý nghĩa
Wikipedia và Google cũng có những giải thích cho khái niệm canonical URL
Wikipedia nói là: Canonical URL là thẻ liên kết chính thức. Và có 2 tính từ kèm theo là “CHUẨN” và “ƯU TIÊN”
Trong khi đó, Google gọi đây là URL chính tắc.
Và mình cũng thấy cụm từ Chính tắc đủ cô đọng để mô tả hoàn toàn chính xác ý nghĩa hay chức năng của Canonical URL. Vì ý nghĩa của từ chính tắc là dạng tiêu chuẩn cho các đồng loại, trong các hình thái biến đổi.
Dựa vào 2 cách định nghĩa trên, mình xây dựng một giải thích cho bạn dễ hiểu nhất canonical URL là gì:
Canonical URL là URL tiêu chuẩn, tiêu biểu nhất trong các URL biến đổi hoặc trong các trang có nội dung tương tự. URL này sẽ được Google ưu tiên lựa chọn để hiển thị trên trang kết quả tìm kiếm.
Trong đó, ví dụ về các URL biến đổi (hay là biến thể) là các URL bao gồm:
https://vietlinkevent.vn/tin-tuc-su-kien/ và
https://vietlinkevent.vn/tin-tuc-su-kien/page/2/
https://vietlinkevent.vn/tin-tuc-su-kien/page/3/
https://vietlinkevent.vn/tin-tuc-su-kien/page/4/
Còn các URL có nội dung tương tự thì bạn có thể tham khảo
https://giasu.marathon.edu.vn/
Và https://marathon.edu.vn/gia-su-online
Và trong mỗi nhóm URL ở trên, chúng ta cần chọn ra 1 URL để đại diện cho cả nhóm, lần lượt là: https://vietlinkevent.vn/tin-tuc-su-kien/ và https://marathon.edu.vn/gia-su-online. Và URL này được gọi là Canonical URL
2. Tại sao cần khai báo canonical URL?
Để hiểu lý do tại sao cần khai báo thẻ canonical thì trước hết, Chúng ta phải đặt vào tình huống ngược lại:
Nếu không khai báo thẻ canonical thì có điều gì xảy ra?
Nếu bạn không khai báo Canonical URL trong một nhóm các trang biến thể hoặc có nội dung tương tự nhau, Google sẽ không biết bạn đang muốn ưu tiên cho trang nào trong chúng để xuất hiện trên kết quả tìm kiếm. Và những trường hợp có thể xảy ra bao gồm:
- Không có một thông báo nào để Google biết rằng những trang này có liên quan với nhau. Mỗi trang có 1 URL khác nhau nhưng lại có nội dung khá giống nhau. Do đó Google sẽ kết luận các trang này bị trùng lặp nội dung.
- Vì không biết bạn muốn ưu tiên trang nào để hiển thị trên kết quả tìm kiếm, Google thông qua các thuật toán để tự quyết định. Kết quả là trang hiển thị trên kết quả tìm kiếm không phù hợp với mong muốn của bạn. (In đỏ từng trang)
- Trường hợp xấu nhất là Google đồng thời cho hiển thị những trang này trên trang kết quả tìm kiếm của 1 từ khoá. Từ đó, website của bạn rơi vào tình trạng ăn thịt từ khoá và bị kìm hãm thứ hạng. (In đỏ 2 trang)
Do đó, chúng ta sử dụng thẻ canonical trong SEO để:
- Tránh duplicate content
- Trang kết quả tìm kiếm hiển thị đúng trang mong muốn
- Tránh được tình trạng ăn thịt từ khoá
3. Cấu trúc HTML của thẻ canonical
Trước khi đi vào cách sử dụng thẻ canonical chi tiết, mình giới thiệu sơ qua về cấu trúc HTML khai báo thẻ canonical:
<link rel=”canonical” href=”https://vietlinkevent.vn/tin-tuc-su-kien/” />
Trong đó:
- Vị trí: Đặt trong đoạn <head></head>
- URL nằm trong thuộc tính href là URL mình chọn làm canonical URL
Do đó, nếu bạn muốn kiểm tra trang đã được khai báo Canonical URL hay chưa hoặc kiểm tra canonical URL của trang là URL nào thì hãy mở source code lên và search với nội dung là “canonical”.
4. Cách sử dụng thẻ canonical
Như khái niệm mình đã giải thích thì cách sử dụng thẻ canonical sẽ tóm gọn thành 2 cách sử dụng cơ bản bao gồm:
- Khai báo canonical URL cho chính nó
- Khai báo canonical URL cho các URL có nội dung tương tự
Khai báo canonical URL cho chính nó
Đầu tiên, chúng ta cần thiết lập canonical URL cho chính nó đối với từng trang. Ví dụ: https://vietlinkevent.vn/tin-tuc-su-kien/ sẽ có canonical URL là : https://vietlinkevent.vn/tin-tuc-su-kien/
Mục đích: Trong trường hợp URL này phát sinh các URL biến thể thì chúng đều chứa thẻ canonical URL là trang gốc: (https://vietlinkevent.vn/tin-tuc-su-kien/). Nhờ đó mà Google biết rằng nhóm URL này có liên quan với nhau và không bị Google liệt vào dạng trùng lặp nội dung.
Chẳng hạn như chúng ta có các biến thể khác của ví dụ trên là:
https://vietlinkevent.vn/tin-tuc-su-kien/page/2/
https://vietlinkevent.vn/tin-tuc-su-kien/page/3/
https://vietlinkevent.vn/tin-tuc-su-kien/page/4/
<Chúng ta cùng mở source code lên để kiểm tra. Bạn có thể thấy là thẻ canonical ở đây vẫn là trang tin tức sự kiện.>
Điều này cũng đúng với các phiên bản khác của website như: mobile, www và non-www… thì khi bạn khai báo thẻ canonical cho trang trên website gốc là chính nó thì ở phiên bản mobile cũng sẽ được thiết lập thẻ canonical về URL này.
Khai báo canonical URL cho các URL có nội dung tương tự
Trong trường hợp bạn có một số trang có URL khác nhau nhưng có nội dung giống nhau thì chúng ta chọn một trang làm đại diện và đặt nó làm canonical URL để Google biết đâu là URL mà bạn muốn hiển thị trên trang tìm kiếm:
2 url ví dụ là https://giasu.marathon.edu.vn/ và https://marathon.edu.vn/gia-su-online
2 trang này lần lượt có địa chỉ trên subdomain và trang còn lại nằm trên website chính. Mình muốn trang trên domain gốc hiển thị trên Google nên Mình khai báo báo URL Canonical là https://marathon.edu.vn/gia-su-online.
<Google sẽ hiểu và chỉ hiển thị trang https://marathon.edu.vn/gia-su-online trên kết quả tìm kiếm.>
Nhờ đó, bạn sẽ tránh được tình trạng trùng lặp nội dung và ăn thịt từ khoá.
5. Cách thiết lập thẻ canonical
Đối với website WordPress thì các Plugin SEO đã có sẵn vùng nhập canonical URL, nên chúng ta có thể dễ dàng thực hiện khai báo.
Với những bạn sử dụng Yoast SEO, hãy vào trình chỉnh sửa và lăn chuột đến phần của Yoast.
Sau đó chọn mục Nâng cao, nhập URL chính tắc vào mục canonical URL này và lưu lại chỉnh sửa.
Còn với Rankmath, bạn cũng cần vào trình chỉnh sửa, và tới phần nâng cao. Sau đó nhập URL chính tắc vào vùng khai báo này và lưu lại thiết lập.
Đối với những ai đang quản trị website code tay, bạn hãy yêu cầu đội ngũ hướng dẫn thêm canonical URL vào website. Vì thông thường, mỗi website code tay sẽ có một cách sử dụng khác nhau.
Trong trường hợp website của bạn chưa có vùng nhập canonical URL vào thì bạn hãy gửi cho team IT cấu trúc thẻ canonical mà mình giới thiệu lúc đầu, và nhờ họ tạo thêm phần khai báo thẻ canonical.
6. Lưu ý khi sử dụng canonical
Mặc dù chỉ có 2 cách sử dụng trên, nhưng mình có khá nhiều lưu ý cho bạn trong quá trình sử dụng thẻ canonical vì có khá nhiều mindset sai lầm và mình bắt gặp các học viên rơi vào những trường hợp này.
Trong nhóm các URL biến thể hay có nội dung tương tự thì mình sẽ phân thành: Canonical URL và URL còn lại để truyền đạt dễ hiểu hơn.
Không sử dụng robots.txt để tác động việc Google chọn Canonical URL
Điều này có nghĩa là bạn không được sử dụng robots.txt để chặn thu thập dữ liệu của các URL còn lại nhằm mục đích chỉ cho 1 URL chính tắc được thu thập dữ liệu.
Nguyên nhân là khi bạn chặn thu thập dữ liệu các trang trên thì Google sẽ không thể phát hiện thẻ canonical ở trong và điều này khá giống với việc bạn không khai báo Canonical URL vậy.
Không dùng noindex để ngăn việc lựa chọn trang chính tắc
Vì mục đích sử dụng Lệnh noindex là để loại trừ trang khỏi chỉ mục chứ không phải để quản lý việc lựa chọn trang chính tắc. Sau khi bạn khai báo canonical URL thì cần một thời gian thì Google mới hiểu và ưu tiên đúng URL mà bạn mong muốn. Do đó, bạn cần kiên nhẫn một chút và chờ đợi.
Không sử dụng thẻ canonical cho các phiên bản ngôn ngữ khác nhau
Đối với các phiên bản website khác nhau, bạn cần dùng thẻ hreflang chứ không phải canonical. Trường hợp này là dành cho những website đa ngôn ngữ. Với nhiều phiên bản ngôn ngữ, bạn cần khai báo thẻ hreflang để đối với từng địa phương, ngôn ngữ thì Google sẽ hiển thị đúng phiên bản ngôn ngữ phù hợp.
Giả sử, mình có 2 phiên bản ngôn ngữ cho một trang là tiếng Việt và tiếng Nhật.
-
- Nếu mình khai báo thẻ hreflang phù hợp cho từng trang thì đối với những người search với từ khoá tại Google việt nam thì trang tiếng Việt sẽ hiển thị. Và những ai search tại Google nhật bản thì trang tiếng nhật sẽ hiển thị trên trang kết quả tìm kiếm.
- Còn nếu bạn sử dụng thẻ canonical và khai báo về cùng 1 URL thì dù search tại Google Việt Nam hay Nhật Bản thì trên trang kết quả tìm kiếm cũng chỉ hiển thị một phiên bản ngôn ngữ mà bạn chọn làm canonical URL mà thôi
Sử dụng Canonical URL trong kế hoạch liên kết nội bộ – Internal Link
Khi thực hiện liên kết nội bộ, bạn chỉ nên sử dụng trang mà bạn chọn làm trang chính tắc. Việc sử dụng liên kết với Canonical URL thay vì các URL còn lại sẽ giúp Google càng hiểu được lựa chọn ưu tiên của bạn. Ví dụ trên trang marathon, mình chỉ đặt liên kết tới trang gia sư online ở website gốc và không có bất kì URL nào tới trang subdomain.
Google là bên quyết định URL nào xuất hiện trên SERP
Việc khai báo Canonical URL chỉ là sự lựa chọn ưu tiên CỦA BẠN. Còn việc Google lựa chọn URL nào tuỳ thuộc vào các thuật toán của họ. Chúng ta có thể Kiểm tra URL nào được GG chọn làm chính tắc bằng cách dùng Google Search Console, Hãy nhập URL vào khung và tiến hành phân tích URL. Chúng ta sẽ thấy được Canonical URL mà Google chọn TẠI ĐÂY.
Kết luận
Hy vọng qua bài viết này mình đã có thể giúp bạn hiểu được về thành phần canonical URL là gì trên website và sử dụng thẻ canonical một cách hợp lý nhằm tránh tình trạng trùng lặp nội dung, ăn thịt từ khoá và đạt hiệu quả SEO tốt.
Nếu như có bất kỳ thắc mắc, bạn hãy để lại bình luận ở video Youtube để mình có thể hỗ trợ.