canonical-url

Canonical Url Là Gì? 5 Cách Sử Dụng Hiệu Quả Thẻ Canonical

Hiểu được cách sử dụng đúng thẻ canonical và canonical url là một kiến thức cần thiết cho SEOer.

Đồng thời bạn cần nắm được những sai lầm khi sử dụng dẫn đến ảnh hướng không tốt tới website.

Thẻ canonical được giới thiệu lần đầu vào năm 2009 nhằm giúp chủ website có thể xử lý được nội dung trùng lặp và tương tự nhau ở trên nhiều url khác nhau.

Nhưng để hiểu cách sử dụng trước tiên bạn cần phải hiểu được nó là gì, hoạt động như thế nào? Chúng ta cùng bắt đầu nhé.

Canonical Url là gì? Thẻ Canonical là gì?

Có thể bạn đã từng thấy dòng mã rel=”canonical”, canonical tags là cách bạn nói với bộ máy tìm kiếm rằng đây là bản chính của bài viết này.

Nó cho phép bạn chỉ định một canonical url cụ thể cho một trang bất kỳ (mình sẽ giải thích kỹ hơn phía dưới)

Vậy sự khác nhau giữa canonical url và thẻ canonical (tags) là gì?

Canonical Tags

Canonical tags (rel=”canonical”) là một đoạn mã HTML xác định phiên bản chính cho các trang trùng lặp hoặc có nội dung tương tự.

Nói cách khác khi bạn có các trang nội dung tương tự nhau trong các url khác nhau, bạn có thể sử dụng thẻ canonical để chỉ định phiên bản nào là chính và được phép lập chỉ mục (index).

Ví dụ như hình dưới: Website bạn có bán giày A. Giày loại A này lại có nhiều màu khác nhau. 

Thì các trang có phiên bản màu khác nhau sẽ cần đặt thẻ canonical tags về trang chính.

what-is-the-canonical-tag

Nguồn: BacklinkO

Thẻ Canonical trông cụ thể như thế nào?

Canonical tags có cú pháp sử dụng rất đơn giản và chúng thường được đặt ở thẻ <head></head> ở mỗi nội dung cần sử dụng.

<link rel=“canonical” href=“https://example.com/sample-page/” />
squarespace-rel-canonical

Bạn có thể hiểu cụ thể đoạn mã trên như sau:

  • link rel=”canonical”: Liên kết ở trong thẻ này sẽ là phiên bản chuẩn (chính) của trang nội dung đang được đặt thẻ này.
  • href=“https://example.com/sample-page/”: Phiên bản chuẩn (chính) sẽ được đặt trong mã này.

Các bạn có thể nghĩ rằng thẻ canonical tags và canonical url được sử dụng thay thế cho nhau (kiểu giống nhau).

Điều này không đúng! Lý do là vì thẻ rel=”canonical” được xem là 1 phương pháp phổ biến nhất để chọn ra canonical url chính thôi – tuy nhiên đây không phải phương pháp duy nhất.

Canonical URL

Canonical Url là một liên kết url được chọn làm liên kết url “chính” cho các trang có nội dung trùng lặp hoặc tương tự.

Khái niệm theo Google: Canonical Url là url của trang mà Google nghĩ nó sẽ đại diện cho tập hợp các trang có nội dung trùng lặp với url đó.

Điều này có nghĩa rằng bạn có thể chọn ra một Canonical Url, tuy nhiên Google có thể tự chọn ra một url khác vì nhiều lý do khác nhau.

Cho nên nếu được sử dụng chính xác thì url bạn chọn sẽ được chọn làm trang chuẩn (chính) cho các phiên bản còn lại.

Một khái niệm khác bạn cần biết: Canonicalization là quá trình chọn ra phiên bản chuẩn (chính) được ưa thích hơn so với nhiều phiên bản khác.

Một điều thú vị là Canonical url có thể nằm trên một tên miền khác. Trong trường hợp này thì trang của domain bị gắn canonical sẽ không còn được index trên công cụ tìm kiếm nữa.

Có cách nào khác mà Canonical URL được chọn không?

Như mình đã nói ở trên canonical tags không phải là cách duy nhất để chọn ra canonical url.

Bạn có thể sử dụng những cách khác để chọn canonical url như:

  • Đặt thẻ rel=canonical vào thẻ HTTP header
  • Sử dụng sitemap
  • Sử dụng chuyển hướng 301
  • Sử dụng biến thể AMP

Trên đây đều là những cách mà Google đã chỉ ra như hình dưới. Tuy nhiên chúng sẽ không phù hợp ở một số trường hợp nhất định. (Mình sẽ hướng dẫn chi tiết ở phần dưới)

define-canonical-by-google

Ở đây mình chỉ muốn nhấn mạnh cho bạn là sử dụng thẻ canonical không phải cách duy nhất, Google sẽ sử dụng các tín hiệu khác để xác định trang chuẩn.

Lưu ý: Việc sử dụng canonical url không chặn việc Google thực hiện thu thập dữ liệu trên website của bạn. Nó chỉ là một tín hiệu ưu tiên hỗ trợ cho Google thôi.

Tại sao nội dung trùng lặp rất dễ xuất hiện?

Bạn có tự tin rằng nội dung trên website của mình không có nội dung trùng lặp không?

Một điều bạn cần chú ý đó là bộ máy tìm kiếm sẽ đi thu thập thông tin của liên kết (url) chứ không phải chỉ đi crawl nội dung.

SEO-Duplicate-Content

Trường hợp này mặc dù xảy ra thường xuyên ở các trang thương mại điện tử (ecommerce) nhưng ở các trang bình thường cũng xuất hiện.

Dưới đây là một số trường hợp nội dung trùng lặp sẽ xuất hiện:

1. Các Url có tham số: example.com?xxx (tức là phía sau dấu “?” có thêm ký tự các xxx khác như nguồn tìm kiếm, nguồn id, phân loại hàng hóa,..)

2. Có 1 nội dung nhưng nằm trong các thư mục (categories) khác nhau: example.com/services/SEO/ và example.com/offers/SEO/

3. Nội dung nằm ở 2 thiết bị khác nhau: example.com và m.example.com

4. Nội dung có AMP và non-AMP: example.com/page và amp.example/page

5. Nội dung có www và non-www: http://example.com và http://www.example.com

6. Nội dung có https and non-https: http://www.example.com và https://www.example.com

7. Nội dung có dấu “/” và không có ở cuối url: https://example.com/page/ và http://www.example.com/page

8. Nội dung có chứa ký tự viết hoa: https://example.com/page/ và http://www.example.com/PAGE/

9. Nội dung có chứa index: https://www.example.com/ và https://www.example.com/index.htm

Trong những trường hợp trên thì việc sử dụng canonical tags là nhân tố quyết định.

Sự thật là có rất nhiều website hiện nay họ còn chưa nhận ra được mình đang gặp một trong những vấn đề trên.

Vậy có cần nhất thiết phải sửa chữa vấn đề này không?

Tại sao thẻ Canonical Tags lại quan trọng đối với SEO?

Google không hề thích nội dung trùng lặp. Điều này sẽ khiến nó rất khó để lựa chọn rằng:

  • Phiên bản nào sẽ được chọn để lập chỉ mục (nó sẽ chỉ ưu tiên 1 nội dung)
  • Phiên bản nào sẽ được xếp hạng với từ khóa liên quan
  • Phiên bản nào sẽ nhận được toàn bộ sức mạnh của liên kết hay được chia nhỏ ra các phiên bản khác

Mặt khác nếu có quá nhiều nội dung trùng lặp sẽ ảnh hưởng tới “crawl budget” của Googlebot.

Điều này có nghĩa là Google sẽ đi dạo và hết xăng ở các nội dung trùng lặp thay vì đi tìm đến những nội dung quan trọng khác trên website.

canonical-tags-image

Nguồn: Ahrefs

Không những thế còn xảy ra tình trạng ăn thịt từ khóa (keyword cannibalization). Khi đó Google sẽ không xác định được nội dung nào sẽ ưu tiên hiển thị lên công cụ tìm kiếm.

Và cách giải quyết ở đây là sử dụng canonical url.

Điều này sẽ giúp cho Google biết được trang nào là được lập chỉ mục, xếp hạng cũng như dồn sức mạnh liên kết vào nó.

LƯU Ý: Google đã tuyên bố rằng họ sẽ ưu tiên việc bạn chọn phiên bản nào là nội dung chuẩn (chính) nhưng không phải lúc nào họ cũng sẽ làm như vậy.

Bởi vì thẻ canonical tags là một lời nhắc nhở chứ không phải một yêu cầu bắt buộc.

Nhưng việc sử dụng thẻ canonical một cách hợp lý cũng giúp giảm thiểu nguy cơ Google tự cho phép nó chọn một nội dung chuẩn (chính) bạn không mong muốn.

Lưu ý quan trọng khi sử dụng thẻ Canonical

1. Sử dụng Url tuyệt đối

John Mueller đã trả lời rằng nên sử dụng Url tuyệt đối không nên sử dụng Url tương đối khi đi với thẻ rel=”canonical”

john-reply-canonical-tags

Khi triển khai bạn nên sử dụng tương tự đoạn mã sau:

<link rel=“canonical” href=“https://example.com/sample-page/” />

Chứ không nên sử dụng đoạn mã như dưới:

<link rel=“canonical” href=”/sample-page/” />

2. Sử dụng chữ cái thường trong Url

Google sẽ phân biệt rõ ràng chữ cái viết hoa và viết thường trong Url là hoàn toàn khác nhau.

Bạn hãy đảm bảo rằng mọi url trong website đều ở dạng chữ thường.

Sau đó bạn hãy dùng canonical tags bằng chữ thường để tránh nhầm lẫn một nội dung khác.

3. Sử dụng domain chuẩn

Nếu bạn đã chuyển qua website là SSL thì hãy luôn nhớ rằng không sử dụng bất kỳ Url nào ở dạng non-SSL (ví dụ HTTP) trong các thẻ canonical của mình.

Nếu bạn làm như vậy kết quả dẫn đến nhầm lẫn và sẽ không đạt như mong muốn.

Bạn hãy đảm bảo rằng sử dụng đoạn mã như sau:

<link rel = “canonical” href = “https://example.com/sample-page/” />

Thay thế cho:

<link rel = “canonical” href = “http://example.com/sample-page/” />

Còn nếu bạn không sử dụng HTTPs thì hãy cứ dùng HTTP ở mọi url như bình thường.

Một điều lưu ý khác bạn cần quan tâm đó là luôn trỏ thẻ canonical về trang đã hoặc có khả năng được lập chỉ mục (google index).

4. Sử dụng thẻ canonical tự tham chiếu

John Mueller của Google nói rằng đây mặc dù không phải yêu cầu bắt buộc nhưng thẻ canonical tự tham chiếu (self-referential) được đánh giá cao nên sử dụng.

john-recommended-self-referential-canonical

Đại ý đoạn trích dẫn trên là nếu sử dụng thẻ canonical tự tham chiếu thì khi bạn có một trang nội dung với nhiều dạng urls khác nhau (viết hoa, viết thường, có www, non-www,…) thì nó sẽ tự tham chiếu về một url tham chiếu.

Về cách thức hoạt động khá dễ hiểu.

Cơ bản đây là một thẻ chuẩn trên trang trỏ đến chính nó.

Ví dụ: nếu URL nội dung bạn là https://example.com/sample-page

Thì một thẻ canonical tự tham chiếu trên trang đó sẽ là:

<link rel = “canonical” href = “https://example.com/sample-page” />

5. Sử dụng mỗi trang 1 thẻ canonical

Nếu một trang bạn sử dụng quá 1 thẻ canonical thì Google sẽ bỏ qua toàn bộ

Vì vậy để tránh Google hiểu nhầm thì bạn cần kiểm tra kỹ đoạn mã được gắn trên trang.

Đồng thời kiểm tra các cách thức đặt canonical url khác nữa không chỉ là canonical tags.

5 Cách sử dụng Canonical Url hiệu quả

canonical-tags-image-01

1. Sử dụng rel=”canonical” HTML tags

Sử dụng rel=”canonical” tag là cách đơn giản nhất để xác định nên trang chuẩn (chính).

Việc bạn cần làm là thêm dòng mã dưới đây vào thẻ <head></head> cho các trang có nội dung tương tự:

<link rel=“canonical” href=“https://example.com/canonical-page/” />

Đây là một cách mà SEOer có thể làm mà không cần tới IT.

Đối với WordPress bạn có thể sử dụng Plugin để thêm mã này vào:

1. Yoast SEO

Cài đặt Plugin Yoast SEO và sử dụng chức năng như hình dưới của nó để triển khai thẻ canonical.

canonical-yoast

2. Rank Math SEO

Cũng giống với Plugin trên bạn chỉ cần cài Plugin Rank Math SEO và sử dụng.

rankmath-canonicals

2. Cài đặt thẻ canonical trong HTTP headers

Đối với các trang tài liệu PDF chẳng hạn (hoặc các tài liệu khác không ở dạng HTML) thì bạn không thể nào đặt thẻ canonical vào tiêu đề trang vì không có phần <head></head>

Trong trường hợp này bạn cần sử dụng HTTP headers để đặt thẻ canonical. Và đương nhiên đối với các trang bình thường bạn cũng có thể sử dụng cách này.

Nhưng bạn có thể sẽ cần đến IT để thực hiện công việc này.

Bạn cần truy cập tệp .htaccess trên trang web của mình và chọn ra canonical url bằng cách thêm đoạn mã sau:

<Files "file-to-canonicalize.pdf">
Header add Link "< http://www.website.com/canonical-page/>; rel=\"canonical\""
</Files>

Nên đọc thêm: Cách thêm thẻ canonical vào HTTP headers (tiếng Anh)

3. Sử dụng thẻ canonical trong sitemaps

Google đã thông báo rằng không nên để những trang non-canonical trong sitemaps. Chỉ ưu tiên để canonical url vào trong đó thôi.

Lý do bởi vì Google thường mặc định rằng những trang trong sitemaps đều là trang chính (chuẩn)

Tuy nhiên, Google sẽ không luôn luôn chọn những URLs trong sitemaps đều là canonical url.

Nhưng đây là cách hỗ trợ Google một cách tốt nhất để xác định trang nào bạn cho là quan trọng.

Dù muốn hay không hãy luôn đảm bảo hạn chế tối đa các trang trùng lặp nội dung bên trong sitemaps.

4. Sử dụng điều hướng 301

301

Sử dụng 301 redirects nếu bạn muốn điều hướng traffic từ nội dung trùng lặp qua canonical url.

Ví dụ:

Trên website bạn có 3 trang có thể mở được:

  • example.com
  • example.com/index.php
  • example.com/home/

Bạn hãy chọn 1 canonical url và sử dụng redirect 301 về trang đó.

Có một trường hợp thú vị như thế này: Nếu Page A có backlink mạnh trỏ về. Mặc dù Page A tham chiếu Page B là canonical url của nó thì Google vẫn sẽ bỏ qua Page B và chỉ index Page A.

Theo Matt Cutts của Google đã nói rằng “thực sự không có nhiều khác biệt giữa chúng (redirect 301 và canonical url)

Cho nên trong trường hợp này bạn hãy ưu tiên sử dụng redirect 301 hơn là dùng thẻ canonical tags thông thường nhé.

Như những ví dụ về nội dung trùng lặp mình có liệt kê ở phần đầu bài viết bạn cũng có thể sử dụng phương pháp này. Mình liệt kê lại một số trường hợp như:

  • HTTP và HTTPS
  • Non-WWW và WWW
  • Có dấu / ở cuối url hoặc không có
  • Viết hoa và viết thường

5. Sử dụng liên kết nội bộ

Cách bạn liên kết trang này qua trang khác (internal link) trên website là một tín hiệu cho canonical.

Đây là một trong những tín hiệu đã được đề cập đến bởi John Mueller của Google trong video dưới:

site-is-preference

Việc trang nội dung của bạn càng nhất quán với các tín hiệu này bao nhiêu thì công cụ tìm kiếm càng dễ dàng xác định được canonical url chuẩn mà bạn muốn.

Ngoài ra, bạn có thể thấy ở video trên thì Google sẽ ưu tiên những trang sử dụng HTTPS và url đẹp hơn.

7 Lỗi thường gặp khi sử dụng thẻ Canonical

rel-canonical-tag

Đôi khi cách triển khai nhìn đơn giản như thế, nhưng vẫn còn đó về các hiểu lầm và sai lầm khi triển khai thẻ canonical.

#1. Chặn canonical url trong file robots.txt

Chặn url trong robots.txt sẽ ngăn việc Googlebot thu thập thông tin trang đó. Điều này đồng nghĩa với việc nó sẽ không xác định được trang đó là canonical url.

Và cũng chặn luôn dòng chảy sức mạnh (link equity) từ trang non-canonical qua trang canonical.

#2. Đặt canonical url chứa thẻ “noindex”

Đừng bao giờ sử dụng kết hợp giữa thẻ noindex và thẻ canonical, chúng hoàn toàn mâu thuẫn với nhau.

Google sẽ ưu tiên thẻ canonical so với thẻ noindex.

Nếu bạn vừa muốn sử dụng noindex lẫn xác định nội dung đó là canonical url thì hãy sử dụng 301 redirects. Còn ngược lại hãy sử dụng thẻ canonical.

#3. Đặt mã phản hồi 4xx đối với canonical url

Việc đặt mã phản hồi 4xx cho canonical url thì Google sẽ không thể nhìn thấy thẻ canonical được, đồng thời dòng chảy sức mạnh (link equity) cũng không chuyển sang liên kết này được.

#4. Không sử dụng thẻ canonical với thẻ hreflang

Thẻ Hreflang được sử dụng để chỉ định ngôn ngữ và địa lý của website trên công cụ tìm kiếm.

Google tuyên bố rằng bạn chỉ nên sử dụng thẻ canonical đối với những trang có cùng ngôn ngữ hoặc tương tự (anh-mỹ, anh-anh).

#5. Có nhiều thẻ rel=”canonical”

Việc có quá nhiều thẻ rel=”canonical” trên một nội dung sẽ khiến Google bỏ qua canonical nội dung của bạn.

Như mình có liệt kê các sử dụng ở trên nếu bạn áp dụng canonical ở nhiều phương pháp khác nhau thì đấy chính là lý do dẫn đến xung đột.

Cho nên nếu bạn sử dụng thẻ canonical thì bạn hãy chỉ nên sử dụng 1 phương pháp ở tất cả các nội dung mà bạn muốn để tránh quên hoặc sử dụng thái quá.

#6. Sử dụng thẻ rel=”canonical”  trong thẻ <body>

Rel=”canonical” chỉ được phép xuất hiện trong thẻ <head>. Nếu nó xuất hiện trong thẻ <body> thì sẽ bị bỏ qua.

#7. Sử dụng nội dung không liên quan

rel-canonical-tag-for-cross-domain-content

Bạn không nên sử dụng thẻ canonical cho các nội dung không trùng lặp hoặc không liên quan.

Đôi khi một vài người nghĩ là việc này sẽ giúp thao túng kết quả tìm kiếm nhằm tăng thứ hạng cho các nội dung chính nhưng đây không phải cách canonical được sinh ra.

Nên hãy tránh xa nếu được khuyên làm bạn nhé.

#8. Tránh tín hiệu hỗn hợp

Công cụ tìm kiếm có khả năng rất cao sẽ tránh các tín hiệu hỗn hợp.

Tín hiệu hỗn hợp là việc bạn sử dụng thẻ canonical Page A qua Page B, sau đó Page B qua Page C (hoặc từ Page B lại về Page A – hoặc từ Page B bạn lại redirect 301 về Page A).

Điều này hoàn toàn gây nhiễu tín hiệu cho công cụ tìm kiếm.

Bạn hãy luôn luôn gửi tín hiệu rõ ràng cho công cụ tìm kiếm nếu bạn muốn nó tôn trọng nội dung bạn muốn ưu tiên.

——

Bạn có thể sử dụng công cụ Ahrefs’ Site Audit, Moz Pro hoặc SEMrush Site Audit để kiểm tra lại website nhé.

Hoặc đơn giản hơn bạn có thể sử dụng view sources ở trang nội dung để xem. (đến 1 trang nội dung bất kỳ nhấp chuột phải chọn “View page sources” hoặc bạn nhấn phím tắt Ctrl+U)

Sau đó bạn tìm kiếm dòng mã có chứa ký tự: canonical

canonical-view-source

Để kiểm tra và sửa lỗi về canonical url bạn có thể tham khảo thêm tại đây: https://ahrefs.com/blog/canonical-tags/#fix-canonicalization-issues

Tóm lại là

Sử dụng thẻ canonical tags chỉ là một cách thông dụng để xác định nên canonical url.

Cách sử dụng canonical không phức tạp nhưng rất dễ bị rối và dẫn đến lỗi sai nếu không quản lý tốt.

Thường thì bạn sẽ nghĩ nội dung trùng lặp dễ gặp hơn ở các trang thương mại điện tử. Đúng! Nhưng thậm chí ở các trang web bình thường trường hợp này cũng xảy ra không ít.

Canonical url chỉ được xem là một tín hiệu chứ không phải là một quy tắc bạn gán cho website. Google có thể sẽ tự chọn canonical url vì nhiều lý do khác.

Bạn có thể sử dụng công cụ kiểm tra Url trong Google Search Console để xem trang chuẩn do người dùng khai báo và trang do Google chọn.

url-inspection-tool-canonicals

Sau khi đọc xong bài viết bạn đã hiểu hơn về canonical url và cách sử dụng của nó chưa?

Bạn hãy nên rà soát lại nội dung trùng lặp trên website cũng như tình trạng sử dụng thẻ canonical trên website hiện tại để có phương án khắc phục phù hợp.

Nếu còn thắc mắc nào khác bạn hãy để lại comment phía dưới mình sẽ trả lời giúp bạn nhé.

Cảm ơn bạn đã đọc bài viết.

From Cường Dizi.

Fanpage: https://www.facebook.com/CuongDigitalPage/

Email: [email protected]

Nguồn tham khảo:

https://www.semrush.com/blog/canonical-url-guide/

https://moz.com/learn/seo/canonicalization

https://www.contentkingapp.com/academy/canonical/

https://yoast.com/rel-canonical/

Spread the love ♥
Marketing for Beginner – Back to Basic
Posts created 43
5 1 vote
Article Rating
Subscribe
Thông báo về
guest
0 Comments
Phản hồi dưới bình luận này
Xem tất cả các bình luận

Nhập cụm từ bạn muốn tìm kiếm và nhấn Enter. ESC để hủy.

Content Protection by DMCA.com
0
Mình rất vui khi bạn để lại bình luậnx
()
x
Scroll-to-top