Bạn có thể đã đầu tư rất nhiều thời gian và năng lượng vào Tối ưu hóa Công cụ Tìm kiếm (SEO) trên trang web của mình bởi vì bạn muốn nội dung của mình có thứ hạng tốt trên Google. Bạn đã quan tâm đến các khái niệm SEO trên trang như tiêu đề và mô tả meta. Bạn đã học về xây dựng liên kết. Bạn thậm chí đang tạo ra nội dung chất lượng cao một cách bình thường. Nhưng mọi thứ bạn đã học và mọi thứ bạn đã làm có thể trở nên lãng phí nếu bạn bỏ qua việc chuẩn hóa.
Các bài viết liên quan:
Hiểu cách sử dụng thẻ chuẩn và đặt URL chuẩn là điều cần thiết để tối ưu hóa trang web của bạn cho tìm kiếm. Mặc dù chuẩn hóa không phải là một khái niệm khó nắm vững, nhưng các lỗi triển khai đơn giản có thể gây ra các vấn đề phổ biến có thể ảnh hưởng tiêu cực đến hiệu suất trang web của bạn.
Hãy bắt đầu với định nghĩa thẻ chuẩn.
Thẻ Canonical & URL Canonical là gì?
Thẻ chuẩn là một phần tử HTML cho các công cụ tìm kiếm biết rằng một URL cụ thể là phiên bản chính của một trang và đó là URL bạn muốn xuất hiện trong kết quả tìm kiếm. Nó đặc biệt hữu ích khi bạn có các trang có nội dung rất giống nhau (hoặc giống nhau) và muốn đảm bảo rằng các công cụ tìm kiếm không phân loại chúng là nội dung trùng lặp.
Sự khác biệt giữa thẻ Canonical & URL Canonical là gì?
Bạn có thể nghe thấy mọi người sử dụng cụm từ “thẻ chuẩn” và “URL chuẩn” (hoặc “liên kết chuẩn”) thay thế cho nhau, điều này không chính xác và có thể gây ra một số nhầm lẫn.
Đây là sự khác biệt:
Thẻ Canonical
Các thẻ Canonical được tìm thấy cùng với các siêu dữ liệu khác trong phần đầu (<head>) của mã HTML của một trang. Chúng trông như thế này:
<link rel = ”canonical” href = ”https://www.victoriousseo.com/page/” />
Thẻ chuẩn có thể tự tham chiếu – nghĩa là nó trỏ đến URL của chính nó – hoặc nó có thể trỏ đến URL của trang khác để hợp nhất các tín hiệu đến các công cụ tìm kiếm. (Tìm hiểu thêm về lý do bạn muốn tránh các tín hiệu hỗn hợp bên dưới.)
URL Canonical
Liên kết chuẩn là URL chính cho một tập hợp các trang trùng lặp.
Google giải thích nó theo cách này :
“URL chuẩn là URL của trang mà Google cho là đại diện nhất từ một tập hợp các trang trùng lặp trên trang web của bạn.”
Ví dụ: trong ví dụ bên dưới, URL chuẩn được chỉ định bên trong thẻ chuẩn .

URL chuẩn quy định trang nào sẽ hiển thị trong kết quả tìm kiếm.
Lý do Tại sao Nội dung Trùng lặp Tồn tại
Đôi khi, việc cố ý tạo các trang “appreciably similar” là rất hợp lý vì chúng phục vụ các mục đích khác nhau. Ví dụ: nếu bạn có khách hàng ở cả Canada và Hoa Kỳ, bạn có thể tạo hai trang sản phẩm gần giống nhau ngoại trừ giá cả (tính cho tỷ giá hối đoái US / CAD). Trong trường hợp này, bạn sẽ triển khai các thẻ chuẩn trên các trang này, cùng với các thẻ hreflang để cho các công cụ tìm kiếm biết trang nào sẽ phân phát cho người tìm kiếm nào dựa trên vị trí của họ.
Bạn có thể có nội dung trùng lặp và không biết nó
Thông thường, có những lý do kỹ thuật khiến nội dung trùng lặp được tạo ra (đôi khi bạn không hề hay biết ).
Sự cố với URL
Hệ thống quản lý nội dung và các trang web động có thể tạo ra nội dung trùng lặp mà bạn thậm chí không biết. Một số trang web tự động thêm thẻ, cho phép nhiều đường dẫn đến cùng một nội dung và thêm thông số URL cho các tìm kiếm, sắp xếp hoặc đơn vị tiền tệ. Có thể bạn có hàng nghìn URL trùng lặp trên trang web của mình và thậm chí không nhận ra điều đó.
Ví dụ: tất cả các URL này có thể hiển thị cùng một nội dung:
- https://www.mywebsite.com/redshoes/
- http://www.mywebsite.com/redshoes/
- https://mywebsite.com/redshoes/
- http://mywebsite.com/redshoes/
- http://m.mywebsite.com/redshoes/
- https://m.mywebsite.com/redshoes/
- https://www.mywebsite.com/redshoes
- https://www.mywebsite.com/REDSHOES/
Tuy nhiên, đối với một công cụ tìm kiếm, đây không chỉ là một trang nội dung. Đó là tám trang nội dung trùng lặp. May mắn thay, các URL chuẩn giúp các công cụ tìm kiếm xác định các biến thể khác nhau của một trang dưới dạng một URL duy nhất và ngăn chặn các vấn đề về nội dung trùng lặp.
Tại sao URL Canonical lại quan trọng đối với SEO
Bằng cách chỉ định một URL chuẩn, bạn đang cho các công cụ tìm kiếm biết phiên bản trang ưa thích để hiển thị trên các trang kết quả của công cụ tìm kiếm (SERPs), vì vậy bạn có thể trình bày các liên kết rõ ràng hơn cho người tìm kiếm.
Ví dụ: thay vì hiển thị URL nguồn:
https://www.mywebsite.com/category-1?gclid=ABCD
Bạn có thể có kết quả tìm kiếm hiển thị URL này cho trang sản phẩm đó:
https://www.mywebsite.com/redshoes
Hợp nhất các tín hiệu liên kết
Khi bạn có các trang trùng lặp hoặc tương tự trên trang web của mình, có thể các URL riêng lẻ có thể kiếm được liên kết từ các nguồn bên ngoài.
Khi bạn sử dụng URL chuẩn để hợp nhất các tín hiệu liên kết từ nhiều trang thành một URL duy nhất, bạn sẽ cải thiện xếp hạng của một trang đó – tăng khả năng đẩy nội dung của bạn lên trong kết quả tìm kiếm.
Quản lý nội dung cung cấp thông tin
Đó là một chiến thuật tiếp thị phổ biến để đặt nội dung trên các trang web khác nhau để tăng nhận thức của khán giả mới. Nếu nội dung được cung cấp đủ tương tự với nội dung trên một trong các trang của bạn, các công cụ tìm kiếm có thể nhầm lẫn về trang nào sẽ trả về chính xác cho các truy vấn tìm kiếm có liên quan. Để đảm bảo phần nội dung ban đầu của bạn là nội dung được xếp hạng, bạn sẽ muốn sử dụng các URL chuẩn để báo hiệu rằng trang của bạn là phần nội dung chính để quay lại tìm kiếm. Cách tốt nhất là sử dụng thẻ chuẩn tự tham chiếu trên bài viết của bạn và để nội dung được cung cấp chỉ định bạn là phiên bản chuẩn có thẻ chuẩn nhiều miền.
Không để Googlebot thu thập thông tin các trang trùng lặp
Nếu bạn có một trang web lớn với nhiều trang, URL chuẩn sẽ giúp bot thu thập thông tin ưu tiên các trang mới của bạn thay vì thu thập thông tin các phiên bản trùng lặp của cùng một trang. Nếu không có URL chính tắc, chỉ mục cồng kềnh có thể làm cạn kiệt ngân sách thu thập thông tin của bạn, làm giảm chất lượng không phải trả tiền của miền và có khả năng làm giảm xếp hạng các trang khác của bạn.
Sử dụng chuyển hướng 301 để chỉ định URL chuẩn
Theo Google , bạn có thể sử dụng chuyển hướng 301 để cho Googlebot biết rằng URL được chuyển hướng là phiên bản tốt hơn so với URL khác. Với một lưu ý chính – bạn chỉ nên sử dụng chuyển hướng 301 cho một trang trùng lặp mà bạn định gỡ bỏ.
Điều đó đang được nói, chuyển hướng 301 có thể là cách tốt nhất để xóa nội dung trùng lặp do:
- HTTP và HTTPS :
http://mywebsite.com/redshoes/ so với https://mywebsite.com/redshoes/ - Không phải WWW và WWW :
https://mywebsite.com/redshoes/ so với https://www.mywebsite.com/redshoes/ - Dấu gạch chéo và không dấu gạch chéo :
https://mywebsite.com/redshoes/ so với https://mywebsite.com/redshoes
Khi nói đến các trang riêng lẻ, thay vì các nhóm như những trang đã đề cập ở trên, cách tốt nhất của bạn là sử dụng thẻ canonical.
URL Canonical trong Sơ đồ trang web
Hãy cẩn thận để không đưa các URL không chuẩn vào sơ đồ trang web của bạn. Google giả định rằng các URL được bao gồm trong sơ đồ trang web là phiên bản chuẩn của các trang của bạn.
Các phương pháp hay nhất về thẻ Canonical
Bây giờ bạn đã biết câu trả lời cho câu hỏi, “thẻ chuẩn là gì”, đã đến lúc đưa kiến thức của chúng ta vào sử dụng thực tế.
Canonicals rất dễ thực hiện. Khi bạn hiểu một số phương pháp hay nhất, bạn sẽ thấy rằng việc định vị và dọn dẹp nội dung trùng lặp trở nên dễ quản lý hơn nhiều.
Dưới đây là ba điều cơ bản cần ghi nhớ:
1. Sử dụng các thẻ chuẩn tự tham chiếu.
Trong trường hợp bạn có một trang chính và ba trang trùng lặp, bạn có thể tiếp tục và đặt thẻ chuẩn trên tất cả chúng, ngay cả khi thẻ trên trang chính đang trỏ đến chính nó.
Trên thực tế, ngay cả khi bạn không có bất kỳ trang trùng lặp nào, Google khuyên bạn nên sử dụng thẻ chuẩn tự tham chiếu như một phương pháp hay nhất. Nguyên nhân? Có thể có các liên kết đến các trang của bạn chứa các tham số URL và thẻ UTM mà Google có thể chọn làm phiên bản chuẩn. Việc sử dụng các thẻ chuẩn tự tham chiếu không quan trọng, nhưng đó là một chính sách bảo hiểm tốt.
2. Chuẩn hóa trang chủ của bạn.
Các bản sao trang chủ không chỉ phổ biến mà mọi người có thể liên kết đến trang chủ của bạn theo những cách bạn không thể kiểm soát – bằng cách sử dụng các tham số hoặc thẻ UTM. Nó giúp bạn chủ động và đặt một thẻ chuẩn trên mẫu trang chủ của bạn – chỉ để an toàn.
3. Không gửi tín hiệu tập hợp.
Mặc dù thêm thẻ chuẩn vào các trang của bạn là một quá trình đơn giản, nhưng bạn cần phải cẩn thận để không gửi các tín hiệu hỗn hợp đến các công cụ tìm kiếm bằng cách trộn các thẻ chuẩn với chuyển hướng hoặc chuẩn hóa hai trang với nhau.
Ví dụ:
- Nếu bạn chuẩn hóa http: //mywebsite.com/redshoes/ thành https : //mywebsite.com/redshoes/
- Không chuyển hướng https: //mywebsite.com/redshoes/ đến http: //mywebsite.com/redshoes/
Tương tự như vậy:
- Nếu bạn chuẩn hóa http: //mywebsite.com/redshoes/ thành https : //mywebsite.com/redshoes/
- không chuẩn hóa https: //mywebsite.com/redshoes/ thành http: //mywebsite.com/redshoes/
Và, không chuỗi các thẻ chuẩn. Ví dụ:
- Không chuẩn hóa http: //mywebsite.com/redshoes/ thành https : //mywebsite.com/redshoes/
- sau đó canonicalize https: //mywebsite.com / redshoes / thành https : //mywebsite.com / red-shoes /
Các tín hiệu hỗn hợp khiến các công cụ tìm kiếm khó chọn đúng trang để trả về kết quả tìm kiếm. Nếu không có tín hiệu rõ ràng, các công cụ tìm kiếm có thể đưa ra những lựa chọn không tốt.
Cách tìm và khắc phục sự cố chuẩn hóa
Vì việc gửi các tín hiệu rõ ràng đến các công cụ tìm kiếm giúp mọi người tìm thấy trang web của bạn dễ dàng hơn, nên điều quan trọng là phải thực hiện kiểm tra thường xuyên để tìm và khắc phục bất kỳ vấn đề nào liên quan đến thẻ chuẩn.
Các công cụ được đề xuất để kiểm tra trang web
Các công cụ kiểm tra trang web này sẽ làm nổi bật bất kỳ lỗi chuẩn nào mà họ tìm thấy trên trang web của bạn.
- Công cụ kiểm tra trang web của Ahrefs
- Moz Pro
- Công cụ kiểm tra trang web của SEMrush
Các vấn đề thường gặp về SEO chuẩn và cách giải quyết
Dưới đây là một số vấn đề ví dụ về thẻ chuẩn có thể xuất hiện khi chạy một trang web, hãy kiểm tra cùng với một số bản sửa lỗi đơn giản.
1 – Không chuyển hướng hoặc chuẩn đến trang chủ HTTPS từ phiên bản HTTP
Nếu người dùng có thể truy cập cả hai phiên bản HTTPS và HTTP của trang web của bạn, kiểm tra trang web của bạn sẽ gắn cờ đây là vấn đề nội dung trùng lặp.
Khắc phục sự cố này bằng cách triển khai chuyển hướng 301 đến phiên bản chính xác hoặc thêm thẻ chuẩn tham chiếu đến phiên bản HTTPS trên các trang HTTP.
2 – Các trang có liên kết chuẩn bị hỏng
Nếu các trang của bạn có các liên kết chuẩn bị hỏng, các chương trình thu thập thông tin không thể hiểu chúng là URL chuẩn. Lỗi này có thể có nghĩa là các liên kết chuẩn của bạn trỏ đến các trang không tồn tại, gây khó khăn cho việc lập chỉ mục nội dung của bạn.
Khắc phục điều này bằng cách cập nhật các URL này để trỏ đến đúng URL chuẩn.
4 – Các trang có nhiều URL chuẩn
Nếu bạn có nhiều hơn một URL chuẩn trên một trang, Googlebot sẽ không biết phải đi theo cách nào để tìm nội dung chính của bạn.
Tất cả những gì bạn cần làm để khắc phục điều này là xóa các thẻ trùng lặp, giữ nguyên vị trí chính xác.
“Thẻ Canonical là gì?” Tóm lại
Mặc dù khó nói là “chuẩn hóa”, nhưng không khó để hiểu. Sử dụng thẻ canonical là một phần cơ bản (mặc dù thường bị bỏ qua) của chiến lược SEO kỹ thuật . Mặc dù nó yêu cầu một số tổ chức và bảo trì nhất quán, không có lý do gì để bỏ khối đá này trong khi bạn đang tìm cách tối đa hóa lưu lượng truy cập không phải trả tiền cho doanh nghiệp của mình.
Cần một đối tác?
Chúng tôi cam kết thúc đẩy các kết quả tìm kiếm thúc đẩy sự phát triển cho doanh nghiệp của bạn. Tìm hiểu thêm về cách chúng tôi có thể trợ giúp.