google-index

Google Index Là Gì? 10 Cách Index Google Nhanh & Hiệu Quả

Nếu Google Index website của bạn không được thì web bạn sẽ hoàn toàn không hiển thị trên công cụ tìm kiếm.

Và đương nhiên bạn sẽ không nhận được lưu lượng truy cập tự nhiên nào từ Google cả.

Nếu bạn đang gặp những trường hợp sau:

+ Toàn bộ website đang không được index

+ Một số trang thì được index nhưng một số trang lại không

+ Những trang mới xuất bản nhưng mất thời gian lâu để được index

Thì bài viết này sẽ giúp bạn giải quyết những vấn đề trên. Nhưng trước hết bạn cần phải hiểu rõ Google Index là gì?

Google Index là gì?

google-index-la-gi

Google Index là việc Google sẽ lập chỉ mục nội dung trên website của bạn trong thư viện của nó. Khi người dùng tìm kiếm thì Google sẽ lấy kết quả phù hợp nhất trong thư viện để hiển thị lên kết quả tìm kiếm.

Thư viện này tính tới nay đã lên tới hàng trăm tỷ trang web. Một con số cực kỳ khủng khiếp.

Để Google phát hiện ra website của bạn thì Googlebot sẽ thực hiện crawl (thu thập thông tin) trên website. Sau đó mới index (lập chỉ mục) cho nội dung trên website đó.

crawl-index-search

Trước tiên chúng ta hãy đi với nhau một vài khái niệm cơ bản:

+ Crawl: Là quá trình theo dõi các liên kết (hyperlink) trên website để thu thập nội dung mới.

+ Index: Là quá trình lưu trữ các trang web trong một thư viện dữ liệu rộng lớn.

+ Googlebot: Là một phần mềm được Google thiết kế để thu thập thông tin trên quy mô lớn.

Dưới đây là video từ Google nhằm giải thích quá trình trên một cách chi tiết:

Khi bạn thực hiện tìm kiếm trên Google. Bạn sẽ muốn Google trả về kết quả liên quan và chất lượng nhất.

Bởi vì hiện nay có hàng tỷ nội dung trên mạng internet cho nên Google cần phải dựa trên hàng trăm các thuật toán xếp hạng để sắp xếp thứ tự ưu tiên nội dung hiển thị cho bạn.

google-library

Mình muốn nhấn mạnh cho bạn nhớ rằng: Indexing và Ranking là 2 việc hoàn toàn khác nhau.

Indexing chỉ đơn giản là đưa bạn vào thư viện. Còn Ranking mới là cái đưa bạn đến người đọc.

Việc Google Index cho bạn không có nghĩa là bạn sẽ lên được TOP của Google.

Kiểm tra Google Index

Việc này khá đơn giản.

Cách 1: Bạn lên Google sau đó nhập theo cú pháp sau: site:domain.com

check-google-index

“Khoảng 52 kết quả” – đây là số lượng trang trên website của mình đã được Google Index.

Nếu bạn muốn kiểm tra chi tiết hơn thì cũng tương tự: site:domain.com/xxx-xxx (chi tiết url)

page-indexed

Nếu khi bạn tìm kiếm như trên mà không ra kết quả tức là trang của bạn chưa được Google Index.

Cách 2: Bạn có thể sử dụng công cụ Google Search Console.

Bạn có thể sử dụng báo cáo Coverage để xem tình trạng index của website bạn hiện tại đang như thế nào.

Google Search Console -> Index -> Coverage

Google-search-console-coverage

Như hình trên bạn có thể thấy:

+ Error là số trang đang bị lỗi và không index được.

+ Valid with warning là trang đã được index nhưng gặp một số vấn đề và Google không chắc là do bạn muốn hay không.

+ Valid là số trang đã được Google Index.

Nếu bạn làm SEO thì Google Search Console là công cụ không thể thiếu được cho nên bạn hãy cài đặt nó nhé.

Cách 3: Sử dụng the URL Inspection tool của Google Search Console

Bạn hãy nhập Url cần kiểm tra trên thanh tìm kiếm của Google Search Console.

Nếu trang đã được Google Index nó sẽ báo là “URL is on Google”.

Và nếu chưa được Google Index nó sẽ báo là “URL is not on Google”.

10 Cách để Google Index nhanh & hiệu quả

Nếu để tự Google Index thì công việc này bạn sẽ chờ đợi khá lâu. Có thể mất từ vài ngày đến vài tuần để Google thực hiện công việc này.

Khi bạn đang là 1 website mới thì độ ưu tiên của Google sẽ thấp hơn.

Còn nếu bạn là 1 website lớn rồi thì không cần phải index thủ công mà chỉ cần gắn liên kết nội bộ (Internal link) Google cũng sẽ index cho bạn một cách nhanh chóng.

Chúng ta sẽ đi từ bước đơn giản đến bước nâng cao để phân tích cũng như khắc phục các vấn đề về Google Index nhé.

1. Sử dụng Google Search Console

Google Search Console là một công cụ mà Google cung cấp cho nên khi bạn làm việc trên này là bạn đang làm việc với Google luôn.

Việc đầu tiên là bạn sẽ nhập URL vào ô tìm kiếm “Inspect any URL”

Sau đó bạn sẽ nhấp vào chữ “Request Indexing”

how-to-google-index

Và việc tiếp theo bạn làm là … không làm gì cả. Xong rồi. Chỉ cần ngồi đợi thôi.

Việc bạn đang làm như thế này là đang nói cho Google biết bạn vừa thêm một nội dung vào website và yêu cầu họ xem xét index.

Đây là bước đơn giản nhất phần lớn những bạn làm SEO đã biết.

2. Loại bỏ chặn crawl trong robots.txt

Robots.txt là một tập tin cho phép hoặc không cho phép Googlebot thu thập thông tin trên website.

Nếu toàn bộ trang web của bạn không được hiển thị trên Google khả năng cao là đã bị chặn bởi robots.txt

Để kiểm tra thư mục này bạn vào đường dẫn: domain.com/robots.txt

robotstxt

Nếu bạn kiểm tra thấy có dòng lệnh như thế này:

User-agent: Googlebot
Disallow: /

Hoặc

User-agent: *
Disallow: /

Cả 2 dòng lệnh này đều nói với Googlebot rằng chúng không được phép thu thập dữ liệu ở bất kỳ trang nào trên website của bạn.

Để khắc phục sự cố này bạn chỉ đơn giản là xóa dòng: Disallow: /

Và đôi khi Robots.txt cũng chặn 1 trang web cụ thể.

Ví dụ như ảnh trên website mình thì mình sẽ chặn không cho Googlebot vào trang wp-admin (Quản lý WordPress)

Còn nếu bạn muốn chặn một website cụ thể thì chỉ cần thêm dòng lệnh: Disallow: /page.html

Còn nếu không hãy xóa chúng đi nhé.

3. Loại bỏ thẻ Noindex

Google sẽ không thực hiện Index nếu bạn nói với Googlebot rằng bạn không muốn. Đây là một cách để giữ cho một số trang của bạn ở chế độ riêng tư.

Bằng cách nào?

Cách 1: Thẻ meta

Nếu ở phần header trang của bạn có thẻ meta sau thì Google sẽ không thực hiện index.

<meta name=“robots” content=“noindex”>
<meta name=“googlebot” content=“noindex”>

Nhìn cũng tương tự như phần robots.txt phía trên nhỉ.

Nếu bạn có thẻ noindex này trên trang thì Googlebot sẽ bỏ qua và đi nơi khác.

Để kiểm tra phần này bạn có thể sử dụng Ahrefs -> Site Audit -> Reports -> Indexability

noindex-ahrefs

Ấn vào xem chi tiết để loại bỏ thẻ noindex này để Googlebot có thể index trang bạn mong muốn.

Cách 2: X‑Robots-Tag

Bạn có thể tìm hiểu thêm về X-Robots-Tag mà Google đã đề cập trong bài viết.

Mình sẽ giải thích để bạn hiểu được ảnh dưới:

Thẻ X-Robots-Tag cũng được sử dụng như một loại thẻ meta.

Bất kỳ lệnh nào trong thẻ meta thì cũng đều được sử dụng ở thẻ X-Robots-Tag này.

Nhưng để triển khai thẻ này bạn cần sử dụng máy chủ như PHP hoặc trong tệp .htaccess hoặc cấu hình máy chủ của bạn.

Bạn có thể kiểm tra khi bạn sử dụng Google Search Console và sẽ thông báo lỗi như hình dưới.

noindex-in-X-Robots-Tag

Hoặc nếu bạn muốn kiểm tra nhanh hơn có thể sử dụng Ahrefs -> Site Audit -> Tools -> Page explorer

Sau đó bạn đặt bộ lọc như hình dưới nhé.

robots-infor-ahrefs

Việc còn lại là bảo bạn nào code website của bạn loại bỏ thẻ này ở những trang bạn muốn Google Index.

4. Kiểm tra Sitemap

Sitemap là nơi bạn xác định trang nào trên website quan trọng và trang nào thì không. Nói cách khác đây là sơ đồ website của bạn.

Một sitemap chuẩn sẽ hỗ trợ tốt cho Googlebot dễ dàng index website hơn.

Việc bạn không cho url vào sitemap không đồng nghĩa với việc Google sẽ không index.

Nhưng có còn tốt hơn đúng không.

Để kiểm tra url của bài viết có trên Sitemap hay không bạn có thể xem trên Google Search Console.

not-in-sitemaps

Hoặc bạn có thể xem trong chính sitemaps hiện tại. Với cú pháp: domain.com/sitemap.xml

Ở đây bạn có thể tìm là url mình muốn index có trong này không.

sitemap

Sau khi tổng hợp những url không có trong sitemap rồi thì bạn hãy thực hiện thêm chúng vào nhé. Có thể nhờ bạn code hoặc sử dụng Plugin của wordpress.

5. Loại bỏ thẻ Canonical

Khi đặt thẻ này trên một số trang và trỏ về một trang duy nhất. Thì các trang được đặt thẻ này sẽ được xem là không quan trọng và Google sẽ không index chúng.

Bạn sẽ thấy thẻ này có dạng là: <link rel=”canonical” href=”/page.html/”>

Để kiểm tra 1 trang có thẻ này không thì bạn sẽ sử dụng Google Console.

Và sẽ thấy kết quả như hình dưới nếu trang này đang được trỏ về trang khác.

alternate-page-with-canonical

Nếu bạn muốn Google Index trang trên thì bạn cần phải loại bỏ thẻ canonical.

Thường thì thẻ này thường xuyên được sử dụng ở các trang thương mại điện tử khi 1 sản phẩm có nhiều mẫu mã khác nhau.

Cho nên không phải trường hợp nào cũng cần phải loại bỏ thẻ này nhé. Bạn cần biết rõ bạn đang làm gì nhé.

6. Kiểm tra trang mồ côi (orphan pages)

Đây là những trang mà không có một liên kết nội bộ nào trỏ tới.

Nếu trường hợp này xảy ra thì Googlebot sẽ không thể tìm kiếm trang này được bởi nó không biết đi đường nào để tới.

Bạn có thể kiểm tra thủ công hoặc sử dụng công cụ Ahrefs -> Site Audit -> Reports -> Links

Lưu ý: Công cụ này chỉ đúng khi bạn đảm bảo được toàn bộ url đang có trên sitemap

orphan-pages

Hoặc để đơn giản hơn bạn có thể sử dụng Plugin Yoast SEO trên WordPress để kiểm tra nhé.

orphaned-content-filter

Bạn có thể sửa nhưng trang này bằng 2 cách:

1. Nếu trang này không quan trọng hãy xóa nó và loại ra khỏi sitemap. Có thể đồng thời redirect 301 qua trang liên quan hoặc trang chủ.

2. Nếu trang này quan trọng thì hãy liên kết nội bộ các trang liên quan tới bạn nhé.

7. Kiểm tra thẻ nofollow

Nofollow links là liên kết có thẻ rel=”nofollow” tag. Chúng làm chặn việc truyền sức mạnh PageRank qua trang khác.

Và Googlebot sẽ không đi qua liên kết có gắn thẻ này.

Bạn cần phải đảm bảo các liên kết nội bộ trên website đều được follow.

Nếu không sẽ xảy ra tình trạng trang mồ côi như phía trên.

Bạn hãy sử dụng công cụ Ahrefs để kiểm tra nhé: Site Audit -> Report -> Links

nofollow-incoming-links-error

Hãy loại bỏ thẻ nofollow này trên liên kết nội bộ nếu bạn muốn trang được Google Index.

8. Link tới liên kết nội bộ Khỏe

Google phát hiện nội dung mới bằng cách thu thập dữ liệu trên nội dung cũ có liên kết đến.

Và việc nhanh nhất để Google có thể tìm tới nội dung mới là sử dụng những nội dung (liên kết) có sức mạnh cao để liên kết nội bộ tới.

Việc liên kết có sức mạnh cao phần lớn là do lưu lượng truy cập lớn và có backlinks độ uy tín cao. Cho nên Google sẽ thường ưu tiên Index những trang xung quanh nội dung này.

Bạn có thể tìm thấy liên kết nội bộ có sức mạnh cao bằng công cụ Ahrefs như hình dưới.

Sắp xếp theo thứ tự Url Rating.

Best-by-links-ahrefs

Sau đó bạn chọn những liên kết có nội dung liên quan tới bài viết bạn muốn link tới và sử dụng.

Google sẽ thực hiện Index nội dung bạn link tới trong lần nó đi crawl tiếp theo.

Khi bạn thực hiện liên kết nội bộ tới nội dung mới tại những liên kết trên thì bạn hãy sử dụng Google Search Console để “Request indexing” – yêu cầu lập chỉ mục lại để Google Index nhanh hơn nhé.

9. Kiểm tra nội dung bài viết

seo-content

Google sẽ luôn luôn ưu tiên những nội dung chất lượng, giá trị, độc nhất.

Đây mình nghĩ luôn luôn là tiêu chí của Google cho tới mãi về sau bởi vì công cụ này sinh ra nhằm phục vụ ý định tìm kiếm nội dung của người dùng.

Đây cũng là 1 trong những tiêu chỉ để đảm bảo tăng Trust Flow (chỉ số đánh giá chất lượng backlinks) của 1 bài viết.

Bạn hãy luôn tự hỏi câu hỏi rằng? Liệu nội dung này có đem lại giá trị thật sự cho người đọc hay không? Nếu không hãy sửa đổi, thậm chí là xóa bỏ nó.

Một số tiêu chí bạn cần kiểm tra như:

+ Nội dung trùng lặp

+ Nội dung mỏng

+ Nội dung sai ý định tìm kiếm (sai từ khóa mục tiêu)

+ Nội dung kém chất lượng

+ Nội dung spin

Đương nhiên Google chỉ có 1 ngân sách crawl giới hạn. Bạn không muốn Googlebot sẽ hết nhiên liệu trước khi tới nơi bạn muốn chứ.

Đối với mình nếu gặp những trường hợp trên mình sẽ tạm thời xóa ra khỏi website để lên kế hoạch tối ưu lại.

10. Xây dựng Backlinks chất lượng

backlinks

Nguồn: Backlinko

Chắc cũng không cần phải nói nhiều đến cách này rồi nhỉ.

Đây là 1 trong 3 yếu tố xếp hạng quan trọng nhất của Google.

Nếu bạn muốn xây dựng được backlinks chất lượng thì cần xác định trước rằng bạn phải có nội dung chất lượng đã.

Không chỉ 1 mà là cần rất rất nhiều nội dung chất lượng mới thu hút được nhiều backlinks tới.

Đồng thời bạn cũng cần chủ động liên hệ tới những website mà có ngành nghề liên quan để giới thiệu họ về nội dung của bạn.

Backlinks các chất lượng thì trang web đó càng được Google Index nhanh chóng.

Ngoài ra còn một số cách khác bạn có thể thử như: Social Post, Guest Post, Blog Commenting,…

Cách chặn Google Index

how-to-block-google-index

Ở phần trên mình đã viết ra những cách để chặn Google Index (block google indexing) rồi. Phần này mình sẽ tổng hợp lại cho bạn để dễ nhìn và sử dụng hơn.

Thường thì mình thấy mọi người muốn chặn Google Index là ở các nội dung về:

+ Nội dung bảo mật hệ thống hoặc quản trị website (backend)
+ Nội dung thông tin cá nhân về người dùng
+ Nội dung thông tin về nội bộ công ty
+ Nội dung liên quan đến media như: hình ảnh, video, file pdf, audio

1. Sử dụng thẻ noindex

Thẻ này sẽ đặt ở phần header của trang bạn muốn chặn – thường là sẽ nằm ở trong thẻ <head> có dạng như sau:

<meta name="robots" content="noindex">

Hoặc

<meta name="googlebot" content="noindex">

2. Sử dụng HTTP response header

Thẻ này là X-Robots-Tag như mình nói ở trên bạn sẽ đặt ở phần PHP hoặc trong tệp .htaccess hoặc cấu hình máy chủ ở trang bạn muốn chặn.

Nó sẽ có dạng như sau: X-Robots-Tag “noindex, nofollow”

3. Sử dụng robots.txt

Đặt dòng lệnh này trong file robots.txt nếu bạn muốn chặn 1 trang bất kỳ.

User-agent: Googlebot
Disallow: /page.html

Hoặc

User-agent: *
Disallow: /page.html

4. Sử dụng Google Search Console

Bạn có thể sử dụng công cụ này để chặn 1 trang bất kỳ ra khỏi công cụ tìm kiếm Google.

Tuy nhiên đây chỉ là hình thức tạm thời và sau 6 tháng nội dung này sẽ xuất hiện lại bạn nhé.

removals-content

Và đương nhiên nếu bạn muốn mức độ bảo mật cao hơn thì hãy đặt mật khẩu ở các nội dung này nhé.

Tóm lại là

Có 2 lý do lớn nhất khiến Google không index website là:

+ Các vấn đề liên quan đến kỹ thuật: robots.txt, noindex, nofollow,…

+ Website của bạn chất lượng thấp và không có giá trị đối với người dùng

Với danh sách 10 cách để đảm bảo Google Index thuận lợi hơn ở phía trên mình hy vọng giúp được bạn phần nào trong quá trình gặp khó khăn khi index nội dung.

Các bạn cần nhớ rằng việc index là quan trọng nhưng nếu bạn muốn xếp hạng trên kết quả tìm kiếm Google thì cần nhiều hơn thế nữa.

Nếu bạn không xếp hạng thì không còn cách nào khác ngoài việc bạn phải trả tiền cho Google để lên TOP.

Ở bài viết này bạn đã hiểu rõ hơn về Google Index chưa? Có phần nào bạn chưa nắm rõ không? Nếu có thì hãy để lại comment phía dưới mình sẽ trả lời nhé.

Cảm ơn bạn đã đọc bài.

From Cường Dizi.

Facebook cá nhân: https://www.facebook.com/CuongNC.Digital/

Fanpage: https://www.facebook.com/CuongDigitalPage/

Email: [email protected]

Nguồn tham khảo:

https://developers.google.com/search/docs/guides/intro-indexing

https://ahrefs.com/blog/google-index/

https://www.semrush.com/blog/google-index/

https://www.crazyegg.com/blog/get-google-index-website/

https://neilpatel.com/blog/google-index/

Spread the love ♥
Marketing for Beginner – Back to Basic
Posts created 31
5 1 vote
Article Rating
Subscribe
Thông báo về
guest
0 Comments
Phản hồi dưới bình luận này
Xem tất cả các bình luận

Nhập cụm từ bạn muốn tìm kiếm và nhấn Enter. ESC để hủy.

Content Protection by DMCA.com
0
Mình rất vui khi bạn để lại bình luậnx
()
x
Scroll-to-top