Tan Phat Media

Robots Meta Checker - Kiểm Tra Robots Meta Online

Kiểm tra noindex/nofollow của trang web

Robots Meta Tag Checker - Công Cụ Kiểm Tra noindex nofollow Online Miễn Phí

Công cụ kiểm tra robots meta tag online miễn phí của Tấn Phát Digital giúp phát hiện các directives quan trọng ảnh hưởng đến SEO: noindex (chặn index trang), nofollow (chặn follow links), noarchive (chặn cache), nosnippet (chặn snippet), noimageindex (chặn index hình ảnh). Fetch và parse HTML của bất kỳ URL nào. Hiển thị raw content của meta robots tag. Trạng thái trực quan với icon xanh/đỏ cho từng directive. Giải thích ý nghĩa từng directive bằng tiếng Việt. Cảnh báo khi không tìm thấy robots meta tag. Hữu ích cho SEO specialists, web developers, và content managers để audit và debug indexing issues.

Tính năng nổi bật

Kiểm tra robots meta tag của bất kỳ URL
Fetch HTML qua proxy để bypass CORS
Parse và extract meta[name='robots'] tag
Phát hiện noindex - chặn Google index trang
Phát hiện nofollow - chặn Google follow links
Phát hiện noarchive - chặn Google lưu cache
Phát hiện nosnippet - chặn hiển thị snippet trong SERP
Phát hiện noimageindex - chặn index hình ảnh
Hiển thị raw content của meta tag
Icon trực quan: xanh (cho phép), đỏ (chặn)
Giải thích ý nghĩa từng directive
Cảnh báo khi không có robots meta tag
Giải thích default behavior (index, follow)
Xử lý lỗi với thông báo rõ ràng
Hoàn toàn miễn phí, không giới hạn

Tại sao cần kiểm tra robots meta tag?

Robots meta tag là một trong những yếu tố quan trọng nhất quyết định trang web có được Google index hay không. Một sai sót nhỏ có thể gây hậu quả nghiêm trọng: Vô tình thêm noindex khiến trang biến mất khỏi Google hoàn toàn. nofollow trên internal links làm mất link equity và ảnh hưởng rankings. nosnippet khiến trang hiển thị kém hấp dẫn trong search results. noarchive ngăn users xem cached version khi site down. Các tình huống cần kiểm tra: Sau khi migrate website hoặc redesign. Khi trang quan trọng không xuất hiện trên Google. Debug indexing issues trong Google Search Console. Audit SEO technical cho client hoặc đối thủ. Kiểm tra staging site trước khi go live (staging thường có noindex). Verify sau khi remove noindex để re-index. Công cụ này giúp kiểm tra nhanh chóng, chính xác, không cần view source thủ công.

Lợi ích khi sử dụng

  • Phát hiện nhanh các vấn đề indexing
  • Không cần view source thủ công
  • Kiểm tra bất kỳ URL nào (không chỉ site của bạn)
  • Hiểu rõ ý nghĩa từng directive
  • Debug SEO issues hiệu quả
  • Audit đối thủ cạnh tranh
  • Miễn phí không giới hạn

Cách kiểm tra robots meta tag

  1. 1Nhập URL đầy đủ của trang cần kiểm tra (bao gồm https://)
  2. 2Nhấn Enter hoặc click nút Search
  3. 3Chờ tool fetch và parse HTML của trang
  4. 4Xem kết quả: Có tìm thấy robots meta tag hay không
  5. 5Nếu có, xem raw content của meta tag
  6. 6Kiểm tra từng directive: index, follow, archive, snippet, imageindex
  7. 7Icon xanh = cho phép, Icon đỏ = chặn
  8. 8Nếu không có meta tag, mặc định là index và follow
  9. 9Dựa vào kết quả để quyết định action cần thiết

Giải thích chi tiết các robots directives

index/noindex: Quyết định trang có được thêm vào Google index hay không. noindex = trang không xuất hiện trong search results. Đây là directive quan trọng nhất. follow/nofollow: Quyết định Google có follow links trên trang hay không. nofollow = Google không truyền PageRank qua links. Lưu ý: nofollow trên meta tag áp dụng cho TẤT CẢ links trên trang. archive/noarchive: Quyết định Google có lưu cached version hay không. noarchive = không có link 'Cached' trong search results. snippet/nosnippet: Quyết định Google có hiển thị text snippet hay không. nosnippet = chỉ hiển thị title, không có description. Có thể dùng max-snippet:0 thay thế. imageindex/noimageindex: Quyết định hình ảnh trên trang có được index trong Google Images hay không. noimageindex = hình ảnh không xuất hiện trong Image Search.

Robots meta tag vs robots.txt - Khác nhau thế nào?

robots.txt: File đặt ở root domain (example.com/robots.txt). Hướng dẫn bots KHÔNG CRAWL certain URLs. Nếu URL bị Disallow, Google không đọc content nhưng VẪN CÓ THỂ INDEX URL (nếu có links trỏ đến). Không thể ngăn indexing hoàn toàn. Robots meta tag: Đặt trong <head> của từng trang HTML. Hướng dẫn bots SAU KHI ĐÃ CRAWL trang. noindex = chắc chắn không index. Có thể control chi tiết hơn (nosnippet, noarchive...). Để chặn indexing hoàn toàn: Dùng noindex trong meta tag (recommended). KHÔNG dùng robots.txt để block vì Google vẫn có thể index URL. Kết hợp cả hai: robots.txt để tiết kiệm crawl budget, noindex để chắc chắn không index.

X-Robots-Tag HTTP Header

Ngoài meta tag trong HTML, còn có X-Robots-Tag trong HTTP response headers. Cùng chức năng với meta robots nhưng set ở server level. Hữu ích cho: Non-HTML files (PDF, images) không có <head>. Apply rules cho nhiều URLs cùng lúc qua server config. Ví dụ trong .htaccess: Header set X-Robots-Tag 'noindex, nofollow'. Ví dụ trong nginx: add_header X-Robots-Tag 'noindex'. Tool này hiện check meta tag trong HTML. X-Robots-Tag cần check qua HTTP headers (dùng tool khác hoặc browser DevTools).

Common mistakes với robots meta tag

Quên remove noindex sau khi launch: Staging/dev sites thường có noindex. Khi go live, quên remove = site không được index. Luôn check sau khi launch. noindex trên pagination: Đừng noindex trang 2, 3... của pagination. Google cần crawl để discover content. Dùng rel='next/prev' hoặc để mặc định. nofollow trên internal links: nofollow trong meta tag áp dụng cho TẤT CẢ links. Làm mất internal link equity. Chỉ dùng nofollow cho external links không tin tưởng. Conflicting directives: noindex + follow = OK (không index nhưng vẫn follow links). index + nofollow = OK (index nhưng không follow). noindex + nofollow = Trang không index VÀ links không được follow. Case sensitivity: Directives là case-insensitive. 'NOINDEX', 'noindex', 'NoIndex' đều giống nhau.

Câu hỏi thường gặp (FAQ)

noindex có chặn Google crawl trang không?

KHÔNG. noindex chỉ ngăn Google INDEX trang (thêm vào search results). Google vẫn CRAWL trang để đọc noindex directive. Nếu muốn ngăn crawl, dùng robots.txt Disallow. Tuy nhiên, Disallow không ngăn indexing nếu có links trỏ đến. Best practice: Dùng noindex để chắc chắn không index, robots.txt để tiết kiệm crawl budget.

Không có robots meta tag thì sao?

Nếu không có meta robots tag, mặc định là 'index, follow'. Google sẽ: Index trang (thêm vào search results). Follow tất cả links trên trang. Lưu cached version. Hiển thị snippet. Index hình ảnh. Đây là behavior mong muốn cho hầu hết trang. Chỉ thêm meta robots khi cần RESTRICT behavior mặc định.

Có thể dùng robots meta tag cho specific bots không?

CÓ. Thay vì name='robots' (áp dụng cho tất cả), có thể dùng: name='googlebot' - chỉ Google. name='bingbot' - chỉ Bing. name='googlebot-news' - chỉ Google News. Ví dụ: <meta name='googlebot' content='noindex'> chỉ chặn Google, Bing vẫn index. Hữu ích khi muốn control khác nhau cho từng search engine.

nofollow trong meta tag khác gì rel='nofollow' trên link?

Meta robots nofollow: Áp dụng cho TẤT CẢ links trên trang. Một directive ảnh hưởng toàn bộ. rel='nofollow' trên link: Chỉ áp dụng cho link cụ thể đó. Granular control. Best practice: Dùng rel='nofollow' cho từng link cần (sponsored, user-generated). Tránh dùng meta nofollow vì ảnh hưởng cả internal links.

Làm sao biết Google đã thấy noindex?

Trong Google Search Console: URL Inspection tool > Xem 'Indexing allowed?' Nếu có noindex, sẽ hiển thị 'No: noindex detected'. Coverage report > Excluded > 'Excluded by noindex tag'. Sau khi remove noindex, request indexing trong URL Inspection. Google sẽ re-crawl và index nếu không còn noindex.

noindex có ảnh hưởng đến pages khác không?

KHÔNG trực tiếp. noindex chỉ ảnh hưởng trang chứa nó. Tuy nhiên, gián tiếp: Nếu trang A có noindex và link đến trang B, link equity từ A vẫn truyền đến B (trừ khi có nofollow). Nếu trang A là hub quan trọng bị noindex, users không tìm thấy A qua search, ảnh hưởng traffic đến B.

Có thể dùng noindex cho một phần trang không?

KHÔNG. noindex áp dụng cho TOÀN BỘ trang. Không thể noindex một section hoặc div. Nếu muốn hide một phần content khỏi search: Dùng JavaScript để load dynamic (Google có thể vẫn thấy). Đặt content trong iframe với noindex. Tốt nhất: Tách thành trang riêng nếu cần noindex.

Tool có check được X-Robots-Tag không?

Hiện tại tool chỉ check meta robots tag trong HTML. X-Robots-Tag nằm trong HTTP headers, cần tool khác để check. Cách check X-Robots-Tag: Browser DevTools > Network > Headers. curl -I https://example.com | grep -i x-robots. Các SEO tools như Screaming Frog. Tính năng check X-Robots-Tag có thể được thêm trong tương lai.

Từ khóa liên quan

robots meta tag checkerkiểm tra noindexnoindex nofollow checkermeta robots checkerseo robots tagkiểm tra index googlenoindex detectorrobots directive checkermeta tag analyzerseo indexing checker

Hợp tác ngay với Tấn Phát Digital

Chúng tôi không chỉ thiết kế website, mà còn giúp doanh nghiệp xây dựng thương hiệu số mạnh mẽ. Cung cấp dịch vụ thiết kế website trọn gói từ thiết kế đến tối ưu SEO. Hãy liên hệ ngay với Tấn Phát Digital để cùng tạo nên những giải pháp công nghệ đột phá, hiệu quả và bền vững cho doanh nghiệp của bạn tại Hồ Chí Minh.

Công cụ SEO Tools liên quan

Zalo
Facebook
Tấn Phát Digital
Zalo
Facebook