Tan Phat Media

XML Sitemap Validator

Kiểm tra và validate XML sitemap của bạn

Input
Kết quả
Paste XML sitemap và nhấn Validate

XML Sitemap Validator - Công cụ kiểm tra và validate Sitemap Online miễn phí

XML Sitemap Validator của Tấn Phát Digital giúp bạn kiểm tra và validate file sitemap.xml một cách toàn diện. Sitemap là file XML quan trọng giúp search engines hiểu cấu trúc website và tìm thấy tất cả các trang cần index. Công cụ này phân tích XML syntax, kiểm tra format của từng URL, validate các thuộc tính lastmod, changefreq, priority, và phát hiện các lỗi có thể ảnh hưởng đến việc crawling. Bạn sẽ nhận được báo cáo chi tiết với errors, warnings, và thống kê tổng quan về sitemap. Tất cả xử lý diễn ra trên trình duyệt, đảm bảo bảo mật cho dữ liệu website của bạn.

Tính năng nổi bật

Validate XML syntax theo chuẩn W3C
Kiểm tra namespace sitemaps.org đúng chuẩn
Validate format của tất cả URLs trong sitemap
Kiểm tra thuộc tính lastmod theo format ISO 8601
Validate changefreq với các giá trị hợp lệ
Kiểm tra priority trong khoảng 0.0-1.0
Phát hiện sitemap vượt quá giới hạn 50,000 URLs
Thống kê chi tiết: total URLs, có lastmod, có changefreq
Hiển thị danh sách URLs để review
Phân loại rõ ràng Errors và Warnings

Tại sao cần validate XML Sitemap?

XML Sitemap là cầu nối quan trọng giữa website và search engines. Một sitemap lỗi có thể khiến Google bỏ qua các trang quan trọng hoặc không crawl website hiệu quả. Các lỗi phổ biến như XML syntax error, URL không hợp lệ, hoặc lastmod sai format có thể khiến toàn bộ sitemap bị reject. Google Search Console sẽ báo lỗi nhưng không chỉ rõ vị trí. Công cụ validate giúp bạn phát hiện và sửa lỗi trước khi submit, đảm bảo tất cả trang được index đúng cách. Đặc biệt quan trọng sau khi migrate website hoặc thay đổi URL structure.

Lợi ích khi sử dụng

  • Đảm bảo Google và Bing crawl đúng tất cả trang quan trọng
  • Phát hiện URLs lỗi 404 hoặc redirect trong sitemap
  • Kiểm tra format chuẩn trước khi submit lên Search Console
  • Tìm ra các trang bị thiếu trong sitemap
  • Verify lastmod dates để Google biết trang nào cần re-crawl
  • Tránh sitemap bị reject do syntax errors
  • Tối ưu crawl budget bằng cách loại bỏ URLs không cần thiết
  • Debug nhanh khi Search Console báo sitemap errors

Hướng dẫn sử dụng XML Sitemap Validator

  1. 1Mở file sitemap.xml của website (thường tại domain.com/sitemap.xml)
  2. 2Copy toàn bộ nội dung XML của sitemap
  3. 3Paste vào ô input trong tab 'XML Content'
  4. 4Nhấn nút 'Validate Sitemap' để bắt đầu kiểm tra
  5. 5Xem kết quả: Errors (lỗi cần sửa ngay), Warnings (cảnh báo nên xem xét)
  6. 6Sửa các lỗi trong sitemap gốc, regenerate và validate lại cho đến khi không còn errors

Cấu trúc chuẩn của XML Sitemap

XML Sitemap chuẩn bắt đầu với XML declaration và urlset element với namespace sitemaps.org. Mỗi URL được wrap trong thẻ <url> với các child elements: <loc> (bắt buộc - URL đầy đủ), <lastmod> (optional - ngày cập nhật cuối theo format YYYY-MM-DD), <changefreq> (optional - tần suất thay đổi: always, hourly, daily, weekly, monthly, yearly, never), và <priority> (optional - độ ưu tiên từ 0.0 đến 1.0). Google chủ yếu sử dụng loc và lastmod, ít quan tâm đến changefreq và priority.

Các lỗi sitemap phổ biến và cách sửa

Lỗi #1: XML syntax error - thường do thiếu closing tag hoặc ký tự đặc biệt không được escape (&, <, >). Lỗi #2: URL không hợp lệ - thiếu protocol (http/https) hoặc có space. Lỗi #3: lastmod sai format - phải là YYYY-MM-DD hoặc full ISO 8601. Lỗi #4: Vượt quá 50,000 URLs - cần chia thành nhiều sitemap và dùng sitemap index. Lỗi #5: Thiếu namespace - phải có xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'.

Câu hỏi thường gặp (FAQ)

Sitemap tối đa được bao nhiêu URLs?

Theo Google, mỗi sitemap file tối đa 50,000 URLs và không quá 50MB (uncompressed). Nếu website có nhiều hơn, bạn cần tạo nhiều sitemap files và một sitemap index file để liệt kê tất cả. Sitemap index cũng tối đa 50,000 sitemaps.

lastmod có quan trọng không?

Có, lastmod rất quan trọng! Google sử dụng lastmod để quyết định có cần re-crawl trang không. Nếu lastmod không thay đổi, Google có thể skip trang đó. Tuy nhiên, lastmod phải chính xác - nếu bạn update lastmod mà content không đổi, Google sẽ mất tin tưởng và bỏ qua lastmod của bạn.

Có cần include tất cả URLs trong sitemap không?

Không nhất thiết. Sitemap nên chứa các trang canonical, có giá trị, và bạn muốn được index. Không nên include: trang redirect, trang 404, trang noindex, trang duplicate, trang thin content, hoặc trang private. Quality over quantity.

Sitemap index là gì?

Sitemap index là file XML chứa danh sách các sitemap files khác. Thay vì một sitemap khổng lồ, bạn chia thành nhiều sitemap nhỏ (theo category, post type, date...) và liệt kê trong sitemap index. Google sẽ đọc index trước rồi crawl từng sitemap con.

Nên submit sitemap ở đâu?

Submit sitemap tại Google Search Console (Sitemaps section) và Bing Webmaster Tools. Bạn cũng nên thêm sitemap URL vào robots.txt với directive 'Sitemap: https://domain.com/sitemap.xml'. Điều này giúp các bots tự động tìm thấy sitemap.

Từ khóa liên quan

xml sitemap validatorkiểm tra sitemapsitemap checker onlinevalidate sitemap xmlsitemap testerseo sitemap toolgoogle sitemap validatorsitemap analyzerxml sitemap checkersitemap errors

Hợp tác ngay với Tấn Phát Digital

Chúng tôi không chỉ thiết kế website, mà còn giúp doanh nghiệp xây dựng thương hiệu số mạnh mẽ. Cung cấp dịch vụ thiết kế website trọn gói từ thiết kế đến tối ưu SEO. Hãy liên hệ ngay với Tấn Phát Digital để cùng tạo nên những giải pháp công nghệ đột phá, hiệu quả và bền vững cho doanh nghiệp của bạn tại Hồ Chí Minh.

Công cụ SEO Tools liên quan

Zalo
Facebook
Tấn Phát Digital
Zalo
Facebook