Можно посмотреть логи сервера, выбрать оттуда строки, содержащие "googlebot"(потом сделать обратный запрос днс, дабы удостовериться что это гугл, по нормальному). Имея список страниц, убедиться что гугл их обошел/не обошел. Может там 404 много, или контент сомнительного качества.
Свериться в соответствии ссылок сайтмапа и реальных на сайте.
А вообще, гугл как сумасшедший начинает выцеплять странички по сайтмапу.