а если немного помухлевать с количеством страниц и определиться с тем, что и как парсить, задача становится даже интересной а не такой пугающей, ну и да страниц больше чем несколько миллиардов:(
как-то странно это, ну можно готовый список беклинков почекатьв гугле, заодно можно и дополнительную выдачу отдельно проверить, надеюсь остальные пс без таких загонов:)
упоминания это в смысле вхождение названия домена в контент на каком-нибудь ресурсе? это разве дает что-то?
смысл обращаться к кешу, если ссылка нормальная(ну и сайт есть в выдаче), то она рано или поздно в него попадет?