get_all_outside_links($site,$file,$timeout,$separator="<br>"); - сохранить все внешние ссылки для заданного сайта
Функция на вход принимает параметры:
$site – сайт, по отношению к которому надо получить внешние ссылки $file – путь к файлу, куда сохранять внешние ссылки $timeout – максимальное время, отведенное на данную операцию $separator – строка разделитель внешних ссылок в файле и результате
После отработки функция возвращает результат своей работы в робот :
Рейтинг – рейтинг заданного сайта по Алексе
Пример использования get_all_outside_links (Python):
# Additional paths import sys sys.path.insert(0, '../../../Templates PY/') xhe_host = "127.0.0.1:7012" from xweb_human_emulator import * # начало echo("<hr><font color=blue>seo.xxxxxxxxx</font><hr>") # 1 echo("1. Перейдем на сайт : ") echo(browser.navigate("http://ya.ru/"),"<br>") # 2 echo("2. Получим все внешние ссылки с сайта (выполняется долго, парсит все страницы сайта): ") echo(seo.get_all_outside_links("http://ya.ru/","c:\\outsidelinks.txt",100000)) # конец echo("<hr><br>") # Quit app.quit()