|
Исследование закономерностей потоков информации в сети Интернет и проведение экспериментов
В рамках проекта:
Продолжено развитие построенной ранее в рамках проекта РФФИ 98-07-90293 распределенной системы кеширования Интернет-трафика для науки и образования, которая на конец 2003 года насчитывала 5 центральных
серверов, расположенных в Москве в различных научных сетях - webcache1.free.net (ioc.ru.ircache.net) в ИОХ РАН (сеть FREEnet), ikia.ru.ircache.net в ИКИ РАН (сеть RSSI), ras.ru.ircache.net в ИТФ им. Л.Д.Ландау (сеть RASnet), proxy.iip.net в центре управления ЮМОС (ТЦ Наука и Общество, сеть IIPnet) и экспериментальный сервер dau.ru.ircache.net, поддерживающий протокол IPv6. Кроме этого, в состав сети входят 2 региональных сервера - proxy.chg.ru (chg.ru.ircache.net) в Научном центре РАН в Черноголовке и proxy.yars.free.net в Ярославском государственном университете.
Предложено 2 варианта проведения активных и пассивных измерений транспортных потоков в Интернет и эффективности кеширования, названные нами "Rewind-and-Replay" и "cache triangle". С использованием этих методик:
- выявлено преимущество предложенной нами процедуры оптимизации полных путей от источника запроса до источника информации с учетом весов (в смысле RTT) каждого пути;
- показано, что при числе запросов в эксперименте порядка миллиона вариация измеряемых величин (например, скорости получения документов) не превышает 5% и, таким образом, результаты становятся достоверными и воспроизводимыми;
- показано, что использование распределенной системы кеширования позволяет увеличить скорость получения документов в среднем в 2 раза, а для некоторых доменов - до 10 раз.
Исследованы ранговые распределения запросов к вэб-серверам, основанные на статистике кеш-серверов в различных российских научных сетях за 7 лет (1996-2003 гг). Предложена модификация закона Зипфа с двумя дополнительными параметрами и дана интерпретация этих параметров. Обнаружено, что показатель экспоненты модифицированного закона Зипфа не зависит ни от года наблюдения, ни от расположения кеш-сервера в иерархии, ни от продолжительности измерений. Обсуждаются возможные пути расширения обнаруженных условий универсальности. Рассмотрены несколько моделей, описывающие наблюдаемые закономерности.
Проанализированы ранговые распределения запросов к вэб-сайтам в различных доменах верхнего уровня. Показано, что в этом случае показатель экспоненты равен 2. Показано, что распределение числа запросов из различных TLD к серверу ftp.chg.ru подчиняется аналогичным закономерностям.
Проведены эксперименты по прозрачному кешированию. Показано, что достаточно мощный кеш-сервер на базе ПК и Squid вполне справляется со всеми запросами региональной сети.
Публикации:
|