Главная страница 1

Российский Интернет – 2001 в цифрах и фактах.



В.А Васенин, И.Л Крючков, М.Ю Ландина, Н.В. Табаченко ,

Центр телекоммуникаций и технологий Интернет,

Институт механики МГУ им. М.В. Ломоносова

E-mail: igor@bull.nmd.msu.ru



Введение.

Всемирная компьютерная сеть Интернет – уникальное явление второй половины 20 века. От идеи создания сетей пакетной коммуникации в начале 60 –х до её воплощения в виде Сети сетей, объединяющей более 140 молн. ЭВМ в более чем 200 странах мира к 2000 году, влияние сети на все сферы жизни современного общества – таков путь Интернет.

Однако такие высокие темпы роста сети, развития телекоммуникационных и информационных технологий создают проблемы, количество и значимость которых растет столь же стремительно. Технологические основы Интернет во все меньшей степени отвечают задачам, которые ставит современный этап развития Метасети. На их решение направлены усилия многих людей и организаций, как на национальном, так и на международном уровне.

В связи с этим вопросы изучения феномена Интернет, оценки параметров, определяющих его важнейшие стороны, поиск подходов к прогнозированию и управлению процессами развития составляют одну из важнейших задач современного общества. Ей посвящены многочисленные исследования, проводимые по инициативе общественных организаций, таких, как Internet Society, учреждений, осуществляющих технический контроль над развитием сети, в числе которых, например, RIPE — европейский Internet Registry, компаний, связанных с использованием Интернет в бизнесе, и многих других.

Российский сегмент Интернет сегодня переживает этап интенсивного развития. Темпы роста Интернет в России не только не уступают, но и превосходят по ряду показателей среднемировые. В той или иной степени российский сегмент испытывает те же проблемы, которые свойственны Глобальной сети. Процессы, сопровождающие развитие российского Интернет, очень близки к тем, которые характеризуют национальные сегменты других стран и Интернет в целом.

Вопросы прогнозирования развития национального сегмента Интернет, возможность использования регулирующих начал со стороны государства становятся все более актуальными. Представленные в настоящей работе результаты анализа и систематизации материалов, характеризующих состояние российского Интернет, следует рассматривать как попытку найти подходы к изучению данного явления, приглашение к совместной работе в этом направлении. Несмотря на то, что совокупность представленных характеристик и оценок недостаточно полно отражает реальное положение дел, на основании уже имеющихся данных можно сделать некоторые выводы об основных тенденциях развития российского Интернет и возможностях регулирующих начал в этом процессе.

Первые IP-сети, давшие начало развитию национального сегмента Интернет, появились в научно-образовательных организациях России на рубеже 80-х – 90-х годов 20-го века. Этот период отмечен бурным ростом сетевой активности в США, связанной с развитием государственной сети NSFNet, в то время составлявшей основу Интернет, к которой подключались все остальные сети. Количество компьютеров, связанных в единую транснациональную сеть, в 1990 году превысило 300 тыс., а к середине 1992 года, когда в подсчетах зафиксированы первые хосты в России, уже вплотную приблизилось к миллиону. Однако связность с Интернет тогда имели не более 50 стран. К этому времени в мире уже был накоплен некоторый опыт работы с сетью подобного масштаба, развивались основные элементы Интернет, начиналось их формирование на межрегиональном и международном уровнях.

Несмотря на объективное отставание, структура российского сегмента Интернет и процессы, определяющие его развитие, аналогичны мировым. В связи с этим представляет интерес определить основные системообразующие элементы мирового Интернет, что дает возможность объективно выделить и оценить ряд приведенных ниже характеристик и параметров, описывающих российский Интернет.

Мониторинг состояния российского сегмента Интернет направлен на учет динамики развития отдельных его элементов. К таким элементам можно отнести связность, транспортную, особенно опорно-магистральную, региональную и межрегиональную ее составляющие, рост числа хостов и емкости шлюзов в зарубежные сети, развитие информационных ресурсов и эволюцию трафика. Анализ динамики изменения этих и других элементов — ключ к поиску рычагов воздействия на процессы развития российского Интернет, административно-технических и технологических решений, оптимальных вложений государственных средств, которые могут быть задействованы на этом направлении, разумной в национальных интересах интеграции ресурсов научно-образовательных и коммерческих сетей, крупных операторов связи.

Цель исследования

Проект, результаты которого представлены в докладе, ставит своей целью:


  • разработку методологии сбора и обработки результатов прямых измерений характеристик российского сегмента Интернет для анализа его состояния;

  • создание инструментального комплекса для автоматизации процессов мониторинга российского сегмента Интернет;

  • размещение результатов мониторинга состояния российского сегмента Интернет, отдельных его характеристик и результатов апробации разработанных методик в сети Интернет.

Автоматизация процессов мониторинга Интернет заключается в разработке инструментального комплекса средств автоматизации процессов сбора, хранения, обработки и анализа характеристик Интернет.

Основной задачей на данном этапе является создание прикладного программного обеспечения для обработки первичных данных по количеству хостов в доменах верхнего уровня и автономных системах поставщиков сетевого сервиса, включая:



  • разработку программного обеспечения для сканирования хостов и обработки полученных данных;

  • создание базы данных по сетевым объектам и их реквизитам;

  • создание Web-сайта с результами исследования.

Архитектура системы.

Исходя из сформулированных задач, наиболее естественным представляется разбить систему на три функциональных уровня:


1. сбора данных;

2. хранения информации;

3. анализа данных (построения макрохарактеристик).

Комментариев требует концепция уровня. Очевидно что, например, в зависимости от того, какое определение, скажем, принадлежности IP-адреса домену мы примем, мы будем определять различные характеристики. Однако чаще всего не представляется возможным определить, есть ли среди возможных определений “более правильное”, чем остальные. Поскольку было бы неразумно ориентировать всю систему на некоторое произвольное определение, то сбор и хранение всей доступной информации, а не ее части, будет наиболее естественным, тем более, что в этом случае разработчики различых частей оказываются менее зависимы один от другого, что означает меньше сложностей в организации проекта. Это означает также и большую модульность системы.

Первый и третий уровни предполагают наличие нескольких модулей на каждом из них, с единым для модулей всего уровня интерфейсом ко второму уровню. При такой архитектуре модули первого уровня могут заниматься сбором данным, не заботясь о том, как они будут обработаны, а модули третьего уровня — обрабатывать данные, не заботясь о том, как они получены. Это решает также проблему, связанную с тем, что данные могут потребовать на некоторый фиксированный момент времени, а их сбор — длительный процесс.

Исследование количества хостов в российском Интернет.

Сбор первичных данных по количеству хостов в доменах верхнего уровня осуществляется с помощью свободно-распространяемой утилиты host, которая посредством запросов к name-серверам (авторизованным DNS-серверам зоны, отвечающим на запросы об именах доменов в пределах зоны), позволяет получить всю информацию о хостах, поддерживаемых DNS-серверами. Эта информация (данные зоны) хранится и передается в виде так называемых “ресурсных записей” и включает в себя, в частности, A-записи, которые используются для преобразования имен доменов в IP-адреса (пример A-записи: “4-sezona.ru A 195.2.70.38”, где 4-sezona.ru — имя домена, а 195.2.70.38 — соответствующий IP-адрес хоста в сети), и NS-записи, в которых указаны авторизованные DNS-сервера зоны (домена) (пример NS-записи: “CTF-CLUB.ru NS ns.dataforce.net'', где CTF-CLUB.ru — имя домена, а dataforce.net — name-сервер соответствующей зоны).


Процесс сканирования российского сегмента Интернет состоит в рекурсивном обходе дерева DNS, начиная с доменов верхнего уровня .RU и .SU, и выполнении процедуры zone transfer (AXFR — full zone transfer — тип запроса, поддерживаемый всеми DNS-серверами и используемый для обновления и синхронизации данных зоны; процесс zone transfer состоит в передаче всех данных зоны в виде ресурсных записей) для всех обнаруженных поддоменов до 4-го уровня включительно.

На основании полученных в результате zone transfer NS-записей и A-записей генерируются списки имен обнаруженных поддоменов и хостов в зонах .RU и .SU.


Проблемы при оценке размеров сети.

Очевидно что используемая методика дает только весьма приблизительные значения. Основные источники ошибок обусловлены следующими обстоятельствами:


  • Исследование ограничивается рамками доменов .RU и .SU. Однако некоторая часть российского Интернет находится в доменах .ORG, .NET, .COM и др., оценить размер погрешности не представляется возможным. Одновременно часть серверов с именами в домене .RU физически находятся за рубежом.

  • Далеко не все серверы DNS работоспособны и настроены, далеко не всегда у точки тестирования есть связь хотя бы с одним из указанных для домена DNS –серверов. В этом случае не удастся получить SOA-запись для данного домена. Такие случаи достаточно часты для доменов 3-го и 4-го уровней. Для доменов 2-го уровня такие проблемы встречены примерно у 1% доменов, что не должно существенно повлиять на общие результаты.

  • Некоторые DNS-серверы не позволяют проводить AXFR “сторонним” серверам (только своим secondary servers). Машины, входящие в такие домены, не будут учтены исследованием. Количество таких серверов тоже невелеко — только около 3% доменов 2-го уровня запретили AXFR.

  • Количество А-записей в DNS не соответствует точно числу машин, подключенных к сети, одна и та же машина может иметь несколько имен, в то же время есть машины, не описанные в DNS.

Это далеко не все причины погрешностей исследования. Однако несмотря на указанные проблемы, применяемая методика позволяет оценить динамику роста сети на том основании, что доля неучтенных исследованием доменов и машин меняется медленнее, чем происходит рост сети.

Результаты.

В рамках настоящей работы были получены следующие результаты:


1. Было разработано программное обеспечение, в основе которого лежит база данных, включающая в себя следующие компоненты:

  • базу сетевых объектов и их реквизитов, зеркало базы RIPE (автономные системы, блоки IP-адресов, маршрутные данные);

  • базу статистических данных;

  • набор процедур, автоматизирующих процессы сбора и обработки данных.

2. Было проведено сканирование российского сегмента Интернет, что позволило получить данные по количеству доменов и хостов (машин) в доменах .RU и .SU, а также в автономных системах основных поставщиков сетевого сервиса российского сегмента Интернет. На основании данных о числе хостов были определены 20 крупнейших (по числу машин) доменов 2-го уровня в доменах .RU и .SU, 20 крупнейших (по числу машин) автономных систем российского сегмента Интернет и 20 крупнейших (по числу машин) российских провайдеров. Кроме того, были собраны и структурированы данные по наиболее крупным российским провайдерам (количество подключенных компьютеров, емкость внешних каналов, выход на IX).

По результатам проведенного исследования создан Web-сайт (orris.nmd.msu.ru/monitoring), на котором опубликованы описание используемой методики получения первичных данных, описание базы данных и процедур сбора и обработки данных, а также статистические данные, характеризующие состояние и перспективы развития российского сегмента Интернет.



Аналогами данного исследования являются: "RIPE Region Hostcount", проводимое Сетевым информационным центром RIPE (RIPE Network Coordination Centre - RIPE NCC), "Internet Domain Survey", проводимое Консорциумом программного обеспечения Интернет (Internet Software Consortium - ISC), "Russian Internet Survey" (прекращено в январе 2000), проводимое А. Тутубалиным, и "Руметрика" (первое и пока последнее исследование было проведено в июле 2001), проводимое компанией Rambler. Полученные в рамках данной работы результаты согласуются с данными перечисленных исследований, что указывает на их адекватность реальному положению дел и репрезентативность.

Литература.

  1. В.А. Садовничий, В.А. Васенин, А.А. Мокроусов, А.В. Тутубалин, ``Российский Интернет в цифрах и фактах'', М.: Изд-во МГУ, 1999. — http://www.msu.ru/ctti/book99/RIiFaN-toc.html

  2. Количественноe исследованиe Российского сегмента Интернет (Russian Internet Survey), http://www.lexa.ru/ru-survey/

  3. RIPE NCC Hostcount, http://www.ripe.net/ripencc/pub-services/stats/hostcount/index.html

  4. ISC Internet Domain Survey, http://www.isc.org/ds/



Смотрите также:
Российский Интернет 2001 в цифрах и фактах
82.17kb.
Агента, в президенты? Национальное предательство или итоги 12-летнего правления В. В. Путина в статистических цифрах и фактах
135.37kb.
«Современные технологии в обучении английскому языку» по материалам Интернет-семинара для сетевых педагогов, оказывающих Интернет-поддержку участникам курсов повышения квалификации учителей английского языка
276.41kb.
Полный текст госта р 51709-2001 содержательный и довольно ёмкий
64.88kb.
Компьютерное тестирование
23.65kb.
Биология в цифрах раздел ботаника
223.92kb.
Правда, основанная на фактах
1407.08kb.
Общества. Интернет: «ЗА» И
89.13kb.
Памятка для клиента системы Интернет Банкинг
74.58kb.
В статье рассматривается проблема использования Интернет-технологий в процессе обучения студентов иностранным языкам, в первую очередь речь идёт о разработке современных мультимедийных образовательных программ в России
45.96kb.
Фонд «ропц» (Российский общественно-политический центр)
31.08kb.
3. Российский государственный исторический архив Адрес: Заневский пр., д
29.59kb.