По данным создателей поисковой системы Яndex, общий объем русскоязычных документов в сети Интернет превысил 100 гигабайт. Об этом сообщается в статистической сводке, опубликованной 13 октября на сервере этой поисковой машины (www.Yandex.Ru). Системой Яndex на данный момент проиндексировано 101,94 Гб. По утверждению создателей сервиса, на сегодняшний день русскоязычная часть Паутины содержит в общей сложности более 10 миллионов страниц. Теоретически при оценке количества страниц возможность существования одного и того же текста в различных кодировках учитывается (т.е. идентичные документы в разных кодировках считаются за один, а не за несколько). Также в теории не рассматриваются как разные документы файлы на серверах, доступ к которым осуществляется по разным сетевым адресам (lenta.ru, www.lenta.ru, www.lenta.ru:8080, 195.230.90.26). Насколько серьезна на самом деле погрешность, связанная с многократным учетом одних и тех же документов на практике, является предметом для отдельного исследования.
Узнайте больше в полной версии ➞В опубликованной сегодня статистике поисковой системы содержатся также данные о темпах роста информационного наполнения русского Интернета. По данным Яndex, за последний год (с сентября 1998 по сентябрь 1999) рост различных показателей в процентном отношении составил:
Количество URL - 1324%
Серверы - 345%
Объем - 1618%
Количество страниц на одном сервере - 384%
Объем страницы -122%
Объем сервера - 469%
Как отмечают авторы исследования, русская Сеть развивается не только "в ширину" (путем увеличения количества серверов), но и "в глубину" (путем увеличения общего объема информации на серверах).
Поисковая система Яndex является разработкой компании CompTek.