Тестирование расширенной Звёздной базы данных 2MASS

Мы добавили к базе данных 2MASS точки со случайными координатами, чтобы их число стало равным 1 миллиард.


После такого расширения базы данных её градиенты плотностей изменились несущественно. Плотность Звёзд в некоторых регионах Млечного пути, по-прежнему, в 1000 раз выше, чем плотность Звёзд в самых разреженных регионах Звёздного Неба.

После этого мы выполнили тест, аналогичный Тесту реальной базы 2MASS.

Тестируемые объекты:
XY-координаты Звёзд открытой базы данных 2MASS, включая добавленные точки.



1. Количество Звёзд (всё Звёздное Небо с добавленными точками)

All sky

Плотность Звёзд в некоторых регионах Млечного пути может быть в 1000 раз выше, чем плотность Звёзд в самых разреженных регионах Звёздного Неба.
1.000.000.000
2. Размер таблицы координат Звёзд на жёстком диске

Table
7,5 GB
3. Размер индекса координат Звёзд

Index
5,7 MB
4. Размер индекса относительно размера проиндексированных координат Звёзд (индекс был сжат в ~2 раза) 0,07 %
5. Время индексирования координат Звёзд 37 минут
6. Размер оперативной памяти, занимаемой программной оболочкой

Index
4,6 MB
7. Размер буферов оперативной памяти, выделенных для организации диапазонного поиска 0,1 MB
8. Размер всей оперативной памяти, выделенной во время запросов ничтожен: размер программной оболочки (4,6 MB) + размер распакованного индекса (10,5 MB) + размер буферов (0,1 MB).

Вся база данных остаётся на жёстком диске, оперативная память свободна.

Index
4,6 + 10,5 + 0,1 = 15,2 MB
9. Скорость выполнения диапазонных запросов очень высокая. См. ролик Путешествие по расширенной 2MASS. Ролик содержит счётчики. real time

10. Для сравнения (на этом же компьютере):
Время копирования файла 1,0 GB в ту же директорию
1 мин
11. Для сравнения (на этом же компьютере):
Время сжатия файла 1,0 GB в формат *.rar
5 мин 15 сек
12. Для сравнения (на этом же компьютере):
Время сжатия файла 1,0 GB в формат *.zip
4 мин 31 сек



Компьютер тестов – обычный домашний компьютер, примерно за $ 1000 США: Intel(R) Pentium(R) Dual CPU E2200 @ 2.20 GHz, 2.99 GB RAM.

Перед генерацией данных, их индексированием и выполнением тестирования никакие предварительные подготовки компьютера, в т.ч. и дефрагментация диска, не производились, т.е. станция использовалась в текущем состоянии "как есть".

Во время выполнения тестов дисковое пространство станции было заполнено на 95 % (полный размер дискового пространства 390 GB).

Платформа: Microsoft Windows XP Professional, version 2002, Service Pack 2.

В процессе тестирования компьютер был подключен к сети Интернет, антивирусная система находилась в активном состоянии.

При размещении исходной базы на портативном жёстком диске Seagate FreeAgent система работает через USB-канал примерно с той же скоростью. Время поиска остаётся тем же, как и в случае, когда эта база данных находится на диске компьютера.



Поисковая Технология разработана при поддержке Фонда СР МФП НТС,
образованного Правительством Российской Федерации
ООО Новосиб-БИТ © 2004 - 2017
Запатентовано