Тестирование базы данных оптических спектров

Спектры. Индексирование. Распознавание. Поиск. (PDF-презентация)

Тестируемые объекты:
Случайные блуждающие качающиеся RGB-спектры по 128 значений типа RGB (3 байта).


Что такое “Случайные блуждающие качающиеся RGB-спектры”?
– См. ролик Качающиеся оптические спектры.

1. Количество спектров 250 миллионов
(32 миллиарда
RGB-значений)
2. Размер таблиц исходных спектров на жёстком диске

Source spectra
89,4 GB
3. Размер таблицы масок спектров

Masks
61,5 GB
4. Размер индекса масок спектров

Index
93,3 MB
5. Размер индекса относительно размера проиндексированных данных (относительно размера таблицы масок спектров) 0,148 %
6. Время создания таблицы масок спектров, включающее время чтения исходных спектров с диска 01:06:20.203
7. Время индексирования масок спектров 04:35:46.547
8. Размер оперативной памяти, занимаемой программной оболочкой 3,8 MB
9. Размер буферов оперативной памяти, выделенных для организации нечёткого поиска 5,0 MB
10. Среднее время получения одного результата поискового запроса в режиме CROSS при коэф. сходства спектров с образцом 30 % ~ 28 миллисекунд

Inaccuracy

Как осуществляется процесс регулируемого поиска?
– См. ролик
Регулируемый чёткий/нечёткий поиск спектров.


Компьютер тестов – обычный домашний компьютер, примерно за $ 1000 США: Intel(R) Pentium(R) Dual CPU E2200 @ 2.20 GHz, 2.99 GB RAM.

Перед генерацией данных, их индексированием и выполнением тестирования никакие предварительные подготовки компьютера, в т.ч. и дефрагментация диска, не производились, т.е. станция использовалась в текущем состоянии "как есть".

Во время выполнения тестов дисковое пространство станции было заполнено на 95 % (полный размер дискового пространства 390 GB).

Платформа: Microsoft Windows XP Professional, version 2002, Service Pack 2.

В процессе тестирования компьютер был подключен к сети Интернет, антивирусная система находилась в активном состоянии.

При размещении исходной базы на портативном жёстком диске Seagate FreeAgent система работает через USB-канал примерно с той же скоростью. Время поиска остаётся тем же, как и в случае, когда эта база данных находится на диске компьютера.


Поисковая Технология разработана при поддержке Фонда СР МФП НТС,
образованного Правительством Российской Федерации
ООО Новосиб-БИТ © 2004 - 2017
Запатентовано