Индексирование микро/нано объектов.
Чёткий/нечёткий поиск и распознавание микро/нано объектов.

Модуль NBITSearch позволяет создавать индексы, каждый из которых поддерживает эффективный чёткий и нечёткий поиск в миллиардах исходных микро/нано объектов (микрообъектов).

Микрообъекты могут быть проиндексированы путём их отображения в NBIT-примитивы.

Для изучения структуры вещества широко используются Методы малоуглового рассеяния (МУР) – методы рассеяния электромагнитного излучения или пучка частиц (электронов, нейтронов) на неоднородностях вещества.

Информация о частице может быть получена путём анализа зависимостей распределения интенсивности рассеянного излучения от строения рассеивателя.

Двумерный МУР – "2D-МУР"

В методах классификации белков, когда атомная модель белка неизвестна, информация о его структуре может быть получена из сравнения функций интенсивности излучения I(s) от модуля вектора рассеяния (momentum transfer) s = 4 * PI * sin(u) / x, где 2u – угол рассеяния, x – длина волны.

Этот метод является двумерным – 2D-МУР, т.к. он сводится к получению и анализу двумерных экспериментальных кривых I(s).


Рис.1. Сравнение белков путём сравнения функций
интенсивности излучения I(s). См. Rapid protein classification.
Похожим функциям соответствуют белки, похожие по форме.

При определении того, похожа ли данная функция на другую, сразу возникает вопрос, какую меру сходства следует считать подходящей. Проблема выбора такого критерия всегда является чрезвычайно трудной.

В исследованиях, описанных в Rapid protein classification, для сравнения функций I(s) использовался метод наименьших квадратов.

Метод наименьших квадратов является одним из методов аппроксимации функций, которые обычно используются для нахождения аналитических функций, приближённо описывающих экспериментальные кривые.

Критерием этого метода является минимизация квадрата отклонения аппроксимирующей функции от исходной кривой на всём участке аппроксимации.

Такой критерий налагает жёсткие ограничения на аппроксимацию и значительно сужает множество функций, которые, исходя из других критериев, можно было бы считать похожими на исходную функцию-образец.

Например, часто встречается ситуация, когда по разным причинам экспериментальные кривые имеют импульсные аномалии (Рис.2). Эти аномалии могут быть результатом внешних факторов, случайными или несущественными.


Рис.2. Сравнение экспериментальных кривых.
Одна функция справа имеет импульсные аномалии.
Несмотря на это, эти функции друг на друга похожи.

Метод наименьших квадратов является непригодным для идентификации и определения сходства таких кривых.

NBITSearch позволяет осуществлять регулируемый нечёткий поиск объектов, похожих на образец.

Регулировка погрешности поиска может осуществляться с помощью интерфейса подобно тому, как осуществляется аналогичная регулировка в обычном осциллографе с помощью крутящихся регуляторов.

Трёхмерный МУР – "3D-МУР"

3D-МУР, в отличие от 2D-МУР, сводится к получению и анализу трёхмерных экспериментальных поверхностей интенсивности излучения I(v,x), где v = 2u – угол рассеяния, x – длина волны.

Поверхности интенсивности излучения I(v,x) представляют собой матрицы, являющиеся NBIT-примитивами.

NBITSearch позволяет сравнивать структуры белков по форме матриц более точно, чем по форме функций, так как матрицы, описывающие объекты, де-факто содержат в себе существенно больше информации, чем функциональные кривые, которые описывают эти же объекты.

Примеры закономерностей в матрицах показаны на Рис.3.


Рис.3. Примеры закономерностей в матрицах.


Поисковая Технология разработана при поддержке Фонда СР МФП НТС,
образованного Правительством Российской Федерации
ООО Новосиб-БИТ © 2004 - 2017
Запатентовано