Аннотация

Хотя Интернет остается ведущей информационной  технологией для массового пользователя, поисковые технологии в глобальной сети ждет много серьёзных проблем. Технологии локального поиска имеют ряд преимуществ и хорошие перспективы на рынке информационных технологий.

 

 

Своя база ближе

Валерий Захарченко

 

Что известно о компании  «MBDSOFT»? Все данные о Петровицком Бонифации Ивановиче. Связан ли он с этой компанией? Правила сертификации трикотажных изделий. Что такое нейрокомпьютер?

Где и каким способом искать ответы на возникающие вопросы?

Если не считать доисторического способа: пойти в библиотеку и поискать в книгах и журналах, который любой современный человек с негодованием отвергнет, то современные технологии предлагают три основных варианта решения проблемы.

Первый и самый распространенный – поиск в интернете. При этом вся информация, в которой вы ищете распределена по глобальной сети и для поиска вы используете одну из поисковых машин, предоставляющих услуги поиска в Интернете. Основное преимущество поиска в интернете – это открытый доступ ко всей информации, хранящейся в сети. Основной недостаток, следствие его основного достоинства: большое  количество мусора, получаемого при поиске в таком огромном количестве информации.

При втором варианте вы, через сеть интернета, обращаетесь к специализированной базе данных, размещенной на отдельном сервере, например британской энциклопедии, патентной библиотеке, тематически подобранному каталогу. Информация в этой базе ориентирована на тему Вашего запроса, и поиск в базе осуществляется только в  локальном информационном массиве, при обращении  пользователя к поисковой системы сайта. Такой  поиск  намного эффективнее «стрельбы по площадям» в обычной поисковой системе. Правда доступ к таким информационным ресурсам в основном платный, так как их создание трудоемкое и дорогое дело.

Третий способ стал возможен в связи с  ростом  производительности современных компьютеров и появлением  программных средств с новыми возможностями. В этом варианте вы сами, или ваши специалисты, создают на вашем персональном компьютере или сервере предприятия тематические базы данных, на основе подборки исходных документов, энциклопедий, справочников, словарей, тысяч книг и журналов по определенной тематике. К этой базе вы самостоятельно добавляете весь архив личных или служебных документов.

Чем поиск в такой «своей базе» данных, лучше чем поиск в интернете - всемирной базе данных?

Тем же, чем личное лучше общественного. Можно ездить на общественном транспорте, а можно на собственном автомобиле. Дороже, но эффективнее (хотя и не всегда).

Распространеннная в интернете технология поиска была создана достаточно давно, когда объемы информации в сети были в сотни раз меньше чем сейчас. При нынешних объемах информации она работает плохо. Выдается огромное количество ненужных ссылок, а нужная информация теряется. С каждым годом ситуация усугубляется, можно даже говорить о кризисе поиска информации в Интернете и необходимости перехода к новым технологиям поиска.

Также, при всем уважении к службам поиска информации в Интернете, их основной задачей вовсе не является удовлетворение поисковых потребностей пользователя. Все эти службы являются коммерческими предприятиями, основная задача которых, извлечение прибыли. Так как услуги поиска оказываются бесплатно, то основной доход поисковые системы получают от рекламы и сопутствующих услуг.  Используемая  технология поиска подразумевает выдачу множества ссылок, просматривая которые вы невольно просматриваете и массу рекламных материалов. 

Есть и другие проблемы. Глобальная поисковая система является для пользователя окном в мир информации. Очень легко ввести в поисковую систему фильтры, которые будут искажать пейзаж за этим окном. Например, увеличить весовые коэффициенты каких-то фирм, ввести в программу ранжирования результатов поиска критерии национального, политического или экономического характера. Опасность того, что поисковые системы интернета могут стать инструментом глобальной экономической или даже государственной политики вполне реальна. В Европе уже возник скандал из-за использования американцами поисковых систем в своих интересах.  

Несмотря на то, что поисковые технологии в глобальной сети ждет много серьёзных проблем, Интернет остается ведущей информационной  технологией для массового пользователя. Но не единственной. Технологии локального поиска имеют много преимуществ и хорошие перспективы на рынке информационных технологий.

Основное преимущество локальных поисковых систем заключается в резком увеличении эффективности поиска за счет использования собственных высокоэффективных программно-аппаратных средств и за счет планомерного и осмысленного комплектования своей базы данных тематическими информационными массивами, очищенными от ненужного информационного мусора. В частности:

·   Программный комплекс для работы с собственной базой данных не имеет ограничений на интерфейс, структуру и функциональные возможности клиентской части программы. Например, при поиске, пользователь может использовать полный словарь базы данных, словари имен, названий. Стандартный браузер такой возможности не дает.

·   Скорость обмена информацией между программой поиска и базой данных на отдельном компьютере намного выше чем в сети. Это позволяет реализовать более эффективные алгоритмы поиска по сравнению с интернетом, например в интерактивном режиме мгновенно просматривать полные тексты с найденной информацией. В интернете выдаются только ссылки на найденные документы для их последующего просмотра. В результате весь процесс поиска очень медленный.

·   Поиск в Интернете рассчитан на быстрый (доли секунды) ответ  пользователю, иначе система не сможет обслужить всех желающих. Использование новых поисковых технологий со смысловым анализом текста требует во много раз больших вычислительных ресурсов. Такие ресурсы может предоставить пользователю его собственный компьютер, неограниченный по времени работы. Эта проблема может оказаться ключевой при переходе к новым технологиям поиска.

·   Пользователи локальных поисковых систем имеют возможность включать в «свою» базу данных, в общее поле поиска, собрание личных документов, служебные архивы, а также информационные массивы закрытого характера. Например, множество баз данных, распространяемых на сменных носителях, вряд ли появятся в открытом доступе в Интернете. Информация в локальной базе данных может быть надежно закодирована и поэтому её хранение максимально безопасно.

Также, как в свое время произошла децентрализация вычислительных ресурсов, при появлении персональных компьютеров, также сейчас, в связи с развитием программных и аппаратных средств поиска, наметился переход к децентрализации информационных ресурсов. Уже сейчас на рынке информации множество предложений баз данных самого различного рода: энциклопедии, каталоги предприятий, юридические системы,  базы с данными абонентов телефонных сетей и т.д.

Пользователям этих информационных ресурсов необходима программная система, объединяющая под единым управлением разнородные источники: текстовые, гипертекстовые, табличные. Эта поисковая машина обязательно должна иметь аналитические возможности. Она должна очень быстро работать с большими объемами информации, на уровне лучших поисковых систем в интернете. Система должна иметь простой интерфейс, позволяющий даже пользователю начального уровня, использовать все возможности такой поисковой машины.

На рынке программных средств для поиска информации имеется достаточно систем для поиска в интернете, для поиска на сайте. Рынок программ для поиска в локальных базах данных находится в зачаточном состоянии. В основном, это маломощные системы для поиска в персональных коллекциях документов. Только начали появляться локальные системы, созданные на основе ядра глобальных поисковых машин.

 Одним из проектов универсальной поисковой системы для локальных баз текстовых данных является система  «MBD Search Engine» («Поисковая машина МБД»), компании MBDSoft. Проект направлен на создание системы, покрывающей широкий спектр потребностей пользователей в локальном поиске. В основе проекта лежит представление о направлениях развития информационных технологий в ближайшем будущем.    

Если раньше, интеллектуальный и культурный уровень человека характеризовала личная библиотека, то в ближайшем будущем  эту роль будет играть персональный банк текстовой (и не только текстовой) информации со специализированным программно-аппаратным комплексом – персональной поисковой машиной.

 

8 августа 2005г.