![]() |
|
||||||||||||||
|
|
Как работает MBD Search Engine Часть 1
Процесс работы MBD Search Engine можно разделить на две части: создание базы данных и поиск информации.
Во время создания базы данных, все документы поддерживаемых форматов, собираются из обозначенных папок, архивов и любых доступных мест локальной сети. MBD Search Engine обрабатывет документы, извлекая чистый текст и изображения. Создаваемая MBD SE база данных состоит из нескольких основных файлов. Первый из них - индекс, размер которого около 40% объема чистого текста. Индекс содержит позиции всех слов в базе данных. Второй - файл кодированного текста, содержащий кодированный и сжатый текст документов и ссылки на извлеченные иллюстрации. Размер этого файла около 60% от объема чистого текста базы. При выборе соответствующей опции, создается файл изображений. Файл содержит в сжатом виде все извлеченные из документов изображения. Также опционально создается файл источников (исходных документов), где в кодированном виде хранятся копии всех исходных документов. Файл источников нужен, если требуется защитить исходные документы от несанкционированного просмотра и копирования. Процесс создания базы схематически показан на Рис.1.
Рис 1. Схема процесса создания базы
|
|||||||
|
|
© 2003 - 2008 MBD Soft Ltd. All Rights Reserved. |