SEARCH-IWEB
Как это работает:
Программные продукты серии SEARCH-IWEB — набор средств полнотекстовой индексации и поиска в текстовых данных с учетом морфологии русского и английского языков.
|
Как это работает:
Программные продукты серии SEARCH-IWEB — набор средств полнотекстовой индексации и поиска в текстовых данных с учетом морфологии русского и английского языков. SEARCH-IWEBвключает модули морфологического анализа и синтеза, индексации и поиска, а также набор вспомогательных модулей, таких, как анализатор документов, языки разметки, конверторы форматов, сетевой «паук».
Алгоритмы морфологического анализа и синтеза, основанные на базовом словаре, умеют нормализовать слова, то есть находить их начальную форму, а также строить гипотезы для слов, не содержащихся в базовом словаре. Система полнотекстового индексирования позволяет создавать компактный индекс и быстро осуществлять поиск с учетом логических операторов.
SEARCH-IWEB предназначен для работы с текстами как в локальной так и в глобальной сети (технологии Intranet и Internet), а также может быть подключен как модуль к другим системам.
Индексация
Создаваемый индекс составляет около 1/3 объема текста (без картинок, tag?ов и пр.), при этом записывается подробный адрес слова — с точностью до позиции в тексте, что потом позволяет искать с учетом близости. В базу входят нормализованные формы слов текста, сами документы не хранятся. Морфологический анализ слов текста происходит одновременно с индексацией, что дает возможность снятия омонимии.
Скорость индексации — 10-20 Мб/минуту на компьютерах класса PentiumII/III.
Поиск
Богатый язык запросов поддерживает все логические операции в пределах документа или предложения, позволяет учитывать расстояние между словами, поиск в заданных зонах или с учетом заданных атрибутов документа. Список выданных документов может быть упорядочен по релевантности, дате или другим документным атрибутам. В каждом найденном документе могут быть выделены (подсвечены) найденные слова.
Работа с языком
Для интеллектуализации поиска используется словарь на 60 тыс. слов. При индексации происходит нормализация, то есть слово ставится в свою исходную форму (для существительных — именительный падеж единственного числа, для глаголов — неопределенная форма и т.д.) и в таком виде учитывается в базе. Алгоритм морфологического разбора умеет корректно обрабатывать и слова, не найденные в словаре. Морфология работает для русского и английского языков. Также индексируются числа. Создан и пополняется словарь имен собственных. Морфологическая часть Яndex может быть использована отдельно от индексирующей.
Поддерживаемые платформы
FreeBSD (i386) 2.2.8, 3.x, 4.x и выше
Linux (i386) glibc-2.0, glibc-2.1, glibc-2.2 и выше
Windows (i386) 95/98/ME/NT/2000/2003 и выше

Программы разработчика
Супер - магазин (Super store):
iweb.nm.ru
Данная программа предназначена для создания интернет-магазина.
Чат Про (Chat Pro):
iweb.nm.ru
Данная программа представляет собой чат для вашего сайта.
Гостевая книга(Guest Book):
iweb.nm.ru
Гостевая книга(Guest Book): динамическая гостевая книга, которая не использует никакую базу данныхСкрипт гостевой книги прост, вся процедура установки описано в файле readme.
SEARCH-IWEB
iweb.nm.ru
Как это работает:
Программные продукты серии SEARCH-IWEB — набор средств полнотекстовой индексации и поиска в текстовых данных с учетом морфологии русского и английского языков.
IWEB-ADS
iweb.nm.ru
Данная программа представляет собой баннерообменную службу, предназначенную для работы на Unix серверах.
Альтернативные программы
Другие программы категории
Change Color 1.1
Lefteris Haritou
Этот скрипт позволяет посетителям сайта выбирать фоновый цвет страницы.
Интим-услуги Nevius 1.0
Nevius-scripts
Многофункциональная служба интим-услуг: размещение, поиск, просмотр интим-услуг по разным городам или районам города.
Работа Nevius 1.0
Nevius-scripts
Многофункциональная доска объявлений о работе.
Поиск по сайту "StrSearch" 1.0
Fortex+
Предназначен для поиска строк или строки на сайте (в HTML файлах например).
Русский портал phpWebThings 6.0
Victor Mosco
Портал целиком сделан на русском.