Технологии
SoftInform Search Technology – программа поиска документов -это быстрый и точный поиск похожих по содержанию документов в любых объемах данных, возможность исключить дублирование информации, интеграция в любые прикладные системы, а также возможность разработки широкого спектра приложений как для локальных внутрикорпоративных сетей, так и для глобальных интернет-решений.
программа поиска документов - технология работает с распространенными форматами текстовых файлов (txt, doc, rtf, pdf, htm, html), а также поддерживает подключение баз данных из большинства распространенных информационных систем (Access, MS SQL, Oracle, а также любых СУБД, поддерживающих SQL).
SoftInform Search Technology - программа поиска документов - основана на уникальной математической модели анализа структуры документа и выбора похожих слов, словосочетаний и массивов текста. При поиске учитывается все множество слов, встречающихся в документе с задействованием всех словоформ и словаря синонимов.
Программные продукты
Программа полнотекстового поиска документов SearchInform ( программа поиска документов ) - это программа для быстрого поиска документов среди больших объемов информации - среди документов любых форматов, а также в различных базах данных. Она совмещает в себе возможности фразового поиска с учетом морфологии и словаря синонимов и новой технологии поиска похожих документов SoftInform Search Technology. Программа предназначена для поиска информации в больших объемах данных и существенно повышает качество обработки информации и уменьшает время поиска документов. Скорость поиска документов примерно в три раза выше, чем у существующих систем. Для конкретизации поиска в SearchInform ( программа поиска документов ) присутствует функция «важных слов», на которые программа будет обращать внимание в первую очередь, проводя дополнительный анализ похожести.
Основные возможности SearchInform
- Фразовый поиск с учетом морфологии и словаря синонимов
- Новая технология поиска похожих документов SoftInform Search Technology
- Высокая скорость индексирования (от 15 до 30 Гб/час),
- Размер индекса 15-25% от реального объема текстовой информации
- Поддержка более 50 распространенных текстовых форматов файлов, электронных сообщений Outlook и TheBat, тэгов mp3 и avi и логов программ мгновенного обмена сообщениями ICQ 99-2005 и Microsoft Messenger)
- Корректная работа с архивами
- Универсальные источники данных (индексирование полей СУБД и различных информационных систем)
- программа поиска документов
На сегодняшний день поддерживается масштабируемость, причем сразу по нескольким направлениям Можно масштабировать как для увеличения скорости отработки запросов, так и для увеличения объема индексируемых данных. Проведенные тесты показали, что использование 10 компьютеров вместо одного увеличивает скорость реакции системы примерно в 6 раз.
В базе из нескольких десятков тысяч документов нам нужно найти какую-либо информацию. Используя фразовый поиск ( программа поиска документов ), и даже идеально подбирая ключевые слова и фразы, добиться быстрого и адекватного результата практически не возможно. Чтобы получить какой-либо приемлемый результат нам придется просматривать документ за документом, выбирая новые ключевые слова и тратя время на изучение ненужной нам информации. Но гораздо проще было бы, найдя хоть один более-менее удовлетворяющий нас по тематике текст, нажать кнопку поиска похожих на него документов…
|