« предыдущая статья | Все статьи | следующая »
русскоязычная поисковая система
Чемпионат по настольному поиску (программы для локального поиска)
Мне повезет?
Именно таким слоганом[8] нас встречает главная страница поисковой машины Google. Что же, посмотрим, насколько реальным окажется это везение. Бесплатный инструмент Google Desktop Search невелик по объему (725 Кб) и загружается со страницы desktop.google.com. Установка происходит практически мгновенно, если не брать в расчет истерику софтинки по поводу включенного монитора IMON антивируса NOD32. Впрочем, Google Desktop Search оказался тот еще фрукт: список приложений, с коими этот поисковик отказывается «дружить» весьма внушителен (desktop.google.com/support/bin/answer.py?answer=10742): в «черный список» попали сразу несколько антивирусных продуктов, не считая других приложений. Пожалуй, я зря «прицепился» к формату RTF: ну и пусть тексты моих статей хранятся в этом формате - оный скоро вымрет, как класс. Ну, не обещают нам, что «гугль» умеет индексировать RTF, значит, и надеяться не на что.
Самое «забавное» в том, что никаких настроек мы не увидим и в помине: таковые отсутствуют по определению. Разумеется, ни о каком выборе областей индексирования не может быть и речи: Google Desktop Search сразу после установки начнет «тупо» индексировать содержимое всех дисковых разделов. Причем, как и предшествующая софтина, этот поисковик индексирует файлы и документы при отсутствии каких-либо действий со стороны пользователя (двинули мышку – процесс прервется). Длится же индексация довольно долго: все поддерживаемые файловые форматы на всем 160-гигабайтном носителе определялись чуть более часа (дай Бог, чтобы там набралось 4 гигабайта документов). Теперь предстояло найти папку с базами индексации. Как оказалось сей каталог затаился в C:\Documents and Settings\ваше_имя\Local Settings\Application Data\Google\Google Desktop Search. Объем созданных баз – 413 Мб! Однако...
Думаю, нет смысла говорить о том, что в ответ на запрос из двух слов (те самые «Антивирусные записки»), поисковик тут же выдал исчерпывающий ответ: да, такой документ имеет место быть. Текстовый фрагмент из трехсот знаков тоже не смутил программу: в доли секунды мне сообщили о расположении искомого документа. При увеличении количества текста до 2000 знаков Google Desktop Search таки сдался – дескать, не в моих силах потрафлять твоим иезуитским фантазиям. Поиск творений г-на Гребенщикова оказался выше всяких похвал: именно таким образом и были прописаны ID3-тэги в MP3-файлах. Без запинок, в самом лучшем виде находились русскоязычные файлы и документы в форматах PDF и HTM/HTML. Ну, не обещали нам RTF... стоп! При вводе текста из англоязычного RTF-файла Google Desktop Search спокойно выдал результат: мол, «есть такая партия». И здесь «непонятки» с кириллицей в RTF. Ну, да Бог с ним, тем более что проблема решилась совершенно неожиданно.
Энтузиасты уже успели выпустить для Google Desktop Search ряд дополнительных модулей (desktop.google.com/plugins.html), в том числе, для работы с архивами (включая WinRAR) и плагин для интеграции программы с браузером Firefox. Меня прельстил плагин со знаковым именем Google Desktop Extreme. И, как оказалось, не зря: после установки оного, не только Desktop Extreme стал находить RTF-файлы, но и основной продукт. Как видите, функциональность Google Desktop Search без проблем расширяется ценой нескольких сотен килобайт входящего трафика. Причем, работа поисковика в фоновом режиме постоянной индексации гораздо меньше влияла на быстродействие системы, нежели г-н Коперник. Казалось бы, что еще желать для офф-лайн поиска? Ан нет, у нас остался еще один участник.
SoftInform Search Technology ( русскоязычная поисковая система ) в первую очередь корпоративный инструмент поиска информации в локальной сети предприятия (документов практически любых форматов), информационных системах, СУБД, CRM и так далее. Важным преимуществом данной разработки является консолидация под своим управлением информации из различных источников. В SoftInform Search Technology (русскоязычная поисковая система) реализована система рубрикации (удобный и быстрый инструмент распределения любых документов по заданной тематике) и автокатегоризации документов – автоматического распределения новых документов по существующим рубрикам в соответствии с общим принципом похожести. Такой подход к организации и консолидации данных позволяет структурировать информационные составляющие любого крупного предприятия под управлением одной программы. Притом, без нужды переводить документы и данные в какой-либо единый формат. Вся информация, доступная для индексирования и дальнейшего поиска может быть распределена, структурирована и отображена в удобном виде.
« предыдущая статья | Все статьи | следующая »
Одной из важнейших задач, которую приходится решать компаниям на сегодняшний день, является быстрый поиск документов в больших объемах данных. Организация доступа к данным напрямую зависит от технологий и программ, обеспечивающих скорость и качество обработки информации. На данный момент существует много и технологий, осуществляющих фразовый поиск (Google, Hummingbird, Verity и другие), но они в отличие от технологии СофтИнформ русскоязычная поисковая система не решают проблему поиска информации в полной мере.
Компания Лоция Софт и СофтИнформ объявляют о начале специальной акции – «Снижение на 20% цен на ПО SearchInform Lotsia Edition». Акция продлится до 15 мая 2006 года.
Подробнее...
»
Большой рыночный потенциал заложен в технологии поиска, которая не зависит от языка. По словам Льва Матвеева, генерального директора "СофтИнформ" – «технология абсолютно независима от морфологии и в течение максимум двух недель настраивается на любой язык поиска».
iOne.ru
Подробнее...
» Вся пресса русскоязычная поисковая система
|