Поиск: статья "Снова о корпоративном поиске"

Информационные технологии уже давно обосновались в корпоративном секторе. Редкое предприятии не может не похвастаться добротно организованной локальной сетью и наличием различного специализированного ПО, обеспечивающего контроль информационных потоков, хранение документов и структуризацию информации с удобными отчетами о рабочем процессе..
Информационное разнообразие
Информацию на предприятии можно условно разделить на три вида. Как по ее «виртуальному» и вполне физическому месту расположению, так и по использованию в рабочем процессе. Это, во-первых, файлы на диске пользователя (плюс электронная почта и логи различного рода программ обмена мгновенными сообщениями типа ICQ или MSN Messenger). Во-вторых, это корпоративная информация, те же файлы документов различного формата и электронная почта (например, MS Exchange) или файловый информационный архив на сервере (серверах) предприятия. И, наконец, информация в разного рода информационных системах – DMS, PDM, CRM и так далее. Сюда можно включить все, начиная с объектов самих систем и документов в файловом архиве или в базе данных, например MS SQL, заканчивая «внешними» электронными сообщениями и документами, использующимися в работе системы.

Поиск?
Исходя из такого информационного разнообразия, можно сделать вывод, что в последнее время в корпоративном секторе весьма актуальна проблема поиска информации. В основном, компании сталкиваются с такими сложностями организации поиска, как физический объем базы, неструктурированность информации и наличие разных типов файлов, в которых содержатся нужные данные. В связи с этим спрос на совершенные инструменты поиска и обработки информации все более возрастает. Но кроме непосредственно организации поиска по всем информационным компонентам предприятия (не важно, файловый это архив, корпоративная электронная почта или система управления документами) к корпоративному поисковому ПО существует приличное количество иных требований. Это, конечно, работа с локальной сетью, что подразумевает клиент-серверную архитектуру ПО; соблюдение политик информационной безопасности и управление доступом пользователей; а также, что немаловажно, работа не вместо какой-либо уже установленной системы, а параллельно с ней, без нарушения настроенных бизнес-процессов. Остановимся на этих требования подробнее.

Критичные требования к корпоративному ПО
Возможность работы с локальной сетью подразумевает клиент-серверную архитектуру ПО, гибкие настройки сетевых политик, поддержку различных операционных систем и т.д. Одним из веяний времени стало также наличие веб-интерфейса клиентской части корпоративного ПО, что устраняет проблемы связанные с приобретением дополнительных рабочих мест при расширении информационной структуры. Такой вариант может обойтись дороже, так как при использовании веб-интерфейса количество клиентских мест не ограничено. Но выбор между веб-интерфейсом и самостоятельной программой-клиентом – дело зависящее от нужд и задач, которые предстоит решать при помощи приобретаемого ПО.
Следующим критичным фактором работы поискового ПО в рамках предприятия можно считать соблюдение политики информационной безопасности и управление доступом пользователей. Любая информационная система должна представлять собой структуру с четко определенными каналами обмена информацией как между пользователями так и с «внешним миром». В связи с этим, любое корпоративное ПО должно отвечать жестким требованиям информационной безопасности. Разграничение доступа пользователей, многоуровневый доступ к различного рода информации, система авторизации и гибкая структура изменения политик безопасности в зависимости от запросов клиента.
Еще одной данностью можно считать такое свойство корпоративного ПО, как возможность работы с разного рода уже установленными на предприятии программными продуктами. Как уже упоминалось, информация в любой организации может содержаться как в файлах на диске или в СУБД, так и в каких либо информационных системах (не важно, что это будет – PDM, CRM или бухгалтерская программа). Именно поэтому третьим основным свойством любой информационной системы является возможность ее функционирования не вместо уже развернутого в организации ПО, а в связке с ним. Для корпоративной поисковой системы это еще более актуально, так как организация поиска по всем информационным источникам предприятия – это и есть главная задача внедрения именно поискового ПО.

Поисковый функционал
Кроме вышеперечисленных требований, которые, собственно, и ставят разного рода поисковые системы на уровень именно корпоративного программного обеспечения, нужно выделить и требования к функциональным возможностям данного ПО. Т.е. непосредственно к основным функциям программы, отвечающим за тот самый быстрый и эффективный поиск, становящийся все более и более востребованным. Во-первых, на смену «прямому поиску» (простым перебором) и поиску по только лишь атрибутам документов и объектов уже пришел полнотекстовый поиск с предварительной индексацией. Это более чем удобно и при условии более трудоемкого процесса поиска все равно в десятки раз быстрее.
Во-вторых, это поддержка различных форматов файлов (как распространенных, так и специализированных), а также безупречная работа с разного рода СУБД, информационными системами и т.д. Не стоит исключать из этого списка и уже ставшими незаменимыми средства электронной почты (TheBat! или MS Exchange например) и программ обмена мгновенными сообщениями типа ICQ или MS Messenger. Также всенепременным атрибутом высококачественной программы можно считать и набор поисковых возможностей: различные виды поиска (по фразе, или по отдельным словам), поиск с учетом морфологии и/или синонимов т т.д. и т.п. Ну и конечно, именно для корпоративного сектора с его гигантскими объемами информации, высокая скорость работы программы (как индексации данных, так и непосредственно поиска) – не пожелание, а необходимость.

Прогресс в поисках компромисса
Итак, с требованиями к корпоративному поисковому ПО мы определились. Теперь осталось выяснить, где же найти именно ту программу/систему, максимально близко отвечающую этим требованиям. Ибо доподлинно известно, что удовлетворить все без исключения запросы в принципе невозможно – всегда останутся дыры, которые придется прикрывать или дополнительными программами или сжиться с отсутствием каких-либо нужных функций или возможностей. Так что об идеале можно забыть, на месте ничто стоит… и то, что казалось безупречным вчера уже можно утилизировать к сегодняшнему вечером.
Вообще, разработки в области полнотекстового поиска в последнее время расцвели пышным цветом: благо Интернет подстегивает (Google тому пример), да и корпоративный сектор всегда подтягивается за самым-самым. Но разработки ведутся в основном зарубежными компаниями, притом или ставшими в последнее время богатыми и популярными Интернет-поисковиками или старичками на ниве поиска, начинавшими разработки в этой области еще 15-20 лет назад. Verity, iSYS, dtSearch – компании, разрабатывающие корпоративные поисковые системы, тому пример.
В отечественном же «поле поиска» пока глухо и пусто. Крупные компании, существующие уже несколько лет заняты совсем другим: антивирусы, управление документацией и бухгалтерией, разного рода защиты (файрволы и проч.), игры наконец и т.д. Несколько небольших компаний, правда, успели отличиться неплохими технологиями и программами настольного поиска, особенно хочется выделить среди них продукт Архивариус – удобная, симпатичная и функциональная программа для домашнего пользования. Не так давно и Яндекс порадовал домашних пользователей бесплатной поисковой утилитой, «работающей со скоростью Яндекса». Все на виду: и удобный поиск, и поддержка морфологии, и сортировка по релевантности результатов и поддержка приличного количество форматов файлов, электронной почты и так далее.

Отечественные технологии поиска
Но с корпоративным сектором дала обстоят отнюдь не так радужно. Хотя есть один достойный пример. Достоинство его подчеркивается выбором «сильных»: в течение последнего года на технологию поиска и обработки информации небольшой российской компании СофтИнформ обратили внимание несколько крупных разработчиков разного рода корпоративного ПО. Среди них гранд-производитель систем управления документацией Hummingbird, выбравший программный продукт от СофтИнформ для встраивания в свои информационные системы. Также с недавних пор поисковые технологии СофтИнформ в виде отдельного модуля полнотекстового поиска используются в ПО управления проектной документацией PDM Lotsia Plus компании ЛоцияСофт. Это говорит о двух вещах. Во-первых, подтверждает уже не однажды высказанный тезис в необходимости использования полнотекстового поиска в разного рода приложениях, связанных с обработкой информации. И во-вторых, о доверии к разработкам именно отечественных программостроителей.
За счет чего же небольшая компания СофтИнформ смогла проделать путь (всего за год) от выпуска первой версии домашнего поисковика SearchInform Desktop до анонсирования корпоративной сетевой версии SearchInform Corporate Enterprise и интеграции с крупными разработчиками ПО управления документами? Перейдем непосредственно к рассмотрению технологи и продуктов на ее основе.

SoftInform Search Technology
SoftInform Search Technology – технология поиска и обработки информации, содержащейся в текстовых файлах на компьютере пользователя и в локальной сети предприятия, базах данных и информационных системах. По заявлениям разработчиков эта технология включает в себя все инструменты, необходимые для структуризации разрозненной информации в рамках предприятия и предоставляет собой эффективное решение любых проблем поиска и консолидации информации. Сделаем оговорку, что набор инструментов явно не полный, но признание разработки крупными компаниями дает право заявить о наличие вышеперечисленных в данном материале возможностей и учете требований корпоративного клиента.
Работа в локальной сети предприятия, наличие клиент-серверной архитектуры, нескольких линеек ПО, включая решения с веб-интерфейсом клиентской части и четкое соблюдения политик информационной безопасности и управления доступом пользователей: это вполне джентльменский набор характеристик. Но кроме этих «де-факто» для корпоративной системы, технология и ПО на ее основе от СофтИнформ может похвастаться двумя исключительно выдающимися возможностями, на которых, в общем-то и стоится успех продвижения продукта.
Во-первых, это запатентованная компанией СофтИнформ технология поиска документов, похожих по содержанию и смыслу на текст запроса. Это означает, что кроме обычного поиска по фразе или по атрибутам документов, в программах линейки SearchInform есть еще один вид поиска. Притом намного более интеллектуального, чем обычный поиск по фразе. На практике это позволяет решить несколько насущных проблем, таких как продолжительность поисковой сессии с постоянным подбором новых ключевых слов для поиска, сравнение всех документов уже содержащихся в информационной базе предприятия на предмет дублей и т.д. Практика показывает, что комбинирование обычного фразового поиска и поиска «похожих документов» позволяет с успехом и гораздо большей выгодой применять ПО для полнотекстового поиска в различных областях, от DMS до ERP и PDM.
Во-вторых, скорость работы поискового ПО СофтИнформ. Это критичный показатель для крупных предприятий. И тут скорости индексации и поиска (запатентованный алгоритм) более чем подходят для постоянно растущих потребностей корпоративного сектора. На данный момент версия SearchInform 2.0 индексирует данные со скоростью от 20 до 30 Гб/час на среднем офисном компьютере, что же касается использования мощных серверов, то в данном случае скорость возрастает на порядок. Притом, поддержка масштабирования дает возможность гибко варьировать мощность обрабатывающего информацию кластера серверов (если требуется).

Характерная конкретика
В принципе, без особого пафоса можно сказать, что на данный момент ПО на основе SoftInform Search Technology – одно из наиболее функциональных и быстрых по сравнению с аналогичными разработками решений. По крайней мере от отечественных производителей.

Краткие характеристики ПО на основе SoftInform Search Technology:
– Размер создаваемого индекса 20-25% от размера чистой текстовой информации

– Поддержка более 50 распространенных форматов файлов (включая архивы, PDF, MHT, CHM, MDB и т.д.).

– Индексирование и поиск информации в электронных сообщениях MS Outlook, Outlook Express и TheBat!, а также в логах программ мгновенного обмена сообщениями ICQ 99-2005, MS Messenger и Trillian)

– Клиент-серверная архитектура

– Разграничение прав доступа пользователей (как внутреннее в рамках системы, так и основанное на наследовании NTFS аутентификации Windows)

– Трехуровневое управление доступом пользователей к информации (к индексу, к источникам данных, к проиндексированным файлам)

– Индексирование информации в локальной сети предприятия, создание и использование сетевых индексов

– Концепция различных источников данных

– Гибкое внедрение в существующие информационные системы

– Сокращение времени на поиск документов и решение различного рода проблем поиска на предприятии

– Обеспечение информационной безопасности предприятия

– Языконезависимость

Плюс ко всему организация ядра технологии позволяет адаптировать SoftInform Search Technology (при внесении минимальных корректировок) под любую базу данных или информационную систему, благодаря концепции источников данных. Причем, источники данных, доступные для индексации нашей программой могут быть различны и могут находиться в разных местах. Это подтверждается как раз использованием моделей полнотекстового поиска от СофтИнформ уже в нескольких информационных системах, о которых говорилось выше.

Поделиться в соц. сетях

mailru Поиск: статья "Снова о корпоративном поиске"
facebook Поиск: статья "Снова о корпоративном поиске"
odnoklassniki Поиск: статья "Снова о корпоративном поиске"
livejournal Поиск: статья "Снова о корпоративном поиске"
googlebuzz Поиск: статья "Снова о корпоративном поиске"

Также рекомендуем:

  1. Яндекс расскажет о возможностях бизнеса в интернете Специалисты компании «Яндекс» разрабатывают не только новые опции для своей поисковой системы, но и программы бизнес-мероприятий.. Одна из таких программ сейчас проходит совершенно бесплатно. Основной целью проводимой программы является передача объективной информации представителям бизнеса о широких возможностях для развития их компаний, которые открывает перед ними всемирная паутина в целом и отдельные инструменты и сервисы поисковой [...]...
  2. Реферат каждого студента вузов Петербурга проверят на плагиа В России будет разработана информационная база по рефератам, представленным в Интернете, которая позволит каждому преподавателю проверить студента на добросовестность. Как сообщил Председатель Совета ректоров ВУЗов Санкт-Петербурга Владимир Васильев, уже в начале следующего года каждый преподаватель любого российского ВУЗа сможет оперативно проверить, самостоятельно ли написал студент научную работу или же попросту скачал ее в Интернете. . [...]...
  3. Отказ в обслуживании в Microsoft Internet Explorer Программа: Microsoft Internet Explorer 6.x Опасность: Средняя Наличие эксплоита: Да . Описание: Уязвимость позволяет удаленному пользователю вызвать отказ в обслуживании. Уязвимость существует в библиотеке mshtml.dll при обработке тега OBJECT. Удаленный пользователь может с помощью специально сформированной Web страницы вызвать отказ в обслуживании браузера. Примеры: http://lcamtuf.coredump.cx/iedie2-1.htmlhttp://lcamtuf.coredump.cx/iedie2-2.htmlhttp://lcamtuf.coredump.cx/iedie2-3.htmlhttp://lcamtuf.coredump.cx/iedie2-4.html URL производителя: www.microsoft.com Решение: Способов устранения уязвимости не существует в [...]...
  4. Opera выбрала Google в качестве партнера Opera выбрала Google в качестве поисковой системы по умолчанию для своих мобильных браузеров. Как передает Reuters, сейчас у Opera два мобильных браузера — Opera Mobile и Opera Mini. . Контракт заключен на 1 год. На этот срок поисковая система Google станет важной частью интерфейса этих браузеров. Как сообщается, несмотря на то, что Opera является весьма слабым конкурентом для Internet [...]...
  5. Очевидно, что россияне не готовы платить за услуги в «Одноклассниках» и «В Контакте» Негативное отношение к введению платных процедур регистрации в социальных сетях высказывают 82% Интернет пользователей из России. Если представители старшего поколения сдержаны в своих оценках, то молодое поколение, выступая против оплаты услуг в «Одноклассниках» и «В контакте» своих эмоций не сдерживает и более категорично. . По результатам опроса, проведенного «Ромир», введенная в социальных сетях платная регистрация [...]...
  6. Три миллиона зрителей отдали предпочтение Opera Turbo С момента анонсирования браузера Opera 10 прошел месяц. За это время технология Opera Turbo использовалась примерно 3 млн. пользователей Интернет во всем мире. Ими было загружено порядка 668 млн. оптимизированных к просмотру веб-страниц с использованием Интернет каналов низкой скорости.. Используя настольный компьютер, к услугам браузера Opera прибегают более 40 млн. человек. Достигнутый уровень популярности Opera [...]...
  7. Яндекс выпускает собственную сборку браузера Chrome По данным Liveinternet, компании Яндекс принадлежит почти 60% рынка поиска. И Яндекс выпустил свой собственный браузер. Он основан на исходниках с открытым кодом проекта Chromium.. На сегодняшний день Chrome Yandex Edition основывается на 4 ветке кодов браузера Chrome. Интеграция в браузер, сервисов Яндекса, вполне типична, как и для всех подобных случаев. Поисковая система Google заменена [...]...
  8. Комментарии Яндекса по поводу «Обнинска» Яндекс кратко комментирует новый поисковый алгоритм.. Как было видно из анонса, улучшение коснулось ранжирования страниц по гео-независимым запросам. Однако, по мнению многих оптимизаторов, наибольшие изменения произошли именно в региональной выдаче. Почему? Комментарий Яндекса: изменения в выдаче для конкретных сайтов происходят регулярно и далеко не всегда связаны с версиями алгоритма. На порядок ранжирования оказывают влияние множество [...]...
  9. MySpace подружился с Facebook 18 ноября в блоге о социальных медиа Mashable.com появилось сообщение о том, что в связи изменением концепции сайт MySpace претерпел существенные изменения в дизайне.. Пользователи MySpace получили дополнительный бонус, который выразился в возможности осуществлять импорт из своего профиля в социальной сети Facebook «интересы» и информацию о понравившейся музыке и фильмах. Такая возможность стала доступной пользователям [...]...
  10. Google AdSense расширил способы вывода средств С сегодняшнего дня российские пользователи сервиса Google AdSense, зарегистрированные как физические лица, получили возможность выводить заработанное вознаграждение на банковский счет или электронный кошелек. Напомним, что ранее для вывода вознаграждения можно было воспользоваться только почтовым переводом.. Для того чтобы получить возможность выводить вознаграждение от AdSense на свой банковский счет или электронный кошелек, пользователю нужно будет зарегистрироваться [...]...
  11. MySpace планирует догнать Facebook По сообщению Reuters известная социальная сеть MySpace решила увеличить количество своих пользователей в несколько раз, доведя их количество до 200-300 миллионов человек. В самом ближайшем времени руководство MySpace решило начать модернизировать свою социальную сеть по частям. . Администрация решила существенно сократить отставание от самой популярной во всем мире социальной сети Facebook, число пользователей которой, на [...]...
  12. Еще одна уязвимость в Microsoft IE На днях компания Microsoft сообщила, что в популярном браузере Internet Explorer обнаружилась новая открытая уязвимость. Эта проблема приводит к утечке информации, если на компьютере пользователя установлена операционная система Windows XP, а так же отключен защищенный режим в Internet Explorer. Суть этой уязвимости в том, что она открывает доступ к любому файлу на компьютере пользователя. . [...]...
  13. Twitter и Yahoo! будут сотрудничать Компания Yahoo! и всемирно популярный Twitter договорились о совместном сотрудничестве. По условиям договора, микрозаписи в Twitter будут интегрированы в Yahoo! и будут присутствовать в поисковой выдаче. В течение текущего года сервис микроблогов будет интегрироваться в Yahoo! Mail, News, Sports и Finance.. Это позволит пользователям Yahoo! напрямую следить за записями своих друзей в Twitter. Но и [...]...
  14. Проекту исполнилось 6 лет! Сегодня нашему любимому проекту исполнилось – 6 лет!. 6 лет он радует вас полезной информацией, не давая потеряться в дебрях сайтостроения, 6 лет помогает вставать на ноги начинающим вебмастерам и еще столько же прослужит вам верой и правдой в нашем нелегком деле=) P.S. В связи с этим на блоге запущен небольшой миниконкурс....
  15. Завершился XIII конкурс методических разработок и студенческих работ на Exponenta.ru Образовательный математический сайт Exponenta.ru подвел итоги тринадцатого конкурса методических разработок и студенческих работ. Конкурс является ежегодным и проводится более 6 лет. В этом году жюри приняло на конкурс 28 работ преподавателей и студентов со всех уголков страны. . Победителем конкурса методических разработок стала Матвеева Татьяна Анатольевна из Уральского государственного технического университета. Учебник называется «У истоков [...]...

Комментарии запрещены.