Вышел новый Яндекс.Сервер
Вышел новый Яндекс.Сервер - продукт для организации поиска по сайту или в корпоративной сети, использующей технологии большого поиска Яндекса. В новой версии особое внимание мы уделили качеству поиска, добавив новые возможности по управлению ранжированием.
Теперь можно перемещать найденные документы на первую или последнюю позицию выдачи, указав запросы и ссылки на документ, который необходимо сделать первым или последним. Зачем это нужно Корпоративные сайты, например, могут по запросу имени сотрудника поставить на первое место страницу с его биографией. А интернет-магазины могут по запросу с упоминанием товара как главную указать карту этого товара.
В новой версии Яндекс.Сервера реализовано ссылочное ранжирование, учитывающий ссылка на документ при расчете его релевантности. А также расширился список поддерживаемых документов MS Office 2007, Open Office и PDF-файлы версии 1.7.
Яндекс.Сервер
Яндекс.Сервер - это продукт для корпоративного поиска (Enterprise Search) и или поиска по сайту, который обеспечивает полнотекстовый поиск информации с учетом морфологии русского языка на вашем веб-сервере или в корпоративной сети.
Как бы хорошо вы не продумали структуру вашего сайта или файлов и папок в корпоративной сети вашей компании, наличие удобного поиска просто необходима. Если ваш сервер или корпоративная сеть постоянно растут, то посетителям сайта или сотрудникам компании становится все сложнее находить нужную информацию. Быстрый и простой поиск Яндекс.Сервером - это решение проблемы.
Одна установка Яндекс.Сервера позволяет индексировать и находить нужную информацию сразу на нескольких сайтах, причем не обязательно расположенных физически на той же машине, что и Яндекс.Сервер. Кроме того, Яндекс.Сервер можно использовать в корпоративных сетях - он умеет индексировать данные непосредственно с жесткого диска и доступных сетевых ресурсов.
Вы можете настроить Яндекс.Сервер с поправкой на конкретные условия работы вашего сервера - указать, какие директории индексировать, а какие исключить, выбрать кодировку русского языка, указать или перестраивать весь индекс при новом индексировании или организовать обновление и слияние, запускать индексацию по расписанию.
Поиск работает с учетом морфологии русского, английского и украинского языков - так же, как работает поиск Яндекс по Интернету. Например, если задан запрос «идти», то в результате поиска будут найдены ссылки на документы, содержащие слова «идти», «идет», «шел», «шла» и т. д.
Результатом поиска является список документов, упорядоченных по признаку релевантности. Релевантность учитывает не только количество найденных документов, но и контрастность слов (частота их употребления) и расстояние между словами. Внутри документа и на странице с результатами поиска слова, участвующих в запросе, подсвечиваются. Поисковая форма и страница результатов могут иметь произвольный дизайн.
Технологически Яндекс.Сервер представляет собой специализированный HTTP-сервер, работающий на отдельном порту. Соответственно, обратиться к нему и получить результаты поиска можно с любого места сети. Все настройки выполняются через текстовый конфигурационный файл. Существуют версии программы для различных операционных систем. В среде Unix Яндекс.Сервер работает как демон, а на платформе MS Windows - как сервис.
Список возможностей
- Базовые алгоритмы индексирования и поиска идентичны используемым на www.yandex.ru.
- Учет морфологии русского, английского и украинского языков (работа со словоформами, неологизмами, именами, словосочетаниями).
- Поиск в текстах на любых языках с кириллицей и латинским алфавитом с учетом диакритика.
- Язык запросов идентична той, что используется на www.yandex.ru, включая полную поддержку логических операторов, поиск с расстоянием, поиск в зонах и атрибутах документа.
- Ранжирования найденных документов по степени соответствия запросу или по дате.
- Неограниченный размер и количество документов, которые индексируются.
- Индексация чтением локальной файловой системы (в т.ч. сетевых ресурсов) и по HTTP (включая поддержку proxy).
- Индексирования без остановки поискового сервиса.
- Гибкая настройка индексатора, поддержка robots.txt и стоп-слов.
- Подсветка найденных слов на странице с результатами поиска и в самом найденном документе.
- Встроенный дизайн результатов поиска, аналогичный yandex.ru.
- Представление результатов поиска в формате XML (возможность произвольно оформить страницу результатов поиска).
- Неограниченное число зон индексирования в рамках коллекции документов.
- Структурирование результатов поиска по категориям найденных документов.
- Неограниченное число независимых коллекций документов, обслуживаемых отдельными процессами индексации и поиска.