Сделай Сам Свою Работу на 5

Специализированные поисковые системы





Специализированные поисковые системы позволяют искать информацию в других информационных слоях Интернета: серверах архивов, почтовых серверах и так далее.

Как отличаются поисковики общего назначения от специализированных? Если у первых, процесс выполнения запроса происходит по всей общей базе данных, то вторые проводят обработку в сугубо тематических архивах.

В итоге, вместо конечного результата, содержащего огромное количество слабо релевантных ссылок, зачастую довольно поверхностно соответствующих поисковому запросу, обработанный вариант в специализированной системе принесёт гораздо более правильную выдачу.

Если, к примеру, вы ищете какую либо электронную книгу, то обще поисковая система вам выдаст все ссылки подряд, где встречаются упоминания названия данной книги и связанной с ней информации. Специализированный поисковик станет выполнять обработку поискового запроса исключительно по содержимому электронных библиотек, что приведёт в итоге к наилучшему конечному результату.

Для поиска медицинской информации в Интернете служат специализированные медицинские поисковые системы. Они во многом ускоряет поиск и повышает его эффективность. Но русскоязычные специализированные медицинские поисковые системы только начинают развиваться. Достаточно полных каталогов пока не существует. Каждая система поддерживает ссылки на ограниченный круг ресурсов.



Некоторые адреса медицинских поисковых систем:

– www.rusmedserv.com – Русский медицинский сервер;

– www.mr.ru – Московский медицинский рынок;

– www.medlinks.ru – MedLinks – вся медицина в Интернет;

– www.mednavigator.ru – МЕДНАВИГАТОР - новая поисковая система с каталогом медицинских ресурсов;

– medagent.ru – Медицинский агент – каталог медицинских сайтов;

– www.rusmedserv.ru – RusMedServ - это специализированный портал, тематикой которого является медицина и косметология;

– med-doc.info – MED-DOC – портал для врачей, студентов, пациентов;

– www.it-medical.ru – IT-MEDICAL – научный медицинский интернет-проект, большое количество литературы на русском языке для специалистов;

– www.medclub.ru – Медклуб – специальная медицинская система, содержит массу медицинской информации для специалистов и их пациентов. Позволяет загрузить приложение Medclub, которое поможет определить, о каких заболеваниях говорят имеющиеся у вас симптомы и расскажет о болезнях;



– www.medscape.com – Medscape;

– www.medexplorer.com - MedExplorer - бесплатная медицинская поисковая система для врачей, больных и членов их семей.

1.2.1 Поиск файлов

Для поиска файлов на серверах файловых архивов существуют специализированные поисковые системы двух типов: – поисковые системы на основе использования баз данных – каталоги файлов. Для поиска файла нужно ввести имя файла в поле поиска и поисковая система выдаст адреса мест хранения данного файла. В базе данных российской файловой системы www.filesearch.ru содержатся сведения о 6 миллионах файлов, размещённых на двух тысячах серверов файловых архивов российской части Интернета.

1.2.2 Поиск адресов электронной почты

Специализированные поисковые системы позволяют искать адрес электронной почты по имени человека или, наоборот, имя человека, хозяина определённого адреса электронной почты. Пример такой системы: www.whowhere.com.

 

Технология поиска. Язык запросов поискового сервера.

Поисковые системы (серверы)

Поисковая система – программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в Интернете. Под поисковой системой обычно подразумевается сайт, на котором размещён интерфейс системы. Программной частью поисковой системы является поисковая машина (поисковый движок) — комплекс программ, обеспечивающий функциональность поисковой системы и обычно являющийся коммерческой тайной компании-разработчика поисковой системы.



Принципы работы поисковых систем

Работа над запросом конкретного пользователя (а заодно и над всеми другими возможными запросами) началась задолго до его введения. Специальная программа, называемая «пауком», просматривает содержимое веб-сайтов.

Ее задачи чем-то схожи с задачами обычного веб-браузера, только вместо того, чтобы показывать страницы на экране, «паук» передает их содержимое другой программе – «путешествующему пауку». Задача «путешествующего паука» – вычленение из загруженной страницы ссылок на другие сайты, по которым снова направляется «паук». Цикл этот повторяется многократно, точнее непрерывно.

На этом работа не заканчивается. За дело принимается программа-индексатор, которая, используя определенные правила, анализирует полученные «пауками» страницы и формирует сложную базу данных поискового сервера. Вот эта самая база данных потом и выдает результаты поиска, которые появляются после обработки введенного запроса. На принципах работы индексатора остановимся поподробнее, так как именно от него зависит то, что войдет в результаты поиска.

В основе работы большинства современных поисковиков лежит индекс цитирования, который вычисляется индексатором в результате анализа ссылок на текущую страницу с других страниц Интернета. Чем их больше, тем выше индекс цитирования анализируемой страницы и тем выше эта страница будет отображена в результатах поиска. Кроме того, учитывается индекс цитирования страниц, которые ссылаются на страницу, изучаемую индексатором.

Кроме индекса цитирования учитываются также следующие параметры:

- наличие искомых слов в заголовке страницы или названии сайта;

- частота повторений искомых слов на странице;

- размер шрифта, которым на странице написаны слова из поискового запроса, а также выделение этих слов шрифтами и стилями;

- тематика ссылающихся сайтов и некоторые другие.

После ввода запроса пользователем за дело берется последнее звено поискового сервера – система выдачи результатов. В итоге анализа и сопоставления упомянутых выше показателей эта система определяет степень соответствия содержимого страницы условиям запроса. Чем эта степень больше, тем выше страница будет представлена в списке найденных ресурсов.

Возвращаясь к вопросу о скорости обработки запроса, отмечу, что такая высокая скорость обеспечивается за счет того, что страницы Интернета проиндексированы заранее, а результаты поиска составляются на основе информации из базы данных поискового сервера.

Такой способ, как несложно догадаться, имеет очевидный недостаток, заключающийся в том, что содержимое веб-страниц может со временем изменяться, а «паук» не будет успевать найти их и обработать, следовательно, результаты поиска будут неточными. Еще раз, упомянув о времени, необходимом поисковому серверу для просмотра и индексации всего Интернета, скажу, что на это у разных поисковиков уходит от нескольких суток до нескольких недель в зависимости от алгоритма обработки информации. Так что сайты, появившиеся в Сети недавно, в результатах поиска представлены не будут.

Разработчики поисковых серверов борются с этим разными способами и с переменным успехом. Например, большинство современных поисковиков предоставляет такой сервис, как поиск по новостным лентам, обновляющимся каждые несколько минут, и поэтому они чаще индексируются поисковиками. Как бы там ни было, лучшего способа, чем предварительная индексация страниц, сегодня не существует.

 

Поисковые инструменты

Web-технология World Wide Web (WWW) считается специальной технологией подготовки и размещения документов в сети Интернет. В состав WWW входят и web-страницы, и электронные библиотеки, каталоги, и даже виртуальные музеи! При таком обилии информации остро встает вопрос: «Как сориентироваться в столь огромном и масштабном информационном пространстве?»

В решении данной проблемы на помощь приходят поисковые инструменты.

Поисковые инструменты – это особое программное обеспечение, основная цель которого – обеспечить наиболее оптимальный и качественный поиск информации для пользователей Интернета.

Поисковые инструменты размещаются на специальных веб-серверах, каждый из которых выполняет определенную функцию:

1. Анализ веб-страниц и занесение результатов анализа на тот или иной уровень базы данных поискового сервера.

2. Поиск информации по запросу пользователя.

3. Обеспечение удобного интерфейса для поиска информации и просмотра результата поиска пользователем.

Приемы работы, используемые при работе с теми или другими поисковыми инструментами, практически одинаковы. Перед тем как перейти к их обсуждению, рассмотрим следующие понятия:

1. Интерфейс поискового инструмента представлен в виде страницы с гиперссылками, строкой подачи запроса (строкой поиска) и инструментами активизации запроса.

2. Индекс поисковой системы – это информационная база, содержащая результат анализа веб-страниц, составленная по определенным правилам.

3. Запрос – это ключевое слово или фраза, которую вводит пользователь в строку поиска. Для формирования различных запросов используются специальные символы («», |, !, ~), математические символы (*, +, ?)…

Одном из видов поисковых инструментов являются подборки ссылок

Подборки ссылок – это отсортированные по темам ссылки. Они достаточно сильно отличаются друг от друга по наполнению, поэтому чтобы найти подборку, наиболее полно отвечающую Вашим интересам, необходимо ходить по ним самостоятельно, дабы составить собственное мнение.

В качестве примера приведем подборку ссылок «Сокровища Интернет» АО «Релком» http://old.relcom.ru/Internet/Treasures/.

http://old.relcom.ru/Internet/Treasures/Health/ - страница Здоровье и медицина (Без наркотиков, Русский медицинский сервер, Электронная аптека, Продукция производителей медикаментов и медицинского оборудования, Интернет-центр «Медицина», Медицинская библиотека и др.)

Преимуществом такого вида поисковых инструментов является их целенаправленность, обычно подборка включает в себя редкие интернет ресурсы, подобранные конкретным веб-мастером или хозяином интернет странички.

Для того чтобы облегчить поиск документов были созданы каталоги веб-серверов и поисковые машины. В большинстве случаев каталог представляет собой тематические подборки ссылок на веб-ресурсы (медицина, политика, программирование и т. д.). Поисковые же машины позволяют попасть на страничку, текст которой содержит заданный набор слов. Каждая поисковая машина обладает своими специфическими возможностями, достоинствами и недостатками. Следует отметить, что наполнение сети Интернет русскоязычной информацией, хотя и происходит быстрыми темпами, все еще значительно отстает от уровня англоязычной информацией. Английский язык продолжает оставаться основным языком общения пользователей Интернет.

В последнее время поисковые каталоги общего назначения и индексирующие поисковые сервера интенсивно интегрируются. Yahoo уже не только каталог, но и поисковый сервер. AltaVista, как и многие другие поисковые сервера, исходно предлагавшие исключительно поиск по базе данных, сегодня включает в выдачу результатов поискового запроса еще и список рубрик, соответствующих теме запроса. Поисковые технологии не стоят на месте.

 








Не нашли, что искали? Воспользуйтесь поиском по сайту:



©2015 - 2024 stydopedia.ru Все материалы защищены законодательством РФ.