iNFOMAN вестник компьютерной Башкирии


Поиск в интернете: несколько правил и никакого нюха
Азат Наильевич, iNFOMAN
10/10/2008

_________________________________________________________________________________________
Не подскажете, что такое саспенс, точка схода и репрезентативность? Предлагаете посмотреть в интернете? Пожалуй, да! Вы правы: там-то точно есть! И в самом деле, интернет все увереннее становится нашим лексиконом, толковым словарем, советчиком, помощником, проводником – короче говоря, мозгом! Но в нем, как в прочем и в памяти, сначала все необходимое нужно найти. Казалось бы, проще простого: поисковик – слово – результат, но вот чуточку бы эффективнее, без тысяч ненужных ссылок и было бы совсем сказочно! Нет, не сказочно. Просто, как и любым инструментом, поисковиком нужно научиться пользоваться.

С чего начать?

Поисковые системы давно появились под рукой у нуждающихся пользователей интернетом. Яндекс, Рамблер, Google, Yahoo, Aport и даже Mail.ru предоставляют нам возможности проникать в нужные точки сетевого пространства, и оттого пользуются неслыханным спросом. Но с чего начать поиск? Скажем, вы ищете видеокамеру с ручным фокусом некоторой компании Vi-eye и, разумеется, в Уфе.

В прайс-листах любой компании видеокамера будет называться именно видеокамерой и никак иначе. Компании тоже, как правило, пишутся. А вот ручной фокус указывается, разве что, в характеристиках. Поэтому запрос с таким пояснением может ничего и не выдать. Уфа это город, в котором вы ищете компанию поставляющую товар, а адрес указан на сайте наверняка. Итак, в распоряжении три ключевых слова – видеокамера, Vi-eye и Уфа.

Можно, конечно, ввести их в строку поиска и нажать кнопку начала, но результат будет малоэффективным, ведь система выдаст все сайты, в которых встречается хотя бы одно из указанных слов. Помимо этого, обычно в начало выносятся сайты с максимальным количеством совпадающих слов. То есть, при определенных условиях вперед может попасть страница с 25 словосочетаниями 'Видеокамера' и 10 словосочетаниями 'Vi-eye', а страница, содержащая все слова запроса, может оказаться в середине списка из 15000 страниц и у Вас не хватит терпения до нее дойти. Да и в таком гигантском списке Вам все равно не выбрать все подходящие сайты - результат поиска придется сужать.

Обзор интернет-прессы (aрхив)

Коротко о синтаксисе

Улучшить процесс можно, используя синтаксис. Синтаксис у разных поисковых систем немного отличается, но ненамного.

1. Поисковая система равнодушна к регистру текста запроса, до тех пор, пока Вы не поставите первую букву заглавной. Например, на запрос 'смех' Вы получите список всех страниц, которые содержат слова с указанным сочетанием букв в любом регистре (например: 'Смех', 'Смехотворный', 'смехач'), а на запрос 'Смех' получите страницы, слова на которых начинаются с буквенного сочетания 'Смех' (например: 'Смехотворный').

2. Если запрос поставить в двойные кавычки, то поисковая система будет искать указанное словосочетание или только те страницы, где присутствуют все указанные в кавычках слова, а не хотя бы одно из указанных, как по умолчанию. Причем обычно находится только точное совпадение (без описанного выше лексического разбора).

3. В запросах можно использовать круглые скобки и булеву логику (OR, AND, NOT или соответственно символы '|',' &', '!'), например: ((Уфа OR Москва) NOT Челябинск) - найдет все страницы с содержанием слов 'Уфа' или 'Москва', но не содержащих слово 'Челябинск'.

4. Можно использовать специальные символы '*' и '?' для замены части слова или буквы в слове соответственно (как в MS-DOS).

У нас получится такой запрос:

видеокамера AND vi-eye AND Уфа.

Название компании написано с маленькой буквы, потому что в некоторых прайс-листах они указываются в верхнем регистре, например, VI-EYE.

Если и на этот раз количество результатов оказалось чересчур великим, то усложняйте запрос возможными ключевыми словами, в нашем случае можно добавить 'компактная'.

Если вдруг ни одной страницы не найдено, тогда можно попробовать перефразировать запрос, проверить орфографию в запросе, расширить условия поиска или воспользоваться другой поисковой системой, ведь возможно, что не все страницы нужного вам сайта проиндексированы, и поиск на них невозможен.

Что такое индексирование?

Для поиска доступны только страницы, которые были специально добавлены или же найдены по ссылкам с уже известных поисковой системе страниц. Все найденные страницы обрабатываются специальной программой, которую обычно называют роботом. Этот робот индексирует страницу, то есть создает ее некий уникальный образ, который обычно содержит такие параметры страницы как адрес страницы, слова, название страницы, дата последней обработки страницы роботом, тэги и верхнюю часть страницы (ее фрагмент).

Отсюда следует, что не все страницы в Интернете могут быть найдены и тем более проиндексированы. Так как алгоритмы поиска новых страниц и индексации у разных поисковиков отличается, то поиск в разных системах даст разный результат. Страницы, добавленные недавно, а также изменения, внесенные в них, могут быть некоторое время недоступны. Индексация страниц проходит с различными интервалами - от одного дня до месяца и более. Интервал индексации зависит от количества страниц на сайте, настроек страниц, местоположения на сайте и от самой поисковой системы.

Вывод

Хотя поиск в интернете и кажется совершенно простой задачей, на это может понадобиться уйма времени. А зависит все от вашего «поискового умения» выбрать систему, правильные ключевые слова и составить запрос. Добавлю, что иногда проще, например, купить книгу в магазине, чем тратить время и деньги (в частности тем, кто пользуется не безлимитным соединением) на утомительные поиски.

В дополнение предлагаю взглянуть на особенности синтаксиса Яндекса, как одной из самых используемых поисковых систем:

Cинтаксис языка запросов (строгий поиск)
Синтаксис
Что означает оператор
Пример запроса
пробел или &логическое И (в пределах предложения)лечебная физкультура
&&логическое И (в пределах документа)рецепты && (плавленный сыр)
|логическое ИЛИфото | фотография | снимок | фотоизображение
( )группирование слов(технология | изготовление) (сыра | творога)
~бинарный оператор И НЕ (в пределах предложения)банки ~ закон
~~бинарный оператор И НЕ (в пределах документа)путеводитель по парижу ~~ (агентство | тур)
/(n m)расстояние в словах (-назад +вперед)поставщики /2 кофе
музыкальное /(-2 4) образование
вакансии ~ /+1 студентов
" "поиск фразы"красная шапочка"
(эквивалентно красная /+1 шапочка)
&&/(n m)расстояние в предложениях (-назад +вперед)банк && /1 налоги

Поиск в элементах
Синтаксис
Что означает оператор
Пример запроса
$title (выражение)поиск в заголовке$title (CompTek)
$anchor (выражение)поиск в тексте ссылок$anchor (CompTek | Dialogic)
#keywords=(выражение)поиск в ключевых словах#keywords=(поисковая система)
#abstract=(выражение)поиск в описании#abstract=(искалка | поиск)
#image="значение"поиск файла изображения#image="tort*"
#hint=(выражение)поиск в подписях к изображениям#hint=(lenin | ленин)
#url="значение"поиск на заданном сайте (странице)#url="www.comptek.ru*"
#link="значение"поиск ссылок на заданный URL#link="www.yandex.ru*"


При подготовке статьи были использованы материалы с сайтов www.burusov.ru , а также www.yandex.ru.

Обсудить в ФОРУМЕ


Подпишитесь на рассылку анонсов статей.
Для этого укажите Ваш адрес электронной почты:

ГОРОБЗОР.РУ - Уфимский позитив-портал

Читайте также
ФИШИНГ: Ловись рыбка большая и маленькая

Зачем вирусы? Зачем руткиты? Когда пользователь сам может прийти и оставить всю нужную информацию: имена пользователей, пароли, номера кредитных карт и т.д. Как рыбка на крючок! А называется все это фишинг.

Далее...

Интернет. Работа. Аферисты.

Все мы студенты и не студенты ищем нетрудную работу или правильнее подработку. Свободный график, небольшая, но подходящая зарплата и не слишком отнимающая работенка – то, что нам нужно! А где мы ее ищем? Конечно, в интернете. Но помимо вирусов, руткитов, взломщиков и прочего, в интернете притаились и мошенники. Далее...

Hewlett-Packard – уфимскому офису 3 года

В Уфе прошла конференция «HP Ideas Day», на которой руководство HP подвело итоги трехлетней работы башкирского офиса компании и поделилось планами на будущее. Далее...

Интернет-маркетинг или поиск клиентов в интернете

С развитием интернета пользователи все больше времени проводят в сети. Почти все пользуются электронной почтой, узнают прогноз погоды. Многие ищут одноклассников, читают новости, общаются на профессиональных форумах и даже совершают покупки. Интернет становится перспективным направлением для развития бизнеса, средством коммуникации с целевой аудиторией и клиентами. С чего начать освоение просторов интернета? Далее...



Single copy template must have a unique master template name, and the file name must end in '.nt*'.

Copyright © 2001-2007 Вестник компьютерной Башкирии «iNFOMAN»
Перепечатка материалов сайта возможна только с согласия редакции.
Разработка и поддержка ГК "Фрейм"