Как найти что ищешь в интернете. Как правильно искать информацию в Интернете

Логотипы крупнейших поисковых систем

Каждый день мы ищем различную информацию в сети Интернет, будь-то описание нашего любимого фильма или доклад видного ученого. Мы давно привыкли к дизайну главных страниц крупнейших поисковиков — Google и Яндексу и посещаем их по десятков раз в день.

А часто ли Вы задумывались над правилами поиска информации ? Я думаю не часто (сам сильно об этом не задумывался), но заметил что порой поиск нужной мне информации занимает довольно длительное время. В этой заметке я постараюсь рассказать о способах сокращения времени поиска и повышения его результативности.

Правила поиска информации в поисковых системах

Как уменьшить время на поиск и улучшить его результаты, общие рекомендации:

  • Запросы должны быть простыми. Если вы ищете какое-то предприятие, просто введите его название или хотя бы ту часть названия, которую вы помните наверняка. Если вы ищете конкретное понятие, место или продукт, начните с его названия или имени. Если вы ищете пиццерию, просто введите слово «пиццерия» и название своего города или почтовый индекс. Для большинства запросов вовсе не нужны редкие операторы или изощренный синтаксис. Чем проще, тем лучше.
  • Подумайте, какие слова присутствуют на странице, которую вы ищете. Поисковая система не человек. Это программа, которая сравнивает слова, которые вы вводите, и слова, которые имеются на веб-страницах. Используйте слова, которые с наибольшей вероятностью могут присутствовать на искомой странице. Например, вместо [ у меня болит голова ] введите [ головная боль ] , потому что именно этот термин будет использоваться на странице, посвященной медицине. Запрос [ в какой стране летучие мыши считаются хорошей приметой? ] понятен человеку, но в документе, содержащем ответ, может не быть этих слов. Введите лучше [ летучие мыши считаются хорошей приметой в ] или даже [ летучие мыши хорошая примета ] , поскольку эти слова скорее всего присутствуют на нужной странице.
  • Опишите, что вам нужно, используя как можно меньше слов. Каждое слово в запросе служит для сужения и уточнения области поиска. Поскольку используются все слова, каждое дополнительное слово ограничивает круг результатов. Если ввести слишком много ограничений, можно пропустить полезную информацию. Начните поиск с нескольких ключевых слов. Даже если вы не нашли то, что нужно, просмотрите найденные результаты, и вы поймете, какие дополнительные слова нужно включить в следующий запрос, чтобы получить более релевантные результаты. Например, простой запрос [ погода минск ] даст лучшие результаты, чем более длинный запрос [ прогноз погоды для минска беларусь ] .
  • Подбирайте более информативные слова. Чем более информативное слово используется, тем больше вероятность, что результаты будут релевантными. Такие слова, как «документ», «веб-сайт», «компания» или «информация» обычно лишние. При этом следует помнить, что даже если вы используете правильное слово, но большинство людей редко им пользуется, это слово может не оказаться на нужной странице. Например, запрос [ популярные рингтоны ] более информативен и конкретен, чем [ популярные мелодии ] .

Разработчики поисковых систем разработали специальный язык поисковых запросов (язык своеобразных правил поиска информации), который позволяет облегчить и ускорить поиск информации в Интернете. Ниже я приведу примеры использования выражения этого «языка».

Какую поисковую систему использовать: Google или Яндекс?

Когда я был неопытен, для поиска я использовал только одну поисковую систему. Но опыт показал, что такой подход неэффективен, потому что у каждой поисковой системы свой уникальный запатентованный алгоритм поиска и, соответственно, свои плюсы и минусы. Куда важнее понять для каких типов поисковых запросов использовать тот или иной поисковик. Существует следующие типы поисковых запросов:

  • Навигационные запросы – это такие запросы целью которых является поиск определенного места в сети Интернет. Например, сайт фирмы или сайт недавно посещенного форума, поиск ссылки на блог и т.д.
  • Информационные запросы – такие запросы вводят, если хотят получить какие-то сведения или найти нужную информацию в Интернете. Например, поиск сведений об истории Древнего Рима или поиск результатов футбольного матча и т.д.
  • Транзакционные запросы – это вид запросов, которые вводят для того чтобы совершить какое-то действие в Интернете — транзакцию (купить, скачать, закачать, подписаться и т.п.)
  • Нечеткие запросы – это общие, конкретизированные запросы, которые, как правило, вводят неопытные пользователи. Напрмер, «мобильник», «музыка», «цветы» и т.д.

Особенности поисковой системы Google

Данный поисковик лучше использовать для навигационных запросов или поиска адреса сайта. Алгоритм этой поисковой машины особое внимание уделяет виду доменному имени и ссылке. Я несколько раз видел как при вводе нечеткого запроса в ТОП-10 выдачи присутствовали сайты, на которых вообще отсутствовал контент. Не стоит также забывать и о том, что Google — это международный поисковик, т.е. лучшее решение для поиска информации на иностранном языке.

Особенности поисковой системы Яндекс

Отечественный поисковик отлично подходит для поиска информации в Интернете по информационным запросам. Он очень хорошо индексирует Рунет, его алгоритм уже много раз подвергался доработке, к тому же он оптимизирован для поиска информации на русском языке. Примечательно что Яндекс тоже получил статус международного поисковика, произошло это 19 мая 2010 года ().

Язык поисковых запросов Яндекс`а

Пример Значение
« К нам на утренний рассол« Слова идут подряд в точной форме
« Прибыл * посол« Пропущено слово в цитате
полгорбушки & мосол Слова в пределах одного предложения
снаряжайся && добудь Слова в пределах одного документа
глухаря | куропатку | кого-нибудь Поиск любого из слов
не смогешь << винить Неранжирующее «и»: выражение после оператора не влияет на позицию документа в выдаче
я должон /2 казнить Расстояние в пределах двух слов в любую сторону (то есть между заданными словами может встречаться одно слово)
государственное дело &&/3 улавливаешь нить Расстояние в 3 предложения в любую сторону
нешто я ~~ пойму Исключение слова пойму из поиска
при моем /+2 уму Расстояние в пределах двух слов в прямом порядке
чай ~ лаптем Поиск предложения, где слово чай встречается без слова лаптем
щи /(-1 +2) хлебаю Расстояние от одного слова в обратном порядке до двух слов в прямом
! Соображаю ! что ! чему Слова в точной форме с заданным регистром
получается && (+ на | ! мне) Скобки формируют группы в сложных запросах
!! политика Словарная форма слова
title: (в стране) Поиск по заголовкам документов
url: ptici.narod.ru/ptici/kuropatka.htm Поиск по URL
беспременно inurl: vojne Поиск с учетом фрагмента URL
host: lib.ru Поиск по хосту
rhost: ru.lib.* Поиск по хосту в обратной записи
site: http://www.lib.ru/PXESY/FILATOW Поиск по всем поддоменам и страницам заданного сайта
mime: pdf Поиск по одному типу файлов
lang: en Поиск с ограничением по языку
domain: ru Поиск с ограничением по домену
date: 200712* Поиск с ограничением по дате
date: 20071215.. 20080101, date:> 20091231 Поиск с ограничением по интервалу дат
cat: 11000051 Поиск по рубрике Яндекс.Каталога

Язык поисковых запросов Google

ПРИМЕР ОПЕРАТОРА СОДЕРЖАНИЕ НАЙДЕННЫХ СТРАНИЦ
отпуск Гаваи два слова отпуск и Гаваи .
Мауи OR Гаваи либо слово Мауи или слово Гаваи
« Каждое слово« точная фраза каждое слово
вирус — компьютер слово вирус но НЕ слово компьютер
+ носок только слово носок , а не его множественные формы и синонымы
~ автомобильный кредит информация о кредите на автомобили с различными синонимами: грузовик , легковой автомобиль , и т.д.
define: компьютер определения слова компьютер в Интернете
красный * синий слова красный и синий разделенные несколькими словами.
Мне повезет! эта кнопка переведет вас на страницу первого найденного результата без показа всей выдачи
ОПЕРАТОРЫ КАЛЬКУЛЯТОРА ЗНАЧЕНИЕ ВВЕДИТЕ В ОКНО ПОИСКА
+ сложение 45 + 39
вычитание 45 – 39
* умножение 45 * 39
/ деление 45 / 39
% of процент от 45% of 39
^ степень числа 2^5 (2 в 5-той степени)
ДОПОЛНИТЕЛЬНЫЕ ОПЕРАТОРЫ ЗНАЧЕНИЕ ПОИСКОВЫЙ ЗАПРОС И ЕГО РЕЗУЛЬТАТЫ
site: Поиск только на одном сайте прием site:www.stanford.edu (Поиск информации о приеме на сайте Стенфордского университета)
[#] [#] Искать в диапазоне чисел DVD плеер $100..150 (Поиск DVD плеера от $100 до $150)
link: Ссылающиеся страницы link:www.stanford.edu (Найти страницы, ссылающиеся на сайт Стэнфордского университета)
info: Информация о странице info:www.stanford.edu (Получение информации о сайте Стэнфордского университета)
related: Похожие страницы related:www.stanford.edu (Найти сайты, похожие на сайт Стэнфордского университета)

Итоги

В этой статье мной были рассмотрены правила поиска информации , т.е. способы уменьшения времени, затрачиваемого на поиск различной информации в Интернете. Здесь не были рассмотрены абсолютно все поисковые машины, но, если следовать описанным выше правилам, можно сэкономить много своего личного времени. Итак, основные правила поиска информации в Интернете :

  1. Не вводите слишком длинные поисковые запросы — это сокращает область поиска и Вы можете пропустить важную информацию.
  2. Используйте информативные слова, старайтесь избегать общих фраз и мало употребляемых синонимов
  3. Используйте разные поисковые системы для различных видов поисковых запросов
  4. Применяйте специально разработанные

Вы заходите на сайт ПС, а затем вводите нужный Вам запрос в строку поиска. В результате чего получаете приблизительно такой список результатов (практически у всех всё одинаково, поэтому покажу Вам на примере Яндекса):

Результаты располагаются списком, который содержит следующие данные:

1 - Заголовок найденной страницы

2 - Найденные слова в тексте страницы

3 - Адрес сайта

Замечу тут то, что поисковики любят искомые слова "коверкать", т.е. они их преобразуют чтобы было более понятнее. Например существительное могут сделать прилагательным, а глагол наречием и т.д. Сделано это для того, чтобы улучшить поиск.
Некоторые поисковики ещё добавляют всякие иконки и дополнительные страницы на сайте. Это не особо важно и не меняет суть.

Теперь ближе к сути самой статьи.

Предположим, что Вам нужно найти как выращивать герань в саду . Обычно Вы пишите этот запрос напрямую в строку ПС и смотрите результаты:


Выводится список более менее подходящих по смыслу сайтов, которые содержат в себе эти слова. Но как Вы видите, здесь нету искомого и нужного нам содержимого. Поэтому для того, чтобы улучшить качество поиска, рекомендуется сделать следующие действия:
  • Уменьшить количество слов в запросе (например написать герань в саду )
  • Заменить некоторые слова на синонимы (например как сажать герань в саду )
  • Убрать "ненужные слова". Здесь подразумевается то, что нужно выделить ключевые слова в поиске и их оставить (например уход герань сад )

    Так же можете попробовать поискать в других ПС.

    Мало кто знает, но все ПС различают ещё специальные команды для работы.

    Чтобы было понятнее, воспользуюсь примером выше и возьму слова в ковычки "


    Заметили как изменилось всё? Вместо предыдущих 274 тысяч сайтов содержащих более менее похожие ответы, теперь нашлись только 2 (а если точнее, то один) содержащие точный ответ. Думаете чудеса? Нет. Просто мы указали ПС что нам не нужно разбирать наше словосочетание по синонимам и не нужно искать хоть какое-то совпадение слов. Мы ей явно указали что нам нужно точно такая именно фраза и ничего больше.

    И ковычки вовсе не единственный оператор, который можно использовать в ПС.

    Например можно написать url:сайт Windows и тогда поисковик Вам выдаст все страницы на сайте сайт , которые содержат в себе слово Windows .

    Я не буду отбирать хлеб у авторов и разработчиков ПС и не буду показывать, что только на этом сайте есть подробное описание и разбор этих операторов, как делают большинство администраторов сайтов, оставляя в неведении пользователей. Нет! Я дам Вам ссылки на официальные страницы Поисковых Систем, в которых подробно описаны какие используются операторы и как их нужно использовать чтобы Ваш запрос был наиболее удачным.

    А про другие ПС Вы можете узнать у них же. Или напишите в комментариях и я дам ссылку.

    Ну и напоследок хотелось бы добавить общеизвестную фразу: "Кто ищет - тот всегда найдёт".

  • 16.Поиск информации в интернете

    Информация, размещенная во Всемирной сети, исчисляется огромным количеством байт. Для поиска информации во Всемирной сети используются специальные веб-сайты – информационно-поисковые системы. Они позволяют по ключевым словам найти информационные ресурсы, связанные с ключевыми словами. Это может быть текст, содержащий ключевые слова, или графическое изображение одного из ключевых слов. Примерами информационно-поисковых систем являются системы Google и Yandex.

    Поиск информации – одна из самых востребованных на практике задач, которую приходится решать любому пользователю Интернета.

    Существуют три основных способа поиска информации в Интернет:

    1. Указание адреса страницы.

    3. Обращение к поисковой системе (поисковому серверу).

    Способ 1: Указание адреса страницы

    Это самый быстрый способ поиска, но его можно использовать только в том случае, если точно известен адрес документа или сайта, где расположен документ.

    Не стоит забывать возможность поиска по открытой в окне браузера web-странице (Правка-Найти на этой странице…).

    Это наименее удобный способ, так как с его помощью можно искать документы, только близкие по смыслу текущему документу.

    Способ 3: Обращение к поисковой системе

    Пользуясь гипертекстовыми ссылками, можно бесконечно долго путешествовать в информационном пространстве Сети, переходя от одной web-страницы к другой, но если учесть, что в мире созданы многие миллионы web-страниц, то найти на них нужную информацию таким способом вряд ли удастся.

    На помощь приходят специальные поисковые системы (ихеще называют поисковыми машинами). Адреса поисковых серверов хорошо известны всем, кто работает в Интернете. В настоящее время в русскоязычной части Интернет популярны следующие поисковые серверы:Яндекс (yandex.ru), Google (google.ru) и Rambler (rambler.ru

    Поисковая система - веб-сайт, предоставляющий возможность поиска информации в Интернете.

    Большинство поисковых систем ищут информацию на сайтах Всемирной паутины, но существуют также системы, способные искать файлы на ftp-серверах, товары в интернет-магазинах, а также информацию в группах новостей Usenet.

    По принципу действия поисковые системы делятся на два типа: поисковые каталоги и поисковые индексы.

    Поисковые каталоги служат для тематического поиска.

    Информация на этих серверах структурирована по темам и подтемам. Имея намерение осветить какую-то узкую тему, нетрудно найти список web-страниц, ей посвященных.

    Катало́г ресурсов в Интернете или каталог интернет-ресурсов или просто интернет-каталог - структурированный набор ссылок на сайты с кратким их описанием.

    Поисковые индексы работают как алфавитные указатели. Клиент задает слово или группу слов, характеризующих его область поиска, - и получает список ссылок на web-страницы, содержащие указанные термины.

    Первой поисковой системой для Всемирной паутины был «Wandex», уже не существующий индекс, разработанный Мэтью Грэйем из Массачусетского технологического института в 1993.

    Как работает поисковой индекс?

    Поисковые индексы автоматически, при помощи специальных программ(веб-пауков), сканируют страницы Интернета и индексируют их, то есть заносят в свою огромную базу данных.

    Поисковый робот («веб-паук») - программа, являющаяся составной частью поисковой системы и предназначенная для обхода страниц Интернета с целью занесения информации о них (ключевые слова) в базу поисковика. По своей сути паук больше всего напоминает обычный браузер. Он сканирует содержимое страницы, забрасывает его на сервер поисковой машины, которой принадлежит и отправляется по ссылкам на следующие страницы.

    В ответ на запрос, где найти нужную информацию, поисковый сервер возвращает список гиперссылок, ведущих web-страницам, на которых нужная информация имеется или упоминается. Обширность списка может быть любой, в зависимости от содержания запроса.

    http://www.yandex.ru/

    Яндекс - российская система поиска в Сети. Сайт компании, Yandex.ru, был открыт 23 сентября 1997 года. Головной офис компании находится в Москве. У компании есть офисы в Санкт-Петербурге, Екатеринбурге, Одессе и Киеве. Количество сотрудников превышает 700 человек.

    Слово «Яндекс» (состоящее из буквы «Я» и части слова index; обыгран тот факт, что русское местоимение «Я» соответствует английскому «I») придумал Илья Сегалович, один из основателей Яндекса, в настоящий момент занимающий должность технического директора компании.

    Поиск Яндекса позволяет искать по Рунету документы на русском, украинском, белорусском, румынском, английском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.

    По умолчанию Яндекс выводит по 10 ссылок на каждой странице выдачи результатов, в настройках результатов поиска можно увеличить размер страницы до 20, 30 или 50 найденных документов.

    Время от времени алгоритмы Яндекса, отвечающие за релевантность выдачи, меняются, что приводит к изменениям в результатах поисковых запросов. В частности, эти изменения направлены против поискового спама, приводящего к нерелевантным результатам по некоторым запросам.

    http://www.google.ru/

    Лидер поисковых машин Интернета, Google занимает более 70 % мирового рынка. Cейчас регистрирует ежедневно около 50 млн поисковых запросов и индексирует более 8 млрд веб-страниц. Google может находить информацию на 115 языках.

    По одной из версий, Google - искажённое написание английского слова googol. «Googol (гугол)» – это математический термин, обозначающий единицу со 100 нулями. Этот термин был придуман Милтоном Сироттой, племянником американского математика Эдварда Каснера, и впервые описан в книге Каснера и Джеймса Ньюмена «Математика и воображение»(Mathematics and the Imagination). Использование этого термина компанией Google отражает задачу организовать огромные объемы информации в Интернете.

    Интерфейс Google содержит довольно сложный язык запросов, позволяющий ограничить область поиска отдельными доменами, языками, типами файлов и т. д.

    http://www.rambler.ru/

    Rambler Media Group - интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов российского Интернета, информационный портал.

    Rambler создан в 1996 году.

    Поисковая система Рамблер понимает и различает слова русского, английского и украинского языков. По умолчанию поиск ведётся по всем формам слова.

    Когда-то, в начале 2000х, был богатый выбор поисковых машин Aport, Rambler, Nigma, Webalta, Mail.ru и другие:

    • Aport - русская поисковая система. Используется с 1995 г.. Часть портала РОЛ. Принадлежит Golden Telecom. При поиске учитываются особенности русского языка. В Русскоязычном интернете с начала 2000-х гг. поисковая система стала резко сдавать позиции, заметно уступая по известности Яндексу и Рамблеру. По богатству языка запросов заметно уступает иным популярным системам.
    • Rambler - интернет-холдинг, включающий в качестве сервисов поисковую систему, рейтинг-классификатор ресурсов русского , информационный портал. Настройки языка поиска: любой, британский, российский, украинский. Учитывается морфология. Одно время поисковая система Рамблер была самой популярной врусскоязычном интернете, однако потом уступила лидерство Яндексу.
    • Yandex - русская система поиска в Интернете и интернет-портал. Поиск Яндекса позволяет искать по Рунету бумаги на русском, белорусском, английском, украинском, немецком и французском языках с учётом морфологии русского и английского языков и близости слов в предложении. Отличительная особенность Яндекса - возможность точной настройки поискового запроса. Это реализовано за счёт гибкого языка запросов.
    • Mail.ru - 1 из крупнейших в Русскоязычном интернете бесплатных сервисов электронной почты. Компания работает на рынке под данным именем с 16 окт. 2001г.. До этого момента бренд Mail.ru принадлежал компании Port.ru. В итоге 2006 г. было заключено стратегическое соглашение о предоставлении поискового сервиса, основанного на движке Яндекса.
    • Webalta - Русская поисковая система, находящаяся на стадии публичного тестирования.

    Время показало, кто из поисковых систем может называться лидером.

    Из русско-язычного сегмента смогла идти в ногу со временем лишь Yandex. Зарубежные поисковые системы тоже трансформировались с различной степенью успеха. На первый план вышла корпорация Google.


    По состоянию на 2012 год можно сказать, что используя эти две поисковые системы можно найти русскоязычную информацию в 95-97% случаев. Остальные 3-5% распределены равномерно среди сотен поисковых движков.

    Поэтому есть смысл приглядеться к возможностям Google и Yandex. Легче простого написать в строке поиска Yandex или в строке поиска Google необходимый Вам запрос и поисковая система выдаст большое множество предложений по Вашему запросу. Поисковая машина - Yandex в Русскоязычном интернете способна отыскать нужные Вам веб-страницы, свежие вести, массу разных картинок и видео роликов, энциклопедические познания и массу иной полезной информации.

    Итак, начинаем искать! Благо, тут не нужны какие-то особые познания и отработанные умения. Сформулируйте Ваш вопрос, как бы Вы задали его собственному учителю, товарищу или библиотекарю.
    К примеру, "кто самый сильный", "где растут дубы" или "скачать mail агент ". В какой бы падежной форме не употребили Вы слова, поисковая система Yandex и Google будут искать все формы слов: по запросу "дуб", поисковик разыскивает "дуб", "дуба" и иные.

    Yandex-поисковик отлично понимает и односложные запросы, и запросы из некоторого количества слов и своими силами их интерпретирует. Он понимает, когда нужно отыскатьстраницы, где слова запроса находятся рядом, а когда словам просто довольно встретиться в одном документе, чтоб отыскать хорошую страницу с ответом для Вас.


    Как же сформулировать правильный запрос?

    Он как правило должен состоять из некоторого количества слов, так как по одному слову весьма непросто понять, о чем Вы хотите задать вопрос. К примеру, введем в поисковик слово "пол". Вероятно, Вы хотите задать вопрос о поле мужском или женском или же напольном покрытии. По этому запросу Yandex найдет информацию обо всех известных ему полах. Пример понятный - запрос нужно формулировать как возможно четче и уточнять по максимуму.

    Используйте расширенный поиск! Так Вы сможете в максимальной степени сузить круг поиска. А сейчас несколько советов для эффективного и быстрого поиска нужной информации в Yandex. Старайтесь при поиске применять особые знаки. С их помощьювозможно уточнить запрос поиска. А отыскать их возможно на Yandex, нажав в расширенном поиске на ссылку "Памятка по применению языка запросов".

    Для примера приведу несколько этих полезных знаков:
    1. Чтоб отыскать точную фразу или форму слова, используйте кавычки:
    ["зима недаром злится"]
    2. Чтоб исключить слово во фразе из поиска, воспользуйтесь знаком минус. Это слово должно стоять в итоге фразы запроса. М/у словом и знаком не должно быть пробела.
    [схемы вязания крючком -купить]
    3. Чтоб восстановить забытое слово в цитате, воспользуйтесь звездочкой (*). Всю цитату заключите в кавычки, а вместо забытого слова поставьте звездочку.
    ["сжала руки над * вуалью"]
    4. Чтоб отыскать слова, которые обязаны быть в одном предложении, воспользуйтесь знаком с необычным названием "амперсанд" - &. Если соединить слова амперсандом,Yandex выдаст статьи, где эти слова располагаются в одном предложении.
    [Огромной театр & Москва]
    5. Чтоб по запросу отыскать статью или документ с определенным словом, нужно поставить перед этим словом плюс. М/у словом и знаком не должно быть пробела.
    [Памятник Пушкину +площадь]

    Специализированные поисковые системы.

    • Поиск по картинокам
    • Поисковые системы с фильтрами
      • Scandoo: Поиск с проверкой сайтов на наличие вирусов, вредоносных программ
      Поиск по скрытому интернету (часть веб-страниц Всемирной паутины, не индексированная поисковыми системами): Поиск files: Поиск схем и электронных компонентов:
    • Поиск кода (программистам):
    • Поиск вредоносных программ ( , трояны и т.п.):
    • Поиск кряков (специальная программа (либо файл, содержащий инструкции для такой программы), изменяющая некоторые байты в другой программе, выполняемая с целью отключения защиты от копирования, отключение nagscreen"ов или запрещение чтения системного времени) и вареза (термин, обозначающий незаконно распространяемое программное обеспечение)
      • Astalavista Security Group: поиск через все движки «подпольного Интернета»
    • Поиск новостей:
    • Метапоисковые системы:

    Как же поисковые системы ищут информацию?

    Поисковые системы состоят из 5 отдельных программных компонент:

    1. spider (паук): утилита, которая скачивает веб-страницы.
    2. crawler: сканирующий паук, который гуляет по всем ссылкам, найденным на странице.
    3. indexer (индексатор): "слепая" утилита, которая изучает веб-страницы, скаченные пауками.
    4. database (база данных): хранилище скаченных и обработанных страниц.
    5. search engine results engine (система выдачи результатов): извлекает результаты поиска из базы данных.

    Spider : Паук - утилита, которая скачивает веб-страницы. Он работает точно как ваш браузер, когды вы соединяетесь с веб-сайтом и загружаете страницу. Паук не имеет никаких визуальных компонент. То же воздействие (скачивание) вы можете наблюдать, когда просматриваете некоторую страницу и когда выбираете "просмотр HTML-кода" всобственном браузере.
    Crawler : Как и паук скачивает страницы, он может "раздеть" страницу и отыскать все ссылки. Это его задача - определять, куда далее должен идти паук, основываясь на ссылках или отталкиваясь от заблаговременно заданного списка адресов.
    Indexer : Индексатор разбирает страницу на разные ее части и изучает их. Элементы типа заголовков страниц, заголовков, ссылок, текста, структурных элементов, элементов BOLD, ITALIC и иных стилевых частей страницы вычленяются и анализируются.
    Database : База данных - хранилище всех данных, которые поисковая система скачивает иизучает. Это нередко требует больших ресурсов.
    Search Engine Results Engine : Система выдачи результатов решает, какие страницы удовлетворяют запросу пользователя. Это та часть поисковой системы, с который вы имеете дело, осуществляя поиск. Когда пользователь вводит ключевое слово и делает поиск, поисковая система отбирает результаты на основании всегда меняющихся критериев. Алгоритмом называется способ, по которому она принимает решение. Профессиональные оптимизаторы (SEO) время от времени потребляют термин "algos" - это и есть то, о чем мы говорим.

    Основные критерии отбора результатов поиска:

    • Title (заголовок): Есть ли ключевое слово в заголовке?
    • URL (Домен): Есть ли ключевое слово в имени домена или в адресе страницы?
    • Style (стиль): Жирный (STRONG или B), Курсив (EM или I), Заголовки HEAD: если место на странице, где ключевое слово использовано в жирных, курсивных или Hx (H1, H2,...) текстовых заголовках?
    • Density (плотность): Насколько часто ключевое слово употреблено на странице?Число ключевиков сравнительно текста страницы называется плотностью ключевого слова.
    • META (мета данные): Впрочем многие отрицают, некорые поисковые системы до сих пор читают мета ключевые слова (meta keywords ) и мета описания (meta description ).
    • Outbound Links (ссылки наружу): На кого есть ссылки на странице и встречается ли ключевое слово в тесте ссылки?
    • Inbound Links (внешние ссылки): Кто еще в Интернет имеет ссылку на данный интернет-сайт? Каков текст ссылки? Это называется "внестраничный" критерий, таккак автор страницы не во всех случаях может им руководить.
    • Insite Links (ссылки внутри страницы): На какие еще страницы данного ресурса содержит ссылки эта страница?

    Итак, алгоритм поисковой системы учитывает:

    1. Число ключевиков на веб-ресурсе.
    2. Число ключевиков на странице.
    3. Соотношение общего количества слов на веб-ресурсе к количеству ключевиков навеб-ресурсе.
    4. Соотношение общего количества слов на странице к количеству ключевиков на странице.
    5. Индекс цитирования.
    6. Популярность темы.
    7. Количество запросов по конкретному ключевому слову за определённый временнойпромежуток.
    8. Общее число веб-страниц ресурса.
    9. Использование стиля к веб-страницам.
    10. Объём текста ресурса.
    11. Объём ресурса.
    12. Объём любой веб-страницы.
    13. Объём текста любой веб-страницы.
    14. Возраст ресурса.
    15. Наименование URL ресурса (имя домена)
    16. Периодичность обновления информации на веб-ресурсе.
    17. Последнее обновление страниц ресурса.
    18. Количество картинок (рисунков) на веб-ресурсе.
    19. Число мультимедийных файлов.
    20. Наличие замещающих надписей на рисунках (картинках).
    21. Длину (в числе знаков) замещающих надписей рисунков (картинок).
    22. Применение фреймов.
    23. Язык ресурса (российский или заграничный).
    24. Размер шрифта, которым оформлены ключевые слова.
    25. Жирность шрифта ключевиков.
    26. Написаны в разрядку или нет ключевые слова.
    27. Написаны или нет заглавными буквами ключевые слова.
    28. Как далеко от начала веб-страницы находятся ключевые слова.
    29. Стиль заголовков и наименований ключевиков.
    30. Наличие и разбор мета-тэгов.
    31. Содержание и наличие описания и свойств страницы.
    32. Наличие файла "робот".
    33. Географическое месторасположение ресурса.

    Для получения данных из интернета существует определенная техника. Если всё делать по ней, а не как придется, то поиск будет занимать совсем немного времени и приводить к нужному результату легко и безболезненно.

    Конечно, всегда есть вероятность, что походящей информации в сети попросту нет, но если искать «по науке», то, как правило, что-то найти да получается.

    Первое, с чем нужно разобраться, это где мы будем искать. Второй момент - правильное составление запроса. Но обо всем по порядку.

    Где в интернете вся информация

    Если в нашем обычном «реальном» мире вся текстовая информация находится, условно говоря, в книгах, то в интернете она размещена на сайтах. Этих самых сайтов в сети миллиарды на самые разные темы.

    Для того чтобы в «реальном» мире бесплатно получить книгу, нужно отправиться в библиотеку. В интернете тоже есть подобные структуры, называются они поисковые системы .

    Мы можем зайти в такую систему и напечатать что-то, что хотим найти. Если запрос составлен правильно, и у поисковика имеются данные по этому поводу, он нам их выдаст. То есть он найдет подходящие сайты, а если быть более точным, то отдельные страницы сайтов, которые, по его мнению, соответствуют запросу.

    Какими поисковыми системами пользоваться

    Лучше всего искать информацию через крупнейшие системы - Яндекс (yandex.ru) и Google (google.ru). Это лучшие поисковики из всех существующих. Яндекс - российский, Google - международный.

    Я не буду сейчас рассказывать, как ими пользоваться - большинство и так это умеет. Поговорим лучше о том, в какой ситуации какая система предпочтительней.

    В том случае, если вы не умеете пользоваться поисковиками, ознакомьтесь с уроком «Как и что можно найти в интернете ».

    Я бы рекомендовал следующее: когда вы ищете информацию на русском языке, то сначала попробуйте поискать ее через Яндекс. В русскоязычном интернете эта система более популярна и, как показывает опыт, лучше подходит для «нашего» человека.

    Если Яндекс ничего подходящего не показал, то спрашивайте то же самое у Гугл. Сделать это можно прямо из Яндекса. Для этого нужно опуститься вниз страницы с неудачными результатами поиска до вот такой надписи:

    В том случае, если вам нужно найти данные на английском или другом иностранном языке, рекомендую сразу идти в Гугл. Все-таки это международная поисковая система и по другим странам она ищет лучше.

    Как сформулировать запрос

    От того, как именно мы «спросим» у системы, будет зависеть получение или неполучение нужной информации. Результат-то поисковик нам выдаст в любом случае, но далеко не всегда тот, что мы хотели бы получить.

    Многие думают, что умение правильно формулировать запрос приходит с опытом, который накапливается годами. Оно действительно так, но происходит это только из-за того, что человек просто начинает понимать (зачастую интуитивно), как работает поисковая система.

    Нужно помнить, что любой поисковик - это машина. Можно назвать его и по-другому: программа, искусственный интеллект. То есть это не человек, а бездушная система. Она не понимает недосказанности, туманности формулировок, намеков и иронии. Хотя в последнее время технологии значительно улучшились.

    Посмотрим на составление запроса глазами поисковой системы. Допустим, я открываю поисковик и в строке для печати запроса набираю слово «принтер». После этого нажимаю на кнопку поиска.

    Система получает команду «перерыть» весь интернет и найти для меня информацию по принтеру. Но что именно мне нужно? Я хочу купить принтер или просто почитать про него? А, может, принтер у меня сломался, и я хочу найти мастерскую по ремонту? Или купить к нему расходные материалы (картриджи, чернила)?

    Поисковик в замешательстве, поэтому старается предусмотреть все варианты. Вот какие результаты он мне показывает:

    Как видите, здесь и статьи о принтере, и интернет-магазины, где их можно купить, и ремонтные мастерские и даже магазины по продаже картриджей.

    Допустим, мне нужно узнать информацию о конкретной модели принтера. Но ведь их тысячи - откуда поисковику знать, какая именно меня интересует?! Мысли ведь он читать не умеет…

    Чтобы ему помочь, нужно точно напечатать, что именно необходимо найти. Не просто «принтер» — это очень широкое понятие, — а конкретную модель.

    И результат не заставит себя должно ждать:

    Значит, чтобы поисковик нас понял, нужно сформулировать запрос конкретнее. Но не перестараться - желательно не использовать лишних слов, иначе система может попросту «запутаться».

    Пример . У меня перестало работать видео. Причем в самом компьютере оно работает, а в интернете - нет. Можно было бы напечатать следующий запрос: «Что делать если не работает видео». Но, во-первых, этот запрос неточный — ведь у меня с ним проблемы только в интернете. А, во-вторых, в нем много лишних слов.

    Лучше напечатать следующее: «не работает видео в интернете».

    Кстати, если при печати вы допустите грамматическую ошибку, скорее всего, поисковик ее автоматически исправит и покажет правильные результаты - без ошибки. Расставлять в запросе знаки препинания и использовать заглавные буквы тоже не требуется.

    Уточнение запроса

    Даже если пользователь все время помнит о том, что запросы должны быть точными и конкретными, «непонятки» с поисковиком все-таки случаются. В этом случае нужно просто уточнить запрос - допечатать слово или несколько слов. Тогда система поймет, что именно мы хотим, и покажет более подходящие результаты.

    Вроде все точно и конкретно, но результаты я получаю не те. Система действительно выдает мне данные о фильме и даже сайты, где его можно посмотреть. Но это совершенно не тот фильм, который нужен. Видимо, с таким названием их несколько.

    Значит, нужно уточнить запрос. Для этого просто допечатываю, какую-то дополнительную информацию (год, страну, режиссера).

    Что делать, если все равно выдает «не то»

    Бывает так, что запрос хорошо составлен и уточнение к нему есть, но все равно результаты не устраивают. Либо информация не та, либо ее качество хромает.

    Мы уже говорили, что в этом случае имеет смысл идти в другой поисковик. Но что делать, если и там такая же картина?!

    Тогда следует переформулировать запрос — написать то же самое, но другими словами. А иногда лучше даже расширить его - сделать не таким точным.

    Пример . Допустим, я пенсионер и хочу бесплатно через интернет освоить компьютер. Печатаю максимально точный запрос «бесплатные компьютерные курсы в интернете для пенсионеров».

    Получаю результаты. Какие-то из них - это платные курсы для пенсионеров. Другие же - бесплатные, но выездные. А третьи - вообще непонятно что.

    Значит, нужно просто переформулировать запрос. Например, вместо «компьютерные курсы» напечатать «обучение компьютеру».

    А можно вообще попробовать его укоротить:

    Выводы

    • Русскоязычные запросы ищем сначала в Яндексе. Если не получилось, идем искать в Google (можно прямо из выдачи результатов yandex.ru).
    • Запросы на английском и других иностранных языках ищем в Гугле.
    • В том случае, когда мы хотим почитать о каком-то явлении, предмете или человеке «вообще», лучше напечатать общий запрос. Пример: принтер, дефолт, феллини.
    • А если нужно узнать что-то определенное, стараемся более точно сформулировать запрос. Пример: устройство принтера, дефолт в россии 1998, феллини фильмография.
    • Если результат не оправдал ожиданий, уточняем запрос. В том случае, когда и точный запрос не дает нужного результата, переформулируем его.
    Статьи по теме: