Международный школьный научный вестник
Научный журнал для старшеклассников и учителей ISSN 2542-0372

О журнале Выпуски Правила Олимпиады Учительская Поиск Личный портфель

СОВРЕМЕННЫЕ ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ

Сатарова И.Д. 1
1 г. Тверь, Тверской лицей, 9 класс
Наумова А.И. (Тверь, Тверской лицей)
1. «Гугл» или «Яндекс», что лучше? Сравнение ведущих конкурентов Всемирной сети. – https://strana-it.ru/gugl-ili-yandeks-chto-luchshe/.
2. AltaVista – Wikipedia. – https://en.wikipedia.org/wiki/AltaVista.
3. DuckDuckGo. – https://www.cy-pr.com/wiki/DuckDuckGo/.
4. DuckDuckGo–Википедия. – https://ru.wikipedia.org/wiki/DuckDuckGo.
5. TinEye Reverse Image Search. – https://www.tineye.com/.
6. TinEye–Википедия. – https://ru.wikipedia.org/wiki/TinEye.
7. Англоязычные поисковые системы. – https://w512.ru/articles/Search_eng.htm.
8. Генон. – http://wiki-org.ru/wiki/Генон.
9. Как писать качественные ответы на сайте Genon.ru? – https://www.genon.ru/GetAnswer.aspxqid= 8688710d-7387–4914–a1b3–d75fc1b65982.
10. Как правильно искать информацию в Интернете. – http://ccinet.info/kak-pravilno-iskat-informaciyu-v-internete/.
11. Поиск@Mail.Ru – Википедия. – https://ru.wikipedia.org/wiki/Поиск@Mail.Ru.
12. Поисковые системы. – https://studfiles.net/preview/ 5882109/page:2/.
13. Правила поиска в Яндексе. – http://the-komp.ru/kak-pravilno-iskat-informaciyu-v-internete.html.
14. Современные поисковые системы. – https://studfiles.net/preview/5788402/page:8/.
15. Справочник по компьютерным проблемам и их устранению. Лучшие поисковые системы Интернета. – https://moydrygpk.ru/internet/luchshie-poiskovye-sistemy-interneta.html.
16. Что собой представляет поисковая система Bing. – https://guland.biz/internet/drugie-ps/poiskovaya-sistema-bing.html.

В данной работе представлен материал по работе с информационно-поисковыми системами в сети Интернета. Тема достаточно актуальная и представляет повышенный интерес для учащихся.

Цель данной работы заключается в том, чтобы получить дополнительные знания по теме «Поисковые системы», рассмотрев наиболее популярные системы в России и Зарубежье (русскоязычные и англоязычные).

Задачи состоят в том, чтобы подобрать соответствующий материал с последующей систематизацией, обобщением, иллюстрацией текста; провести сравнительную характеристику; научиться правильно оформлять запрос в поисковой строке системы.

Работа состоит из двух частей: теоретической (даны определения, типы, пречень наиболее известных систем) и практической (на примере поисковой системы Yandex разобраны основные правила составления наиболее точных запросов).

Основная часть

1. Что такое поисковая система Интернета

Поиско́вая систе́ма – программно-аппаратный комплекс с веб-интерфейсом, предоставляющий возможность поиска информации в интернете.

Все поисковые системы объединяет то, что они расположены на специально-выделенных мощных серверах и привязаны к эффективным каналам связи. Поисковые системы называют еще информационно-поисковыми системами (ИПС).

Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос. На основании запроса пользователя поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может сочетать различные типы файлов, например: веб-страницы, изображения, видеофайлы. [12]

2. Типы поисковых систем

По методам поиска и обслуживания разделяют четыре типа поисковых систем: системы, использующие поисковых роботов; системы управляемые человеком; гибридные системы; мета-системы.

В архитектуру поисковой системы включены: поисковый робот сканирующий сайты сети Интернет, индексатор, обеспечивающий быстрый поиск, и поисковик – графический интерфейс для работы пользователя.

Цель поисковой системы заключается в том, чтобы находить документы, содержащие либо ключевые слова, либо слова как-либо связанные с ключевыми словами. Поисковая система тем лучше, чем больше документов релевантных запросу пользователя она будет возвращать. [12]

3. Популярные поисковые системы в России

3.1. Yandex (русскоязычный интерфейс)

Yandex – самая популярная в настоящее время отечественная поисковая система. Начала работу в 1997 г. Она поддерживает собственный каталог Интернет – ресурсов. Также является лучшей поисковой системой для выявления иллюстраций. Англоязычный вариант снабжен справочником ресурсов Интернет. Обладает развернутой системой формирования запроса. В частности, допускается ввод поискового предписания на естественном языке – в этом случае все необходимые расширения производятся автоматически. Помимо веб-страниц в формате HTML, Яндекс индексирует документы в форматах PDF (Adobe Acrobat), Rich Text Format (RTF), двоичных форматах Word (.doc), Excel (.xls), PowerPoint (.ppt), RSS (блоги и форумы) (рис. 3.1). Текущий статус – активен [12, 15].

3.2. Google (русскоязычный интерфейс)

Google – одна из самых полных и популярных зарубежных ИПС, крупнейшая в мире поисковая система интернета, принадлежащая корпорации Google Inc (рис. 3.2).

В России используется с русскоязычным интерфейсом. Отличительной особенностью ИПС Google является технология определения степени релевантности документа путем анализа ссылок других источников на данный ресурс. Чем больше ссылок на какую-либо страницу имеется на других страницах, тем выше ее рейтинг в ИПС Google. Google использует алгоритм расчёта авторитетности PageRank. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в результатах поиска Google. Google использует показатель PageRank найденных по запросу страниц, чтобы определить порядок выдачи этих страниц посетителю в результатах поиска. В 2010 году компания запустила голосовой поиск в России. Чтобы осуществить поиск, необходимо нажать в телефоне кнопку рядом со строкой поиска и произнести свой запрос, телефон отправит ваш голос на сервер и браузер выдаёт строку с распознанным вашим запросом и результатами поиска по нему. Текущий статус – активен [12, 15].

satarov-1.tif

Рис. 3.1. Поисковая система Яндекс (https://www.yandex.ru)

satarov-2.tif

Рис. 3.2. Поисковая система Google (https://www.google.ru)

3.3. Rambler (русскоязычный интерфейс)

Rambler – одна из первых российских ИПС, открыта в 1996 году. В конце 2002 года была произведена коренная модернизация, после которой Rambler вновь вошел в группу лидеров сетевого поиска. В настоящее время объем индекса составляет порядка 150 миллионов документов. Для составления сложных запросов рекомендуется использовать режим «Детальный запрос», который предоставляет широкие возможности для составления поискового предписания с помощью пунктов меню (рис. 3.3). Текущий статус – работает.

По результатам тестов Rambler занимает 2-е место после Yandex. Производительность поискового робота декларируется в объеме 6,9 млн. страниц в сутки. В системе также усовершенствован поиск по новостям: робот посылается на ведущие новостные сайты России каждые 2 часа. [12, 14, 15]

satarov-3.tif

Рис. 3.3. Поисковая система Рамблер (https://www.rambler.ru)

3.4. Mail (русскоязычный интерфейс)

Бесплатный почтовый сервис с неограниченным размером ящика, защитой от спама и вирусов. Социальная сеть, фото- и видеохостинги, поисковая система и другие коммуникационные и развлекательные сервисы (рис. 3.4).

Поиск@Mail.Ru – поисковая система от компании Mail.Ru. По данным на октябрь 2018 года на рынке Рунета он занимает долю около 2,9 % (третье место в рейтинге поисковых систем на российском рынке) [12].

Система начала работать в 2007 году. Объем индексного файла весной 2009 г. составлял более 1.5 миллиарда страниц, расположенных на русскоязычных серверах. Помимо разыскания текстов, системой осуществляется поиск иллюстраций и видеофрагментов, размещенных на специализированных «самонаполняемых» российских серверах: Фото@Mail.Ru, Flamber.Ru, 35Photo.ru, PhotoForum.ru, Видео@Mail.Ru, RuTube, Loadup, Rambler Vision и им подобных. Gogo.ru позволяет ограничивать область поиска сайтами коммерческой направленности, информационными сайтами, а также форумами и блогами. Форма «Расширенного поиска» также дает возможность ограничить разыскания определенными типами файлов (PDF, DOC, XLS, PPT), местом положения искомых слов в документе или определенным доменом. В ноябре 2013 в Google Play появилась новая версия поискового приложения от компании Mail.Ru, позволяющего переходить с главного экрана в любые социальные сети и содержащего быстрый доступ к поиску по картинам, видео и новостям. Текущий статус – активен [11, 12, 15].

satarov-4.tif

Рис. 3.4. Поисковая система Mail (https://mail.ru)

4. Популярные поисковые системы Зарубежья

У каждой страны существуют свои популярные поисковые системы. Рассмотрим наиболее востребованные.

4.1. AltaVista и Yahoo! (англоязычный интерфейс)

AltaVista was a Web search engine established in 1995. It became one of the most-used early search engines, but lost ground to Google and was purchased by Yahoo! in 2003, which retained the brand, but based all AltaVista searches on its own search engine. On July 8, 2013, the service was shut down by Yahoo! and since then, the domain has redirected to Yahoo!’s own search site. The word «AltaVista» is formed from the words for «high view» in Spanish (alta + vista).

AltaVista была веб-поисковой системой, созданной в 1995 году (рис. 4.1). Она стала одной из самых ранних поисковых систем, но потеряла почву для Google и была приобретена Yahoo! в 2003 году, который сохранил бренд, но основывал все поисковые запросы AltaVista на собственной поисковой системе. 8 июля 2013 года служба была закрыта Yahoo!. С тех пор домен перенаправляется на собственный поисковый сайт Yahoo! (рис. 4.2). Слово «AltaVista» формируется из слов «высокого вида» на испанском языке (alta + vista). Текущий статус AltaVista – не работает. Текущий статус Yahoo! – активен [2].

AltaVista – одна из старейших поисковых систем занимает одно из первых мест по объему документов – более 350 миллионов. AltaVista позволяет осуществлять простой и расширенный поиск. «Help» позволяет даже неподготовленным пользователям правильно составлять простые и сложные запросы [12].

satarov-5.tif

Рис. 4.1. Search system AltaVista (http://www.altavista.com)

satarov-6.tif

Рис. 4.2. Search system Yahoo! (https://www.yahoo.com)

4.2. Bing (англоязычный интерфейс)

Bing is a search engine developed by the international corporation Microsoft. At the moment, the Bing system is considered the second highest search engine in the world.

Bing – это поисковая система, разработанная международной корпорацией Microsoft. В настоящий момент система Bing считается второй по величине поисковой системой в мире (рис. 4.3).

Обладает рядом уникальных особенностей – просмотр результатов выдачи на одной странице (нет необходимости перелистовать), динамическая настройка результатов выдачи (объема информации), которая отображается в результате поиска: лишь название, короткая информация, либо полная сводка.

На сегодняшний день поисковая система Bing используется в большинстве смартфонов и мобильных телефонов, выпускающихся на территории Канады и Америки. Текущий статус – активен [16].

satarov-7.tif

Рис. 4.3. Search system Bing (https://www.bing.com)

4.3. Google (англоязычный интерфейс)

This system was created as an educational project by students of Stanford University (USA) Larry Page and Sergey Brin. In 1996, they developed the Back Rub Substation System, and in 1998, based on it, created the Google system. [14]

Google is the first popular English-language search engine (79.65 %), processes 41 billion 345 million queries per month (market share 62.4 %), indexes more than 25 billion web pages, and can find information in 195 languages. Supports search in documents of formats PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint and others [7].

Эта система была создана в качестве учебного проекта студентами Стэнфордского университета (США) Ларри Пэйджем и Сергеем Брином. В 1996 г. они разрабатывали ПС Back Rub, а в 1998 г. на ее основе создали систему Google (рис. 4.4).

Google – первая по популярности (79,65 %) поисковая англоязычная система, обрабатывает 41 млрд. 345 млн. запросов в месяц (доля рынка 62,4 %), индексирует более 25 млрд. веб-страниц, может находить информацию на 195 языках. Поддерживает поиск в документах форматов PDF, RTF, PostScript, Microsoft Word, Microsoft Excel, Microsoft PowerPoint и других. Текущий статус – активен.

Преимущества поискового алгоритма системы представлены в п. 3.2.

satarov-8.tif

Рис. 4.4. Search system Google (https://www.google.com)

5. Сравнительные характеристики популярных поисковиков

На данный момент самые популярные поисковики – это Google и Яндекс.

Две компании заняли прочные позиции в русскоязычном сегменте интернета. Отсюда и вытекает давний спор о том, «Гугл» или «Яндекс» что лучше. Ответить на этот вопрос довольно сложно, каждый имеет свои несомненные плюсы, а также недостатки. В большей степени использование каждого поисковика обусловлено привычкой. Сегодня Яндекс охватывает 58% пользователей, остальное делят между собой Гугл и остальные малоизвестные поисковые системы. Для того чтобы хоть как-то сравнить эти компании проведём обзор поисковых систем и часто используемых сопутствующих программ и сервисов:

Яндекс отличается более наполненным и разнообразным интерфейсом, тогда как Гугл склонен к минимализму;

С точки зрения веб-разработки, Гугл считается более стабильным, поэтому ему отдаётся больше предпочтений;

Яндекс – русская компания, Гугл – американская; Yandex имеет значительно больше полезных разработок, чем его оппонент;

Google предлагает пользователям отличные поисковые подсказки;

Считается что релевантность результатов поиска у Гугла выше, тем не менее, не стоит забывать, что Яндекс был разработан именно для русскоязычного сегмента интернета и в нём он превосходит конкурента [1].

А также сравним скорость индексации и количество проиндексированных страниц (табл. 5.1). В данном случае приоритет на стороне Google [12].

Таблица 5.1

Сравнительные характеристики Yandex и Google

п/п

Критерии сравнения

Yandex

Google

1.

Количество проиндексированных страниц

2 миллиарда

8 миллиардов

2

Скорость индексации страниц

Несколько дней

В течение суток

6. Необычные поисковые системы

6.1. Genon (русскоязычный интерфейс)

Генон – это информационно-поисковая система, созданная в 2006 году для облегчения поиска информации в интернете. Поиск нужной информации осуществляется по внутренней базе с применением технологий собственной разработки. Система собирает и создаёт контент у себя на сайте (рис. 6.1).

Для сбора и проверки информации привлекаются посетители и осуществляется сотрудничество с другими сайтами. Генон является крупнейшим российским справочным ресурсом. Месячная аудитория сайта составляет около 2 млн. человек [8].

Отличие Генона от других поисковых систем в том, что на запрос выдается один-два ответа, которые содержат подробную, полную и актуальную информацию по данному вопросу. Ответы постоянно редактируются и дополняются новой информацией. Это – уникальный, и в то же время, простой и общедоступный в использовании ресурс; введите вопрос и выберите нужный ответ. Если ответа на вопрос нет, то Генон предлагает варианты действий. Текущий статус – работает [9, 15].

satarov-9.tif

Рис. 6.1. Поисковая система Genon (https://www.genon.ru/)

6.2. DuckDuckGo (англоязычный интерфейс)

The creator of the DuckDuckGo search engine is Gabriel Weinberg. This person already has experience in creating successful Internet projects – his first brainchild was the social network of the name database (The Names Database).

Создателем поисковой системы DuckDuckGo является Гэбриел Вайнберг. Этот человек уже имеет опыт создания успешных интернет-проектов – его первым детищем была социальная сеть базы данных имен (The Names Database).

Поисковая система, придающая особое значение обеспечиванию конфиденциальности пользователей и отказу от «пузыря фильтров» персонализированных результатов поиска (рис. 6.2). DuckDuckGo также уделяет особое внимание выдаче наилучших результатов, а не наибольшего их количества и генерирует результаты, используя более 400 источников, включая ключевые краудсорсинговые сайты, такие как Википедия, а также другие поисковые системы, среди которых Bing и Яндекс.

Сегодня поисковая система DuckDuckGo обрабатывает более четырех миллионов запросов ежедневно. Текущий статус – активен. [3, 4, 15].

satarov-10.tif

Рис. 6.2. Search system DuckDuckGo (https://duckduckgo.com/)

6.3. TinEye (англоязычный интерфейс)

TinEye is a search engine with a reverse image. Image Search: Give him an image, and he will tell you where the image appears on the Internet. ... TinEye is an image search and recognition company. We are specialists in computer vision, pattern recognition, neural networks and machine learning.

TinEye – это поисковая система с обратным изображением. Поиск изображения: Дайте ему изображение, и он расскажет вам, где изображение появляется в Интернете. ... TinEye – компания по поиску и распознаванию изображений. Мы являемся специалистами в области компьютерного зрения, распознавания образов, нейронных сетей и машинного обучения [5].

TinEye (произносится [ти́н а́й]) – поисковая система, специализирующаяся на поиске изображений в Интернете. TinEye была создана канадской компанией Idee Inc. 6 мая 2008 года. TinEye позволяет находить в Интернете изображения, похожие на изображение-образец. Для получения результата в качестве образца достаточно даже миниатюры файла с низким разрешением (рис. 6.3). Текущий статус – активен [6, 15].

satarov-11.tif

Рис. 6.3. Search system TinEye (http://tineye.com/)

Почти в каждой поисковой системе помимо окна поиска расположены ссылки на самые популярные новостные сайты, и сайты определенной тематики.

7. Правила поиска информации в Интернете

7.1. Общие рекомендации

В каждой поисковой системе есть свои алгоритмы (правила) поиска информации. Чтобы найти какую-то информацию в Интернете через поисковую систему, необходимо в поле поиска ввести конкретный запрос, состоящий из двух, трех и более словосочетаний, желательно, чтобы он начинался со слова, которое больше всего отображает суть поиска [15].

Для получения более полной и достоверной информации в англоязычных поисковых системах желательно писать запрос на английском языке.

Рассмотрим несколько примеров составления запросов в поисковой системе Яндекс.

7.2. Ввод в поисковую строку словосочетания

По запросу: компьютерные курсы онлайн найдено 130 млн. результатов (рис. 7.1).

satarov-12.tif

Рис. 7.1. Поиск по словосочетанию

7.3. Включение в поиск ключевых слов (!)

Для того, чтобы поиск был точным, необходимо поставить перед ключевым словом восклицательный знак (!).

По запросу: компьютерные курсы !онлайн найдено 98 млн. результатов: ответов меньше, чем в первом случае (рис. 7.2).

satarov-13.tif

Рис. 7.2. Поиск по ключевому слову

7.4. Поиск точной словоформы (кавычки)

Для более точного поиска необходимо взять весь запрос в кавычки.

По запросу: «компьютерные курсы онлайн» найдено 5 тыс. результатов: ответов намного меньше, чем в первом и во втором случаях (рис. 7.3). Варианты ответов: 130 млн., 98 млн. и 5 тыс [10].

satarov-14.tif

Рис. 7.3. Поиск точной словоформы

7.5. Поиск с оператором ИЛИ (|)

a) Ввод в поисковую строку фразы с оператором «|», который осуществляет поиск по нескольким сочетаниям фраз, заменяя несколько слов в различных местах.

По запросу: купить ноутбук|нетбук выданы страницы, содержащие либо «купить ноутбук», либо «купить нетбук»; найдено 112 млн. результатов (рис. 7.4.1).

satarov-16.tif

Рис. 7.4.1. Поиск с оператором ИЛИ

b) Ввод в поисковую строку фразы с оператором «|» и заключённую в кавычки.

По запросу: «купить ноутбук|нетбук» выданы страницы, содержащие либо «купить ноутбук», либо «купить нетбук»; найдено 3 тыс. результатов: ответов намного меньше, чем в первом случае (рис. 7.4.2). Варианты ответов: 112 млн. и 3 тыс [10].

По аналогии можно использовать и другие операторы: НЕ и И.

satarov-18.tif

Рис. 7.4.2. Поиск с использованием кавычек

7.6. Расширенный поиск

Для перехода к расширенному варианту нужно нажать на кнопку с двумя параллельными полосами. Такой вариант позволяет провести поиск более точно и получить максимально подходящие итоги (рис. 7.5).

satarov-20.tif

Рис. 7.5. Вход в расширенный поиск

Используя расширенный поиск, можно максимально сузить круг поиска. Здесь стоит отметить такие функции как: расположение слов точно так, как в запросе; дата обновления (как давно была написана или обновлена статья); язык на котором написан текст; возможность поиска в конкретном регионе (рис. 7.6) [13].

satarov-21.tif

Рис. 7.6. Расширенный поиск информации

Рассмотрены и проведены сравнения по точности и количеству найденных ответов наиболее часто применяемых правил по запросам. Чтобы более подробно ознакомиться и с другими правилами по составлению запросов, необходимо набрать в поисковой строке «правила поиска в Яндекс» и перейти по ссылке ответа на запрос.

Заключение

Ведущие отечественные и зарубежные специалисты продолжают разрабатывать и модифицировать информационно-поисковые системы.

Новейшие разработки позволяют выявлять файлы определенного вида (например, графические или аудио) и обладают чувствительностью к строчным и заглавным буквам. Общепринятой становится возможность искать данные на любых языках. Все это даёт возможность составлять поисковые запросы с большой степенью точности, что, конечно же, значительно повышает релевантность получаемых результатов. [12]

Проведённый компьютерный эксперимент наглядно показывает практическую значимость проведённых исследований.


Библиографическая ссылка

Сатарова И.Д. СОВРЕМЕННЫЕ ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ // Международный школьный научный вестник. – 2019. – № 2-1. – С. 47-58;
URL: http://school-herald.ru/ru/article/view?id=932 (дата обращения: 23.07.2019).