Интернет как правильно называется: Интернет — Википедия – Интернет — Википедия

alexxlab
alexxlab
16.03.2020

Содержание

Портал:Интернет — Википедия

Материал из Википедии — свободной энциклопедии

Перейти к навигации Перейти к поиску Crystal browser.png

Интернет (читается [интэрнэ́т], от англ. Internet — International Network) — всемирная система объединённых компьютерных сетей, построенная на использовании протокола IP и маршрутизации пакетов данных. Интернет образует глобальное информационное пространство, служит физической основой для Всемирной паутины и множества систем (протоколов) передачи данных. Часто упоминается как Всемирная сеть и Глобальная сеть. В обиходе иногда говорят Инэ́т, Нэт. В Интернете существует множество страниц. Из страниц складываются сайты. Сайты располагаются на специальных компьютерах — серверах.

Wi-Fi (произносится как [вай-фай]), сокр. от англ. Wireless Fidelity — протокол и стандарт на оборудование для широкополосной радиосвязи, предназначенной для организации локальных беспроводных сетей Wireless LAN. Установка таких сетей рекомендуется там, где развертывание кабельной системы невозможно или экономически нецелесообразно. Благодаря функции хэндовера пользователи могут перемещаться между точками доступа по территории покрытия сети Wi-Fi без разрыва соединения.

Разработан консорциумом Wi-Fi Alliance на базе стандартов IEEE 802.11. Мобильные устройства (КПК и ноутбуки), оснащённые клиентскими Wi-Fi приёмно-передающими устройствами, могут подключаться к локальной сети и получать доступ в Интернет через так называемые точки доступа или хотспоты.

Crystal browser.png Графическое изображение информации во Всемирной паутине
Мир сгенерировал 161 миллиард гигабайт информации (161 экзабайт) в 2006 году.
Если говорить об эквиваленте то, например, это 12 стопок книг высотой от Земли до Солнца. Это в 3 миллиона раз больше информации, чем когда-либо было написано человеком в книгах. Для хранения этой информации понадобится 2 миллиарда самых вместительных плееров iPod.
Для сравнения, в 2003 году мир произвёл лишь 5 экзабайт информации.
  • Антарктида имеет свой «национальный» домен — .aq, образованный от слова ‘aqua’. Домены второго уровня в этой зоне выдаются только государственным организациям, занимающимся какой-либо деятельностью в Антарктиде.
  • Домен .tv, в котором любят регистрироваться сайты телеканалов, это не общий домен наподобие .com или .org. Изначально он достался маленькому государству Тувалу, которое расположено в Океании. Правительство Тувалу решило продать права на домен и теперь получает за право его использования больше 2 миллионов долларов в год, что составляет примерно десятую часть всех доходов этого государства.
  • Экс—премьер-министр Тувалу Колоа Талаке
    продал американской компании национальный домен верхнего уровня .tv, что существенно увеличило доходы его страны.

Живой журнал, ЖЖ (англ. LiveJournal, LJ) — служба размещения онлайновых дневников (вернее, блогов), либо какой-то отдельный блог («дневник», «журнал») в этой службе. Предлагает обычный для блогов набор функций: возможность публикации записей, их комментирования читателями и так далее; также есть удобные дополнительные функции, многие из которых доступны бесплатно любому желающему.

Доступ в Интернет — Википедия

Доступ в Интернет — методы и средства, посредством которых пользователи соединяются с Интернетом.

Проводное соединение (телефонный провод, коаксиальный кабель, витая пара, волоконно-оптический кабель).

Беспроводное соединение (радиоволны в определённом частотном диапазоне).

Основные технологии передачи данных для доступа к Интернету[править | править код]

Технологии проводных соединений
Технологии беспроводных соединений

Помимо доступа с места расположения конечного пользователя, имеются также публичные места для использования Интернета, например библиотеки и интернет-кафе, где размещены общедоступные компьютеры с доступом в Интернет. Некоторые библиотеки оснащены терминалами, которые обеспечиваются средствами для подключения публичных ноутбуков к локальным сетям (ЛВС). Также имеются беспроводные места доступа в Интернет во многих общественных местах, наподобие залов в аэропортах, в некоторых случаях — только на короткое их использование на время стоянки самолёта. Эти пункты доступа могут предоставлять компьютеры, работающие от монет, по типу таксофонов, или публичные, общедоступные точки доступа на базе Wi-Fi, которые дают возможность специально оснащённым ноутбукам подсоединяться к сети Интернет. Различные термины используются при этом, такие как «общественный интернет-киоск», «терминал публичного доступа», и «Web—таксофон». Многие отели сегодня также имеют общественные терминалы, хотя эти сервисы, обычно, платные.

Существует множество мест, где беспроводная связь предоставляется всем желающим, например кафе с Wi-Fi или библиотеки, куда предполагаемый пользователь может принести свои собственные, дающие возможность беспроводного доступа, устройства, такие, как ноутбук, КПК и т. д. Эти услуги могут быть совершенно бесплатными, бесплатными только для клиентов, или платными. Точка беспроводного доступа не обязательно должна быть ограничена каким-либо замкнутым пространством. Такой беспроводной сетью может быть охвачен полностью студенческий городок, парк, или даже город целиком.

В дополнении к Wi-Fi, проводились эксперименты с частными мобильными беспроводными сетями, наподобие Ricochet, с различными услугами по высокоскоростной передаче данных через сети сотовых или мобильных телефонов, и с фиксированными беспроводными сервисами. Эти сервисы не получили широкого распространения вследствие их высокой стоимости, которая ложилась на плечи пользователей. Новые беспроводные технологии, такие как WiMAX, нацелены на устранение этой проблемы путём несложного и недорогого развёртывания городских компьютерных сетей, покрывающих большие городские пространства. Наблюдается растущая тенденция к использованию беспроводных ячеистых сетей, которые предлагают децентрализованную и резервирующую инфраструктуру и часто рассматриваются в качестве будущего сети Интернет.

Использование Интернета по всему миру стремительно растёт, хотя темпы роста стали несколько снижаться после 2000 года. Фаза быстрого роста заканчивается в промышленно развитых странах, так как его использование становится здесь повсеместным, но его быстрое распространение продолжается в Африке, Латинской Америке, Карибском бассейне и на Ближнем Востоке. Примером такого рода может служить Бразилия, где, благодаря низким налогам на компьютеры и на провайдеров, использующих dial-up, число бразильцев в Интернете значительно выросло за последние два года.

Права человека на доступ к Интернету[править | править код]

В настоящее время[неопределённость] предпринимаются решительные попытки Организацией Объединённых Наций сделать доступ в Интернет неотъемлемым правом человека. В 2003 году во время мирового саммита, посвящённому информационному обществу, было сделано другое заявление относительно этой темы[1][2].

В некоторых странах, таких как Эстония[3] и Греция

[4], доступ в Интернет уже получил статус неотъемлемого права человека.

В Финляндии каждый гражданин в соответствии с распоряжением правительства получил обеспеченное законом право на доступ в Интернет по мегабитному каналу. В правительстве страны сочли, что Интернет из развлечения стал частью повседневной жизни. В Финляндии к Сети подключено до 96 % граждан. К Интернету не подключены всего четыре тысячи домов. Недавно принятый закон обязывает провайдеров проложить линии и к ним.

3 июня 2011 ООН приняла резолюцию на основе авторитетного доклада спецпредставителя ООН Франка Ла Рю, в которой говорится, что распространение информации в сети Интернет должно быть максимально свободным, кроме случаев, когда может иметь место нарушение прав, например, связанных с кибератаками с целью завладения данными. В документе говорится, что Интернет стал неотъемлемым инструментом реализации прав человека, борьбы с неравенством и развития прогресса

[5].

Интернет-безопасность — Википедия

Интернет-безопасность — это отрасль компьютерной безопасности, связанная специальным образом не только с Интернетом, но и с сетевой безопасностью, поскольку она применяется к другим приложениям или операционным системам в целом. Её цель — установить правила и принять меры для предотвращения атак через Интернет. Интернет представляет собой небезопасный канал для обмена информацией, который приводит к высокому риску вторжения или мошенничества, таких как фишинг, компьютерные вирусы, трояны, черви и многое другое.[1][2]

Множество методов используется для защиты передачи данных, в том числе шифрование. В настоящее время основное внимание уделяется профилактике, а также защите от известных и новых угроз в режиме реального времени.

Вредоносные программы[править | править код]

Интернет-пользователь может быть обманут или втянут в загрузку на компьютер вредоносного программного обеспечения. Основные типы таких программ представлены ниже[3]:

  • Вирус, иначе вредоносная программа — это любое программное обеспечение, используемое для получения несанкционированного доступа к информации или ресурсам компьютера с целью хищения, удаления, искажения или подмены данных. Вирусы делятся на группы по типу заражаемых объектов, методам заражения и жертвам. Заразить компьютер вирусом можно разными способами: от использования съемного носителя до посещения вредоносного сайта. Благодаря антивирусным компаниям в наше время вирусы встречаются довольно редко.
  • Ботнет — компьютерная сеть, состоящая из запущенных ботов. Зачастую бот — специальная программа, устанавливаемая на компьютер пользователя без его согласия, которая позволяет злоумышленнику выполнять некие действия, такие как рассылка спама, переборка паролей и т. д.
  • Компьютерный вирус — это программы, которые создают копии самих себя с целью внедрения в коды других программ и системные области памяти, а также распространения самих себя по различным каналам связи. Чаще всего используются для захвата информации на компьютере. Компьютерные виды делятся на группы по поражаемым объектам, методам их заражения, поражаемым операционным системам и т. д.
  • Сетевые черви в некотором роде являются вирусами, так как тоже способны копировать самих себя, но не могут нанести вред существующим файлам. Вместо этого они создают дополнительную нагрузку на компьютер за счет интенсивного распространения. Черви классифицируются по способу распространения и месту заражения.
  • Вирус-вымогатель блокирует доступ к компьютеру или возможность считывания данных, а затем требует выкуп для восстановления исходного состояния. Вирусы этого типа могут шифровать данные, блокировать или препятствовать работе в системе или браузере.
  • Лжеантивирус создает видимость работающего антивируса, что позволяет осуществить внедрение дополнительного заражения. Также может предлагать дополнительные услуги при введении пользовательских данных: кредитная карта, номер телефона и т. д.
  • Программа-шпион — это программа, тайно отслеживающая активность пользователя и сообщающая о ней другим пользователям. Данный вид программ имеет широкий спектр возможностей: от сбора информации о посещаемых сайтах до удаленного управления компьютером или смартфоном.
  • Кейлогер — программное обеспечение, регистрирующее нажатия клавиш на клавиатуре и мыши, а также дату и время этих действий.
  • Троян — вредоносная программа, проникающая на компьютер под видом легального программного обеспечения с целью выполнения действий, нужных злоумышленникам. Свое название вирус получил благодаря сходству по принципу действию с деревянным конем, погубившим Трою. Существует 5 основных типов троянов: удаленный доступ, уничтожение данных, загрузчик, деактиватор программ безопасности и сервер.

DoS-атаки[править | править код]

DoS-атака (аббр. англ. Denial of Service «отказ в обслуживании») — это хакерская атака на систему, при которой реальные пользователи получают отказ в обслуживании. Проводятся с помощью создания большого количества запросов на сервер, что дает критическую нагрузку, при которой сервер может начать выдавать закрытую информацию или же просто перестает работать, что заставляет провайдера терять доход.[4]

Фишинг[править | править код]

Фишинг — это вид интернет-мошенничества, в ходе которого злоумышленники получают доступ к конфиденциальной информации пользователя, такой как логин и пароль. Используется для массовой рассылки от имени популярных брендов, внутри частных сервисов или социальных сетей. В настоящее время цель фишеров — клиенты банков и электронных платежных систем.[5][6]

Уязвимости приложений[править | править код]

Приложения, используемые для доступа к интернет-ресурсам, могут содержать уязвимости безопасности, такие как ошибки безопасности памяти или ошибочные проверки подлинности. Самые серьезные из этих ошибок могут дать сетевым злоумышленникам полный контроль над компьютером. Большинство приложений и комплексов безопасности не способны обеспечить качественную защиту от этих видов атак.[7]

По статистике[8], 2014 году спам составлял 60 % от общего числа писем, в 2015—2016 годах их процент уменьшился до 53. Улучшение защиты от фишинга повлияло и на его частоту: в 2014 наблюдали кражу данных в 1 случае из 965, к 2015 — 1 из 1846, а к 2016 — лишь 1 из 2596. Рейтинг почтовых вредоносных программ к 2016 году снизился по сравнению с 2014 годом с 1 из 244 до 1 вредоносного письма из 133. А вот количество новых вредителей растет с каждым годом: в 2014 году — 275 миллионов новых вредоносных программ, в 2015—355 миллионов, в 2016—357 миллионов.

Количество web-атак, блокируемых ежедневно: в 2015—340 000, 2016—229 000.

С актуальной статистикой угроз можно ознакомиться по ссылке. О конкретных примерах последних угроз можно узнать в отчете Лаборатории Касперского о развитии информационных угроз в третьем квартале 2018 года.[9][10]

Безопасность сетевого уровня[править | править код]

Протоколы TCP/IP могут быть защищены криптографическими методами и протоколами безопасности. Эти протоколы включают протокол Secure Sockets Layer (SSL), с которым обеспечивается безопасность транспортного уровня (TLS) для веб-трафика, Pretty Good Privacy (PGP) для электронной почты и IPsec для обеспечения безопасности сетевого уровня.[11]

Internet Protocol Security (IPsec)[править | править код]

IPsec предназначен для защиты протокола TCP/IP в безопасном режиме. Это набор расширений безопасности, разработанных Интернет-целевой группой (IETF). Он обеспечивает безопасность и аутентификацию на уровне IP путем преобразования данных с использованием шифрования. Есть два основных типа преобразования, которые составляют основу IPsec: заголовок аутентификации (AH) и ESP. Эти два протокола обеспечивают целостность данных, аутентификацию источника данных и службу защиты от повтора. Эти протоколы могут использоваться по отдельности или в комбинации для предоставления требуемого набора служб безопасности для уровня интернет-протокола (IP).[11]

Многофакторная аутентификация[править | править код]

Многофакторная аутентификация (МФА) — это метод управления доступом к компьютеру, в котором пользователю предоставляется доступ только после успешного представления нескольких отдельных доказательств механизму аутентификации — как правило, по меньшей мере две из следующих категорий: знания (что-то они знают), владение (что-то у них есть) и внутренность (что-то они есть). Интернет-ресурсы, такие как веб-сайты и электронная почта, могут быть защищены с использованием многофакторной аутентификации.[12][13]

Токен (авторизации)[править | править код]

Некоторые онлайн-сайты предлагают клиентам возможность использовать шестизначный код, который случайным образом изменяется каждые 30-60 секунд на токене безопасности. Клавиши маркера безопасности встроены в математические вычисления и манипулируют числами на основе текущего времени, встроенного в устройство. Это означает, что каждые тридцать секунд существует только определённый массив чисел, который будет правильным для проверки доступа к онлайн-учетной записи. Веб-сайт, на котором пользователь регистрируется, будет уведомлен о серийном номере этого устройства и будет знать вычисления и правильное время, встроенные в устройство, чтобы убедиться, что указанное число действительно является одним из немногих шестизначных чисел, которое работает в этом при 30-60-секундном цикле. Через 30-60 секунд устройство представит новое случайное шестизначное число, которое может войти в веб-сайт.[14]

Безопасность электронной почты[править | править код]

Предпосылки[править | править код]

Сообщения электронной почты составлены, доставлены и сохранены в многоэтапном процессе, который начинается с композиции сообщения. Когда пользователь заканчивает составление сообщения и отправляет его, сообщение преобразуется в стандартный формат: форматированное сообщение RFC 2822. После этого сообщение может быть передано. Используя сетевое соединение, почтовый клиент, называемый почтовой программой, подключается к почтовому серверу. Затем почтовый клиент предоставляет идентификатор отправителя серверу. Затем, используя команды почтового сервера, клиент отправляет список получателей на почтовый сервер. Затем клиент отправляет сообщение. Как только почтовый сервер получает и обрабатывает сообщение, происходит несколько событий: идентификация сервера получателя, установление соединения и передача сообщений. Используя службы доменных имен (DNS), почтовый сервер отправителя определяет почтовый сервер для получателей. Затем сервер открывает соединение с почтовым сервером-получателем и отправляет сообщение, используя процесс, аналогичный тому, который используется отправителем-клиентом, доставляя сообщение получателю.[15]

Pretty Good Privacy (PGP)[править | править код]

Pretty Good Privacy обеспечивает конфиденциальность путем шифрования передаваемых сообщений или файлов данных, которые должны храниться с использованием алгоритма шифрования, такого как Triple DES или CAST-128. Сообщения электронной почты могут быть защищены с помощью криптографии различными способами, такими как:

  • Подписание сообщения электронной почты для обеспечения его целостности и подтверждения личности отправителя.
  • Шифрование тела сообщения электронной почты для обеспечения его конфиденциальности.
  • Шифрование сообщений между почтовыми серверами для защиты конфиденциальности как тела сообщения, так и заголовка сообщения.

Первые два метода: шифрование сообщений и шифрование тела сообщения часто используются вместе; однако шифрование передач между почтовыми серверами обычно используется только тогда, когда две организации хотят защищать электронные письма, регулярно отправляемые между собой. Например, организации могут создать виртуальную частную сеть (VPN) для шифрования сообщений между своими почтовыми серверами через Интернет. В отличие от методов, которые могут только шифровать тело сообщения, VPN может шифровать целые сообщения, включая информацию заголовка электронной почты, такую ​​как отправители, получатели и темы. В некоторых случаях организациям может потребоваться защита информации заголовка. Тем не менее, только VPN-решение не может обеспечить механизм подписания сообщений, а также не может обеспечивать защиту сообщений электронной почты по всему маршруту от отправителя до получателя.

Многоцелевые расширения интернет-почты (MIME)[править | править код]

MIME преобразует данные, отличные от ASCII, на сайт отправителя на данные ASCII сетевого виртуального терминала (NVT) и передает его на простой SMTP-протокол для отправки через Интернет. Сервер SMTP со стороны получателя получает данные NVT ASCII и передает его в MIME, чтобы преобразовать его обратно в исходные данные, отличные от ASCII.

Имитовставка[править | править код]

Имитовставка — это криптографический метод, который использует секретный ключ для шифрования сообщения. Этот метод выводит значение MAC, которое может быть расшифровано приемником, используя тот же секретный ключ, который используется отправителем. Код аутентификации сообщения защищает как целостность данных сообщения, так и его подлинность.

Межсетевые экраны (Firewalls)[править | править код]

Межсетевой экран (он же брандмауэр) контролирует доступ между сетями. Он обычно состоит из шлюзов и фильтров, которые варьируются от одного брандмауэра к другому. Брандмауэры также отображают сетевой трафик и могут блокировать опасный трафик. Межсетевые экраны действуют как промежуточный сервер между соединениями SMTP и HTTP.[11]

Роль межсетевых экранов в веб-безопасности[править | править код]

Межсетевые экраны налагают ограничения на входящие и исходящие сетевые пакеты в частные сети и из них. Входящий или исходящий трафик должен проходить через брандмауэр; будет пропущен только разрешенный трафик. Межсетевые экраны создают контрольно-пропускные пункты между внутренней частной сетью и общедоступным Интернетом. Брандмауэры могут создавать точки затвора на основе источника IP и номера порта TCP. Они также могут служить платформой для IPsec. Используя возможности туннельного режима, брандмауэр можно использовать для реализации VPN. Брандмауэры также могут ограничивать сетевое воздействие, скрывая внутреннюю сетевую систему и информацию из общедоступного Интернета.[16]

Типы межсетевых экранов[править | править код]
Пакетный фильтр[править | править код]

Пакетный фильтр — это брандмауэр первого поколения, который обрабатывает сетевой трафик по принципу «по отдельности». Его основная задача — фильтровать трафик с удаленного IP-хоста, поэтому маршрутизатор необходим для подключения внутренней сети к Интернету. Маршрутизатор известен как экранирующий маршрутизатор, который отображает пакеты, выходящие и входящие в сеть.[16]

Технология SPI (Stateful Packet Inspection)

В технологии инспекции пакетов с хранением состояния шлюз сеансового уровня является прокси-сервером, который работает на сетевом уровне модели Open Systems Interconnection (OSI) и статически определяет, какой трафик будет разрешен. Прокси-серверы перенаправляют сетевые пакеты (отформатированные данные), содержащие заданный номер порта, если порт разрешен алгоритмом. Основным преимуществом прокси-сервера является его способность предоставлять технология «преобразования сетевых адресов» (NAT), которая может скрыть IP-адрес пользователя из Интернета, эффективно защищая всю внутреннюю информацию из Интернета.[16]

Шлюз прикладного уровня[править | править код]

Шлюз прикладного уровня — это брандмауэр третьего поколения, где прокси-сервер работает на самом верху модели OSI, уровне приложения IP-пакета. Сетевой пакет пересылается только в том случае, если соединение установлено с использованием известного протокола. Шлюзы уровня приложения отличаются анализом целых сообщений, а не отдельных пакетов данных, когда данные отправляются или принимаются.[16]

Антивирусы[править | править код]

Антивирусное программное обеспечение и программы обеспечения безопасности в Интернете помогут защитить устройство от атак путем обнаружения и устранения вредоносных программ.[17]

Менеджер паролей[править | править код]

Менеджер паролей — это программное приложение, которое помогает пользователю хранить и организовывать пароли. Менеджеры паролей обычно хранят пароли в зашифрованном виде, требуя от пользователя создания главного пароля, открывающего доступ к базе всех паролей.

Комплекты безопасности[править | править код]

Так называемые комплекты безопасности были впервые предложены для продажи в 2003 году (McAfee) и содержат набор брандмауэров, антивирусных, антишпионских программ и т. д.[18] Они также предлагают защиту от краж, проверку безопасности переносного хранилища, частный интернет-просмотр, облачный антиспам, измельчитель файлов или принятие решений, связанных с безопасностью (ответы на всплывающие окна), а несколько из них бесплатны.[19]

  1. Gralla, Preston. How the Internet works. — Millenium ed. — Indianapolis, IN: Que, 1999. — 324 pages с. — ISBN 0789721325, 9780789721327.
  2. Rhee, Man Young. Internet security : cryptographic principles, algorithms, and protocols. — Chichester, West Sussex, England: J. Wiley, 2003. — 1 online resource (xvii, 405 pages) с. — ISBN 0470862467, 9780470862469.
  3. ↑ Виды вредоносного программного обеспечения (Malware) (неопр.). ida-freewares.ru. Дата обращения 7 декабря 2018.
  4. Q. Yan, F. R. Yu, Q. Gong, J. Li. Software-Defined Networking (SDN) and Distributed Denial of Service (DDoS) Attacks in Cloud Computing Environments: A Survey, Some Research Issues, and Challenges // IEEE Communications Surveys Tutorials. — Firstquarter 2016. — Т. 18, вып. 1. — С. 602—622. — ISSN 1553-877X. — DOI:10.1109/COMST.2015.2487361.
  5. Peter Stavroulakis, Mark Stamp. Handbook of Information and Communication Security. — Springer Science & Business Media, 2010-02-23. — 863 с. — ISBN 9783642041174.
  6. Alta van der Merwe, Marianne Loock, Marek Dabrowski. Characteristics and Responsibilities Involved in a Phishing Attack // Proceedings of the 4th International Symposium on Information and Communication Technologies. — Cape Town, South Africa: Trinity College Dublin, 2005. — С. 249—254. — ISBN 9781595931696.
  7. Archiveddocs. Introduction (англ.). docs.microsoft.com. Дата обращения 7 декабря 2018.
  8. ↑ Internet Security Threat Report (неопр.). www.symantec.com. Дата обращения 13 декабря 2018.
  9. ↑ Статистика угроз безопасности (рус.). securelist.ru. Дата обращения 13 декабря 2018.
  10. ↑ Kaspersky Lab: Отчеты об ИТ-угрозах (рус.). securelist.ru. Дата обращения 13 декабря 2018.
  11. 1 2 3 Cisco — Global Home Page (англ.). Cisco. Дата обращения 7 декабря 2018.
  12. Seth Rosenblatt. Two-factor authentication: What you need to know (FAQ) (англ.). CNET. Дата обращения 7 декабря 2018.
  13. ↑ How to extract data from a 2FA iCloud account (англ.). www.iphonebackupextractor.com. Дата обращения 7 декабря 2018.
  14. ↑ What is security token (authentication token)? — Definition from WhatIs.com (англ.). SearchSecurity. Дата обращения 7 декабря 2018.
  15. ↑ The Network Virtual Terminal (неопр.). www.pvv.org. Дата обращения 7 декабря 2018.
  16. 1 2 3 4 The Network Virtual Terminal (неопр.). www.pvv.org. Дата обращения 7 декабря 2018.
  17. ↑ Build Your Own Free Security Suite (англ.). PCWorld (26 August 2008). Дата обращения 7 декабря 2018.
  18. ↑ All-in-One Security — PCWorld (неопр.). web.archive.org (27 октября 2010). Дата обращения 7 декабря 2018.
  19. ↑ Free Security Software from Comodo | PC Security (англ.). comodo.com. Дата обращения 7 декабря 2018.

Интернет — Викисловарь

Морфологические и синтаксические свойства

падеж ед. ч. мн. ч.
Им. Интерне́т Интерне́ты
Р. Интерне́та Интерне́тов
Д. Интерне́ту Интерне́там
В. Интерне́т Интерне́ты
Тв. Интерне́том Интерне́тами
Пр. Интерне́те Интерне́тах

Ин-тер-не́т

Существительное, неодушевлённое, мужской род, 2-е склонение (тип склонения 1a по классификации А. А. Зализняка).

Нормативным является также вариант написания со строчной буквы: интернет.

Корень: -Интернет- [БУС, 2016].

Произношение

Семантические свойства

Визуализация сети Интернет
Значение
  1. комп. глобальная компьютерная сеть, элементы которой связаны друг с другом посредством единого адресного пространства (чаще всего имеется в виду Всемирная паутина и доступная в ней информация, а не сама физическая сеть) ◆ Хорошее место рынок. Прямо как в Интернете — сплошной трёп. О. И. Дивов, «Молодые и сильные выживут», 1998 г. (цитата из Национального корпуса русского языка, см. Список литературы) ◆ Зато от меня напрямую зависело, будет ли на компьютере в их дежурке доступ в Интернет и парочка свежих игр, или одна только служебная информация и досье на сотрудников. С. В. Лукьяненко, «Ночной дозор», 1998 г. (цитата из Национального корпуса русского языка, см. Список литературы) ◆  — Они сидели в Интернете в рабочее время! Д. А. Емец, «Таня Гроттер и колодец Посейдона», 2004 г. (цитата из Национального корпуса русского языка, см. Список литературы)
  2. разг. доступ к этой сети; пользование ею ◆ Установить кому-либо Интернет. ◆ Заплатить за Интернет.
Синонимы
  1. Веб, Всемирная паутина, Паутина, Всемирная сеть, Сеть; Инет / инет (разг.), тырнет (шутл., разг.)
  2. интернет
Антонимы
  1. локальная сеть (частичн.), локалка (разг., частичн.)
Гиперонимы
  1. сеть, система
  2. услуга, доступ, пользование
Гипонимы
  1. тёмный Интернет
  2. кабельный интернет, оптический интернет, диалап
Холонимы
  1. телекоммуникации
Меронимы
  1. сайт, компьютер; Байнет, Казнет, Рунет, Уанет
  2.  ?

Родственные слова

Список всех слов с корнем «интернет-» [править]
  • существительные: интернет, Интернет, интернетизация, интернетик, интернетчик, интернетчица; интернет-автор, интернет-агентство, интернет-аддикт, интернет-аддикция, интернет-адрес, интернет-акция, интернет-альманах, интернет-аптека, интернет-арт, интернет-архитектура, интернет-атака, интернет-аудитория, интернет-аукцион, интернет-банк, интернет-банкинг, интернет-баннер, интернет-библиотека, интернет-бизнес, интернет-биржа, интернет-браузер, интернет-брендинг, интернет-брокер, интернет-букмекер, интернет-бум, интернет-версия, интернет-вещание, интернет-вирус, интернет-газета, интернет-гигант, интернет-голосование, интернет-графика, интернет-гуру, интернет-деньги, интернет-депозит, интернет-дизайн, интернет-дизайнер, интернет-дискаунтер, интернет-дискурс, интернет-дискуссия, интернет-дневник, интернет-домен, интернет-доступ, интернет-друг, интернет-журнал, интернет-журналист, интернет-журналистика, интернет-зависимость, интернет-зависимый, интернет-заказ, интернет-законодательство, интернет-звезда, интернет-знакомство, интернет-игра, интернет-игрок, интернет-издание, интернет-издательство, интернет-имя, интернет-инду́стри́я, интернет-интервью, интернет-интерфейс, интернет-информация, интернет-казино, интернет-камера, интернет-кампания, интернет-канал, интернет-карта, интернет-карточка, интернет-кафе, интернет-кеширование, интернет-кино, интернет-класс, интернет-клиент, интернет-клуб, интернет-коллекция, интернет-колумнистика, интернет-коммерсант, интернет-коммерция, интернет-коммуникация, интернет-компания, интернет-комплект, интернет-компьютер, интернет-конкурс, интернет-консалтинг, интернет-консультант, интернет-контент, интернет-конференция, интернет-курсы, интернет-лист, интернет-литература, интернет-магазин, интернет-ма́рке́тинг, интернет-материалы, интернет-мессенджер, интернет-мошенничество, интернет-музей, интернет-навигация, интернет-образование, интернет-общение, интернет-общественность, интернет-олимпиада, интернет-оператор, интернет-опрос, интернет-ориентированный, интернет-отдел, интернет-пакет, интернет-палитра, интернет-пароль, интернет-пейджер, интернет-пейджинг, интернет-переговоры, интернет-переписка, интернет-пират, интернет-пиратство, интернет-планшет, интернет-платёж, интернет-поисковик, интернет-показ, интернет-пользователь, интернет-портал, интернет-почта, интернет-предприниматель, интернет-предприятие, интернет-представительство, интернет-пресса, интернет-пресс-конференция, интернет-пресс-служба, интернет-пресс-центр, интернет-преступность, интернет-приложение, интернет-приставка, интернет-провайдер, интернет-провайдинг, интернет-программа, интернет-программирование, интернет-продавец, интернет-продажа, интернет-проект, интернет-пространство, интернет-протокол, интернет-процессинг, интернет-псевдоним, интернет-публикация, интернет-радио, интернет-радиостанция, интернет-развлечение, интернет-разработка, интернет-разработчик, интернет-рассылка, интернет-реклама, интернет-ресурс, интернет-решение, интернет-рынок, интернет-сайт, интернет-салон, интернет-связь, интернет-сделка, интернет-секция, интернет-сервер, интернет-сервис, интернет-сёрфер, интернет-сёрфинг, интернет-сессия, интернет-сеть, интернет-система, интернет-словарь, интернет-служба, интернет-СМИ, интернет-соединение, интернет-сообщение, интернет-сообщество, интернет-среда, интернет-страница, интернет-страничка, интернет-стратегия, интернет-страхование, интернет-страховка, интернет-студия, интернет-супермаркет, интернет-телевидение, интернет-телефон, интернет-телефония, интернет-терминал, интернет-технологии, интернет-технология, интернет-торги, интернет-торговля, интернет-трансляция, интернет-трафик, интернет-трейдер, интернет-трейдинг, интернет-тролль, интернет-турнир, интернет-узел, интернет-услуга, интернет-услуги, интернет-устройство, интернет-фестиваль, интернет-фильм, интернет-фильтр, интернет-фирма, интернет-форум, интернет-хит, интернет-холдинг, интернет-хостинг, интернет-цензура, интернет-центр, интернет-червь, интернет-шопинг, интернет-эквайринг, интернет-экскурсия, интернет-эксперт, интернет-энциклопедия, интернет-эфир
  • прилагательные: интернетный, интернетовский, интернетский; интернет-брокерский, интернет-букмекерский, интернет-зависимый, интернет-ма́рке́тинговый, интернет-пейджинговый, интернет-провайдерский

Этимология

Происходит от англ. Internet (букв. «межсетевой»), сокр. от internetwork, далее из inter- «между» + network «сеть». Термин Internet был официально введён в США в 1974 г.

Фразеологизмы и устойчивые сочетания

Перевод

глобальная компьютерная сеть, элементы которой связаны друг с другом посредством единого адресного пространства (чаще всего имеется в виду Всемирная паутина и доступная в ней информация, а не сама физическая сеть)
доступ к этой сети; пользование ею

Библиография

  • Новые слова и значения. Словарь-справочник по материалам прессы и литературы 90-х годов XX века. — СПб. : Дмитрий Буланин, 2014. — ISBN 978-5-86007-637-2.
  • Русский орфографический словарь / Под ред. В. В. Лопатина, О. Е. Ивановой. — 4-е изд., испр. и доп. — М. : АСТ Пресс Книга, 2012.
Interrobang.svg Для улучшения этой статьи желательно:
  • Добавить хотя бы один перевод для каждого значения в секцию «Перевод»

«Что такое интернет и как он работает?» – Яндекс.Знатоки

Интерне́т (англ. Internet, МФА: https://ru.wikipedia.org/wiki/%D0%9C%D0%B5%D0%B6%D0%B4%D1%83%D0%BD%D0%B0%D1%80%D0%BE%D0%B4%D0%BD%D1%8B%D0%B9_%D1%84%D0%BE%D0%BD%D0%B5%D1%82%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9_%D0%B0%D0%BB%D1%84%D0%B0%D0%B2%D0%B8%D1%82ˈɪn.tə.net[]) — всемирная система объединённых компьютерных сетей для хранения и передачи информации.

Часто упоминается как Всемирная сеть и Глобальная сеть, а также просто Сеть. Построена на базе стека протоколов TCP/IP. На основе Интернета работает Всемирная паутина (World Wide Web, WWW) и множество других систем передачи данных. К середине 2015 года число пользователей достигло 3,3 млрд человек. Во многом это было обусловлено широким распространением сотовых сетей с доступом в Интернет стандартов 3G и 4G, развитием социальных сетей и удешевлением стоимости интернет-трафика.

Интернет состоит из многих тысяч корпоративных, научных, правительственных и домашних компьютерных сетей. Объединение сетей разной архитектуры и топологии стало возможно благодаря протоколу IP (англ. Internet Protocol) и принципу маршрутизации пакетов данных.

Сам протокол IP был рождён в дискуссиях внутри организации IETF (англ. Internet Engineering Task Force; Task force — группа специалистов для решения конкретной задачи), чьё название можно вольно перевести как «Группа по решению задач проектирования интернета». IETF и её рабочие группы по сей день занимаются развитием протоколов Всемирной сети. IETF открыта для публичного участия и обсуждения. Комитеты организации публикуют так называемые документы RFC. В этих документах даются технические спецификации и точные объяснения по многим вопросам. Некоторые документы RFC возводятся организацией IAB (англ. Internet Architecture Board — Совет по архитектуре интернета) в статус стандартов интернета (англ. Internet Standard). С 1992 года IETF, IAB и ряд других интернет-организаций входят в Общество интернета (англ. Internet Society, ISOC). Общество интернета предоставляет организационную основу для разных исследовательских и консультативных групп, занимающихся развитием интернета.

Источник: https://ru.wikipedia.org/wiki/Интернет

Поисковая система — Википедия

Поиск информации во Всемирной паутине был трудной и не самой приятной задачей, но с прорывом в технологии поисковых систем в конце 1990-х годов осуществлять поиск стало намного удобней

Поиско́вая систе́ма (англ. search engine) — это компьютерная система, предназначенная для поиска информации[источник не указан 388 дней]. Одно из наиболее известных применений поисковых систем — веб-сервисы для поиска текстовой или графической информации во Всемирной паутине. Существуют также системы, способные искать файлы на FTP-серверах, товары в интернет-магазинах, информацию в группах новостей Usenet.

Для поиска информации с помощью поисковой системы пользователь формулирует поисковый запрос[1]. Работа поисковой системы заключается в том, чтобы по запросу пользователя найти документы, содержащие либо указанные ключевые слова, либо слова, как-либо связанные с ключевыми словами[2]. При этом поисковая система генерирует страницу результатов поиска. Такая поисковая выдача может содержать различные типы результатов, например: веб-страницы, изображения, аудиофайлы. Некоторые поисковые системы также извлекают информацию из подходящих баз данных и каталогов ресурсов в Интернете.

Поисковая система тем лучше, чем больше документов, релевантных запросу пользователя, она будет возвращать. Результаты поиска могут становиться менее релевантными из-за особенностей алгоритмов (см. «Пузырь фильтров»[⇨]) или вследствие человеческого фактора[⇨]. По состоянию на 2015 год самой популярной поисковой системой в мире является Google, однако есть страны, где пользователи отдали предпочтение другим поисковикам. Так, например, в России «Яндекс» обгоняет Google больше, чем на 10 %[⇨].

По методам поиска и обслуживания разделяют четыре типа поисковых систем: системы, использующие поисковых роботов, системы, управляемые человеком, гибридные системы и мета-системы[⇨]. В архитектуру поисковой системы обычно входят:

  • поисковый робот, собирающий информацию с сайтов сети Интернет или из других документов,
  • индексатор, обеспечивающий быстрый поиск по накопленной информации, и
  • поисковик — графический интерфейс для работы пользователя[⇨].

На раннем этапе развития сети Интернет Тим Бернерс-Ли поддерживал список веб-серверов, размещённый на сайте ЦЕРН[3]. Сайтов становилось всё больше, и поддерживать вручную такой список становилось всё сложнее. На сайте NCSA был специальный раздел «Что нового!» (англ. What’s New!)[4], где публиковали ссылки на новые сайты.

Первой компьютерной программой для поиска в Интернете была программа Арчи[en] (англ. archie — архив без буквы «в»). Она была создана в 1990 году Аланом Эмтэджем (Alan Emtage), Биллом Хиланом (Bill Heelan) и Дж. Питером Дойчем (J. Peter Deutsch), студентами, изучающими информатику в университете Макгилла в Монреале. Программа скачивала списки всех файлов со всех доступных анонимных FTP-серверов и строила базу данных, в которой можно было выполнять поиск по именам файлов. Однако, программа Арчи не индексировала содержимое этих файлов, так как объём данных был настолько мал, что всё можно было легко найти вручную.

Развитие и распространение сетевого протокола Gopher, придуманного в 1991 году Марком Маккэхилом (Mark McCahill) в университете Миннесоты, привело к созданию двух новых поисковых программ, Veronica[en] и Jughead[en]. Как и Арчи, они искали имена файлов и заголовки, сохранённые в индексных системах Gopher. Veronica (англ. Very Easy Rodent-Oriented Net-wide Index to Computerized Archives) позволяла выполнять поиск по ключевым словам большинства заголовков меню Gopher во всех списках Gopher. Программа Jughead (англ. Jonzy’s Universal Gopher Hierarchy Excavation And Display) извлекала информацию о меню от определённых Gopher-серверов. Хотя название поисковика Арчи не имело отношения к циклу комиксов «Арчи»[en], тем не менее Veronica и Jughead — персонажи этих комиксов.

К лету 1993 года ещё не было ни одной системы для поиска в вебе, хотя вручную поддерживались многочисленные специализированные каталоги. Оскар Нирштрасс (Oscar Nierstrasz) в Женевском университете написал ряд сценариев на Perl, которые периодически копировали эти страницы и переписывали их в стандартный формат. Это стало основой для W3Catalog, первой примитивной поисковой системы сети, запущенной 2 сентября 1993 года[5].

Вероятно, первым поисковым роботом, написанным на языке Perl, был «World Wide Web Wanderer» — бот Мэтью Грэя (Matthew Gray) из Массачусетского технологического института в июне 1993 года. Этот робот создавал поисковый индекс «Wandex». Цель робота Wanderer состояла в том, чтобы измерить размер всемирной паутины и найти все веб-страницы, содержащие слова из запроса. В 1993 году появилась и вторая поисковая система «Aliweb». Aliweb не использовала поискового робота, но вместо этого ожидала уведомлений от администраторов веб-сайтов о наличии на их сайтах индексного файла в определённом формате.

JumpStation[en], [6] созданный в декабре 1993 года Джонатаном Флетчером, искал веб-страницы и строил их индексы с помощью поискового робота, и использовал веб-форму в качестве интерфейса для формулирования поисковых запросов. Это был первый инструмент поиска в Интернете, который сочетал три важнейших функции поисковой системы (проверка, индексация и собственно поиск). Из-за ограниченности ресурсов компьютеров того времени индексация и, следовательно, поиск были ограничены только названиями и заголовками веб-страниц, найденных поисковым роботом.

Первой полнотекстовой индексирующей ресурсы при помощи робота («craweler-based») поисковой системой, стала система «WebCrawler»[en], запущенная в 1994 году. В отличие от своих предшественниц, она позволяла пользователям искать по любым словам, расположенным на любой веб-странице — с тех пор это стало стандартом для большинства поисковых систем. Кроме того, это был первый поисковик, получивший широкое распространение. В 1994 году была запущена система «Lycos», разработанная в Университете Карнеги-Меллон и ставшая серьёзным коммерческим предприятием.

Вскоре появилось множество других конкурирующих поисковых машин, таких как: «Magellan»[en], «Excite», «Infoseek»[en], «Inktomi»[en], «Northern Light»[en] и «AltaVista». В некотором смысле они конкурировали с популярными интернет-каталогами, такими как «Yahoo!». Но поисковые возможности каталогов ограничивались поиском по самим каталогам, а не по текстам веб-страниц. Позже каталоги объединялись или снабжались поисковыми роботами с целью улучшения поиска.

В 1996 году компания Netscape хотела заключить эксклюзивную сделку с одной из поисковых систем, сделав её поисковой системой по умолчанию на веб-браузере Netscape. Это вызвало настолько большой интерес, что Netscape заключила контракт сразу с пятью крупнейшими поисковыми системами (Yahoo!, Magellan, Lycos, Infoseek и Excite). За 5 млн долларов США в год они предлагались по очереди на поисковой странице Netscape[7][8].

Поисковые системы участвовали в «Пузыре доткомов» конца 1990-х[9]. Несколько компаний эффектно вышли на рынок, получив рекордную прибыль во время их первичного публичного предложения. Некоторые отказались от рынка общедоступных поисковых движков и стали работать только с корпоративным сектором, например, Northern Light[en].

Google взял на вооружение идею продажи ключевых слов в 1998 году, тогда это была маленькая компания, обеспечивавшая работу поисковой системы по адресу goto.com[en]. Этот шаг ознаменовал для поисковых систем переход от соревнований друг с другом к одному из самых выгодных коммерческих предприятий в Интернете[10]. Поисковые системы стали продавать первые места в результатах поиска отдельным компаниям.

Поисковая система Google занимает видное положение с начала 2000-х[11]. Компания добилась высокого положения благодаря хорошим результатам поиска с помощью алгоритма PageRank. Алгоритм был представлен общественности в статье «The Anatomy of Search Engine», написанной Сергеем Брином и Ларри Пейджем, основателями Google[12]. Этот итеративный алгоритм ранжирует веб-страницы, основываясь на оценке количества гиперссылок на веб-страницу в предположении, что на «хорошие» и «важные» страницы ссылаются больше, чем на другие. Интерфейс Google выдержан в спартанском стиле, где нет ничего лишнего, в отличие от многих своих конкурентов, которые встраивали поисковую систему в веб-портал. Поисковая система Google стала настолько популярной, что появились подражающие ей системы, например, Mystery Seeker[en](тайный поисковик).

К 2000 году Yahoo! осуществлял поиск на основе системы Inktomi. Yahoo! в 2002 году купил Inktomi, а в 2003 году купил Overture, которому принадлежали AlltheWeb[en] и AltaVista. Затем Yahoo! работал на основе поисковой системы Google вплоть до 2004 года, пока не запустил, наконец, свой собственный поисковик на основе всех купленных ранее технологий.

Фирма Microsoft впервые запустила поисковую систему Microsoft Network Search (MSN Search) осенью 1998 года, используя результаты поиска от Inktomi. Совсем скоро в начале 1999 года сайт начал отображать выдачу Looksmart[en], смешанную с результатами Inktomi. Недолго (в 1999 году) MSN search использовал результаты поиска от AltaVista. В 2004 году фирма Microsoft начала переход к собственной поисковой технологии с использованием собственного поискового робота — msnbot[en]. После проведения ребрендинга компанией Microsoft 1 июня 2009 года была запущена поисковая система Bing. 29 июля 2009 Yahoo! и Microsoft подписали соглашение, согласно которому Yahoo! Search[en] работал на основе технологии Microsoft Bing. На момент 2015 года союз Bing и Yahoo! дал первые настоящие плоды. Теперь Bing занимает 20,1 % рынка, а Yahoo! 12,7 %, что в общем занимает 32,60 % от общего рынка поисковых систем в США по данным из разных источников.

Поиск информации на русском языке[править | править код]

В 1996 году был реализован поиск с учётом русской морфологии на поисковой машине Altavista и запущены оригинальные российские поисковые машины Рамблер и Апорт. 23 сентября 1997 года была открыта поисковая машина Яндекс. 22 мая 2014 года компанией Ростелеком была открыта национальная поисковая машина Спутник, которая на момент 2015 года находится в стадии бета-тестировании. 22 апреля 2015 года был открыт новый сервис Спутник. Дети специально для детей с повышенной безопасностью.

Большую популярность получили методы кластерного анализа и поиска по метаданным. Из международных машин такого плана наибольшую известность получила «Clusty»[en] компании Vivisimo[en]. В 2005 году в России при поддержке МГУ запущен поисковик «Нигма», поддерживающий автоматическую кластеризацию. В 2006 году открылась российская метамашина Quintura, предлагающая визуальную кластеризацию в виде облака тегов. «Нигма» тоже экспериментировала[13] с визуальной кластеризацией.

Высокоуровневая архитектура стандартного краулера

Основные составляющие поисковой системы: поисковый робот, индексатор, поисковик[14].

Как правило, системы работают поэтапно. Сначала поисковый робот получает контент, затем индексатор генерирует доступный для поиска индекс, и наконец, поисковик обеспечивает функциональность для поиска индексируемых данных. Чтобы обновить поисковую систему, этот цикл индексации выполняется повторно[14].

Поисковые системы работают, храня информацию о многих веб-страницах, которые они получают из HTML-страниц. Поисковый робот или «краулер» (англ. Crawler) — программа, которая автоматически проходит по всем ссылкам, найденным на странице, и выделяет их. Краулер, основываясь на ссылках или исходя из заранее заданного списка адресов, осуществляет поиск новых документов, ещё не известных поисковой системе. Владелец сайта может исключить определённые страницы при помощи robots.txt, используя который можно запретить индексацию файлов, страниц или каталогов сайта.

Поисковая система анализирует содержание каждой страницы для дальнейшего индексирования. Слова могут быть извлечены из заголовков, текста страницы или специальных полей — метатегов. Индексатор — это модуль, который анализирует страницу, предварительно разбив её на части, применяя собственные лексические и морфологические алгоритмы. Все элементы веб-страницы вычленяются и анализируются отдельно. Данные о веб-страницах хранятся в индексной базе данных для использования в последующих запросах. Индекс позволяет быстро находить информацию по запросу пользователя[15].

Ряд поисковых систем, подобных Google, хранят исходную страницу целиком или её часть, так называемый кэш, а также различную информацию о веб-странице. Другие системы, подобные системе AltaVista, хранят каждое слово каждой найденной страницы. Использование кэша помогает ускорить извлечение информации с уже посещённых страниц[15]. Кэшированные страницы всегда содержат тот текст, который пользователь задал в поисковом запросе. Это может быть полезно в том случае, когда веб-страница обновилась, то есть уже не содержит текст запроса пользователя, а страница в кэше ещё старая[15]. Эта ситуация связана с потерей ссылок (англ. linkrot[en]) и дружественным по отношению к пользователю (юзабилити) подходом Google. Это предполагает выдачу из кэша коротких фрагментов текста, содержащих текст запроса. Действует принцип наименьшего удивления, пользователь обычно ожидает увидеть искомые слова в текстах полученных страниц (User expectations[en]). Кроме того, что использование кэшированных страниц ускоряет поиск, страницы в кэше могут содержать такую информацию, которая уже нигде более не доступна.

Поисковик работает с выходными файлами, полученными от индексатора. Поисковик принимает пользовательские запросы, обрабатывает их при помощи индекса и возвращает результаты поиска[14].

Когда пользователь вводит запрос в поисковую систему (обычно при помощи ключевых слов), система проверяет свой индекс и выдаёт список наиболее подходящих веб-страниц (отсортированный по какому-либо критерию), обычно с краткой аннотацией, содержащей заголовок документа и иногда части текста[15]. Поисковый индекс строится по специальной методике на основе информации, извлечённой из веб-страниц[11]. С 2007 года поисковик Google позволяет искать с учётом времени создания искомых документов (вызов меню «Инструменты поиска» и указание временного диапазона).

Большинство поисковых систем поддерживает использование в запросах булевых операторов И, ИЛИ, НЕ, что позволяет уточнить или расширить список искомых ключевых слов. При этом система будет искать слова или фразы точно так, как было введено. В некоторых поисковых системах есть возможность приближённого поиска[en], в этом случае пользователи расширяют область поиска, указывая расстояние до ключевых слов[15]. Есть также концептуальный поиск[en], при котором используется статистический анализ употребления искомых слов и фраз в текстах веб-страниц. Эти системы позволяют составлять запросы на естественном языке. Примером такой поисковой системы является сайт ask com.

Полезность поисковой системы зависит от релевантности найденных ею страниц. Хоть миллионы веб-страниц и могут включать некое слово или фразу, но одни из них могут быть более релевантны, популярны или авторитетны, чем другие. Большинство поисковых систем использует методы ранжирования, чтобы вывести в начало списка «лучшие» результаты. Поисковые системы решают, какие страницы более релевантны, и в каком порядке должны быть показаны результаты, по-разному[15]. Методы поиска, как и сам Интернет со временем меняются. Так появились два основных типа поисковых систем: системы предопределённых и иерархически упорядоченных ключевых слов и системы, в которых генерируется инвертированный индекс на основе анализа текста.

Большинство поисковых систем являются коммерческими предприятиями, которые получают прибыль за счёт рекламы, в некоторых поисковиках можно купить за отдельную плату первые места в выдаче для заданных ключевых слов. Те поисковые системы, которые не берут денег за порядок выдачи результатов, зарабатывают на контекстной рекламе, при этом рекламные сообщения соответствуют запросу пользователя. Такая реклама выводится на странице со списком результатов поиска, и поисковики зарабатывают при каждом клике пользователя на рекламные сообщения.

Существует четыре типа поисковых систем: с поисковыми роботами, управляемые человеком, гибридные и мета-системы[16].

  • системы, использующие поисковые роботы
Состоят из трёх частей: краулер («бот», «робот» или «паук»), индекс и программное обеспечение поисковой системы. Краулер нужен для обхода сети и создания списков веб-страниц. Индекс — большой архив копий веб-страниц. Цель программного обеспечения — оценивать результаты поиска. Благодаря тому, что поисковый робот в этом механизме постоянно исследует сеть, информация в большей степени актуальна. Большинство современных поисковых систем являются системами данного типа.
Эти поисковые системы получают списки веб-страниц. Каталог содержит адрес, заголовок и краткое описание сайта. Каталог ресурсов ищет результаты только из описаний страницы, представленных ему веб-мастерами. Достоинство каталогов в том, что все ресурсы проверяются вручную, следовательно, и качество контента будет лучше по сравнению с результатами, полученными системой первого типа автоматически. Но есть и недостаток — обновление данных каталогов выполняется вручную и может существенно отставать от реального положения дел. Ранжирование страниц не может мгновенно меняться. В качестве примеров таких систем можно привести каталог Yahoo[en], dmoz и Galaxy.
  • гибридные системы
Такие поисковые системы, как Yahoo, Google, MSN, сочетают в себе функции систем, использующие поисковых роботов, и систем, управляемых человеком.
Метапоисковые системы объединяют и ранжируют результаты сразу нескольких поисковиков. Эти поисковые системы были полезны, когда у каждой поисковой системы был уникальный индекс, и поисковые системы были менее «умными». Поскольку сейчас поиск намного улучшился, потребность в них уменьшилась. Примеры: MetaCrawler[en] и MSN Search.

Google — самая популярная поисковая система в мире с долей на рынке 69,24 %. Bing занимает вторую позицию, его доля 12,26 %[17].

Самые популярные поисковые системы в мире[18]:

Поисковая система Доля рынка в июле 2014 Доля рынка в октябре 2014 Доля рынка в сентябре 2017
Google 68,69 % 58,01 % 69,24 %
Bing 17,17 % 29,06 % 12,26 %
Baidu 6,22 % 8,01 % 6,48 %
Yahoo! 6,74 % 4,01 % 5,19 %
AOL 0,13 % 0,21 % 1,11 %
Excite 0,22 % 0,00 % 0,00 %
Ask 0,13 % 0,10 % 0,24 %

Азия[править | править код]

В восточноазиатских странах и в России Google — не самая популярная поисковая система. В Китае, например, более популярна поисковая система Soso.

В Южной Корее поисковым порталом собственной разработки Naver пользуется около 70 % жителей[19]Yahoo! Japan и Yahoo! Taiwan — самые популярные системы для поиска в Японии и Тайване соответственно[20].

Россия и русскоязычные поисковые системы[править | править код]

Яндексом пользуются 53,3 % пользователей в России (Google — 42,9 %)[21].

Согласно данным LiveInternet в декабре 2017 года об охвате русскоязычных поисковых запросов[22]:

  • Всеязычные:
  • Англоязычные и международные:
  • Русскоязычные — большинство «русскоязычных» поисковых систем индексируют и ищут тексты на многих языках — украинском, белорусском, английском, татарском и других. Отличаются же они от «всеязычных» систем, индексирующих все документы подряд, тем, что, в основном, индексируют ресурсы, расположенные в доменных зонах, где доминирует русский язык, или другими способами ограничивают своих роботов русскоязычными сайтами.

Некоторые из поисковых систем используют внешние алгоритмы поиска.

Количественные данные поисковой системы Google[править | править код]

Число пользователей Интернета и поисковых систем и требований пользователей к этим системам постоянно растёт. Для увеличений скорости поиска нужной информации крупные поисковые системы содержат большое количество серверов. Сервера обычно группируют в серверные центры (дата-центры). У популярных поисковых систем серверные центры разбросаны по всему миру[23].

В октябре 2012 года Google запустила проект «Где живёт Интернет», где пользователям предоставляется возможность познакомиться с центрами обработки данных этой компании[24].

О работе дата-центров поисковой системе Google известно следующее[23]:

  • Суммарная мощность всех дата-центров Google, по состоянию на 2011 год, оценивалась в 220 МВт.
  • Когда в 2008 году Google планировала открыть в Орегоне новый комплекс, состоящий из трёх зданий общей площадью 6,5 млн м², в журнале Harper’s Magazine подсчитали, что такой большой комплекс потребляет свыше 100 МВт электроэнергии, что сравнимо с потреблением энергии города с населением 300 000 человек.
  • Ориентировочное число серверов Google в 2012 году — 1 000 000.
  • Расходы Google на дата-центры составили в 2006 году — $1,9 млрд, а в 2007 году — $2,4 млрд.

Размер всемирной паутины, проиндексированной Google на декабрь 2014 года, составляет примерно 4,36 миллиарда страниц[25].

Поисковые системы, учитывающие религиозные запреты[править | править код]

Глобальное распространение Интернета и увеличение популярности электронных устройств в арабском и мусульманском мире, в частности, в странах Ближнего Востока и Индийского субконтинента, способствовало развитию локальных поисковых систем, учитывающих исламские традиции. Такие поисковые системы содержат специальные фильтры, которые помогают пользователям не попадать на запрещённые сайты, например, сайты с порнографией, и позволяют им пользоваться только теми сайтами, содержимое которых не противоречит исламской вере.

Незадолго до мусульманского месяца Рамадан, в июле 2013 года, миру был представлен Halalgoogling[en] — система, выдающая пользователям только халяльные «правильные» ссылки[26], фильтруя результаты поиска, полученные от других поисковых систем, таких как Google и Bing. Двумя годами ранее, в сентябре 2011 года, был запущен поисковый движок I’mHalal, предназначенный для обслуживания пользователей Ближнего Востока. Однако этот поисковый сервис пришлось вскоре закрыть, по сообщению владельца, из-за отсутствия финансирования[27].

Отсутствие инвестиций и медленный темп распространения технологий в мусульманском мире препятствовали прогрессу и мешали успеху серьёзного исламского поисковика. Очевиден провал огромных инвестиций в веб-проекты мусульманского образа жизни, одним из которых был Muxlim[en]. Он получил миллионы долларов от инвесторов, таких как Rite Internet Ventures, и теперь — в соответствии с последним сообщением от I’mHalal перед его закрытием — выступает с сомнительной идеей о том, что «следующий Facebook или Google могут появиться только в странах Ближнего Востока, если вы поддержите нашу блестящую молодёжь»[28].

Тем не менее исламские эксперты в области Интернета в течение многих лет занимаются определением того, что соответствует или не соответствует шариату, и классифицируют веб-сайты как «халяль» или «харам». Все бывшие и настоящие исламские поисковые системы представляют собой просто специальным образом проиндексированный набор данных либо это главные поисковые системы, такие как Google, Yahoo и Bing, с определённой системой фильтрации, использующейся для того, чтобы пользователи не могли получить доступ к харам-сайтам, таким как сайты о наготе, ЛГБТ, азартных играх и каким-либо другим, тематика которых считается антиисламской[28].

Среди других религиозно-ориентированных поисковых систем распространёнными являются Jewogle — еврейская версия Google и SeekFind.org — христианский сайт, включающий в себя фильтры, оберегающие пользователей от контента, который может подорвать или ослабить их веру[29].

Персональные результаты и пузыри фильтров[править | править код]

Многие поисковые системы, такие как Google и Bing, используют алгоритмы выборочного угадывания того, какую информацию пользователь хотел бы увидеть, основываясь на его прошлых действиях в системе. В результате, веб-сайты показывают только ту информацию, которая согласуется с прошлыми интересами пользователя. Этот эффект получил название «пузырь фильтров»[30].

Всё это ведёт к тому, что пользователи получают намного меньше противоречащей своей точке зрения информации и становятся интеллектуально изолированными в своём собственном «информационном пузыре». Таким образом, «эффект пузыря» может иметь негативные последствия для формирования гражданского мнения[31].

Несмотря на то, что поисковые системы запрограммированы, чтобы оценивать веб-сайты на основе некоторой комбинации их популярности и релевантности, в реальности экспериментальные исследования указывают на то, что различные политические, экономические и социальные факторы оказывают влияние на поисковую выдачу[32][33].

Такая предвзятость может быть прямым результатом экономических и коммерческих процессов: компании, которые рекламируются в поисковой системе, могут стать более популярными в результатах обычного поиска в ней. Удаление результатов поиска, не соответствующих местным законам, является примером влияния политических процессов. Например, Google не будет отображать некоторые неонацистские веб-сайты во Франции и Германии, где отрицание Холокоста незаконно[34].

Предвзятость может также быть следствием социальных процессов, поскольку алгоритмы поисковых систем часто разрабатываются, чтобы исключить неформатные точки зрения в пользу более «популярных» результатов[35]. Алгоритмы индексации главных поисковых систем отдают приоритет американским сайтам[33].

Поисковая бомба — один из примеров попытки управления результатами поиска по политическим, социальным или коммерческим причинам.

  1. ↑ Chu & Rosenthal, 1996, p. 129.
  2. ↑ Tarakeswar & Kavitha, 2011, p. 29.
  3. ↑ World-Wide Web Servers.
  4. ↑ What’s New.
  5. ↑ Oscar Nierstrasz.
  6. ↑ Archive of NCSA.
  7. ↑ Yahoo! And Netscape.
  8. ↑ Netscape, 1996.
  9. ↑ The dynamics of competition, 2001.
  10. ↑ Intro to Computer Science.
  11. 1 2 Google`s history.
  12. ↑ Брин и Пейдж, p. 3.
  13. ↑ Nigma.
  14. 1 2 3 Risvik & Michelsen, 2002, p. 290.
  15. 1 2 3 4 5 6 Knowledge Management, 2011.
  16. ↑ Tarakeswar & Kavitha, 2011, p. 29.
  17. ↑ NMS.
  18. ↑ Статистика.
  19. ↑ Naver.
  20. ↑ Age of Internet Empires.
  21. ↑ LiveInternet.
  22. ↑ Liveinternet
  23. 1 2 Antula.
  24. ↑ Where the Internet lives.
  25. ↑ World wide web size.
  26. ↑ Islam.
  27. ↑ I’mHalal
  28. 1 2 Halalblog
  29. ↑ ChristianNews.
  30. ↑ Pariser, 2011.
  31. ↑ Auralist, 2012, p. 13.
  32. ↑ Segev, 2010.
  33. 1 2 Search engine coverage bias, 2004.
  34. ↑ Replacement of Google.
  35. ↑ Shaping the Web, 2000.
  • Gandal, Neil. The dynamics of competition in the internet search engine market. — 2001. — Vol. 19. — P. 1103–1117. — DOI:10.1016/S0167-7187(01)00065-0.
  • Tarakeswar M. K., Kavitha M. D. Search Engines:A Study (англ.) // Journal of Computer Applications (JCA) : journal. — 2011. — Vol. 4, no. 1. — P. 29—33. — ISSN 0974-1925.
  • Vaughan L., Thelwall M. Search engine coverage bias: evidence and possible causes (англ.) // Information Processing & Management : journal. — 2004. — Vol. 40. — P. 693–707. — DOI:10.1016/S0306-4573(03)00063-3.

Ссылки[

URL — Википедия

Единый указатель ресурса (от англ. Uniform Resource Locator — унифицированный указатель ресурса, сокр.  URL [ˌjuː ɑːr ˈel]) — система унифицированных адресов электронных ресурсов, или единообразный определитель местонахождения ресурса (файла)[1].

Используется как стандарт записи ссылок на объекты в Интернет (Гипертекстовые ссылки во «всемирной паутине» www).

URL был изобретён Тимом Бернерсом-Ли в 1990 году в стенах Европейского совета по ядерным исследованиям (фр. Conseil Européen pour la Recherche Nucléaire, CERN) в Женеве, Швейцария. URL стал фундаментальной инновацией в Интернете. Изначально URL предназначался для обозначения мест расположения ресурсов (чаще всего файлов) во Всемирной паутине. Сейчас URL применяется для обозначения адресов почти всех ресурсов Интернета. Стандарт URL закреплён в документе RFC 3986. Сейчас URL позиционируется как часть более общей системы идентификации ресурсов URI, сам термин URL постепенно уступает место более широкому термину URI. Стандарт URL регулируется организацией IETF и её подразделениями.

В 2009 году Тим Бернерс-Ли высказал мнение об избыточности двойного слеша // в начале URL, после указания сетевого протокола[2].

Изначально локатор URL был разработан как система для максимально естественного указания на местонахождения ресурсов в сети. Локатор должен был быть легко расширяемым и использовать лишь ограниченный набор ASCII‐символов (к примеру, пробел никогда не применяется в URL). В связи с этим, возникла следующая традиционная форма записи URL:

<схема>:[//[<логин>[:<пароль>]@]<хост>[:<порт>]][/<URL‐путь>][?<параметры>][#<якорь>]

В этой записи:

схема 
схема обращения к ресурсу; в большинстве случаев имеется в виду сетевой протокол
логин 
имя пользователя, используемое для доступа к ресурсу
пароль 
пароль указанного пользователя
хост 
полностью прописанное доменное имя хоста в системе DNS или IP-адрес хоста в форме четырёх групп десятичных чисел, разделённых точками; числа — целые в интервале от 0 до 255.
порт 
порт хоста для подключения
URL-путь 
уточняющая информация о месте нахождения ресурса; зависит от протокола.
параметры 
строка запроса с передаваемыми на сервер (методом GET) параметрами. Начинается с символа ?, разделитель параметров — знак &. Пример: ?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3
якорь 
идентификатор «якоря» (англ.)русск. с предшествующим символом #. Якорем может быть указан заголовок внутри документа или атрибут id (англ.)русск. элемента. По такой ссылке браузер откроет страницу и переместит окно к указанному элементу. Например, ссылка на этот раздел статьи: https://ru.wikipedia.org/wiki/URL#Структура_URL.

Общепринятые схемы (протоколы) URL включают:

  • ftp — Протокол передачи файлов FTP
  • http — Протокол передачи гипертекста HTTP
  • rtmp — Real Time Messaging Protocol проприетарный протокол потоковой передачи данных, в основном используется для передачи потокового видео и аудиопотоков с веб-камер через интернет.
  • rtsp — Потоковый протокол реального времени.
  • https — Специальная реализация протокола HTTP, использующая шифрование (как правило, SSL или TLS)
  • gopher — Протокол Gopher
  • mailto — Адрес электронной почты
  • news — Новости Usenet
  • nntp — Новости Usenet через протокол NNTP
  • irc — Протокол IRC
  • smb — Протокол SMB/CIFS
  • prospero — Служба каталогов Prospero Directory Service
  • telnet — Ссылка на интерактивную сессию Telnet
  • wais — База данных системы WAIS
  • xmpp — Протокол XMPP (часть Jabber)
  • file — Имя локального файла
  • data — Непосредственные данные (Data: URL)
  • tel — звонок по указанному телефону

Экзотические схемы URL:

  • afs — Глобальное имя файла в файловой системе Andrew File System
  • cid — Идентификатор содержимого для частей MIME
  • mid — Идентификатор сообщений для электронной почты
  • mailserver — Доступ к данным с почтовых серверов
  • nfs — Имя файла в сетевой файловой системе NFS
  • tn3270 — Эмуляция интерактивной сессии Telnet 3270
  • z39.50 — Доступ к службам ANSI Z39.50
  • skype — Протокол Skype
  • smsto — Открытие редактора SMS в некоторых мобильных телефонах
  • ed2k — Файлообменная сеть eDonkey, построенная по принципу P2P
  • market — Android Маркет
  • steam — протокол Steam
  • bitcoin — Криптовалюта Биткойн
  • ob — OpenBazaar
  • tg — Telegram

Схемы URL в браузерах:

Стандарт URL использует набор символов US-ASCII. Это имеет серьёзный недостаток, поскольку разрешается использовать лишь латинские буквы, цифры и несколько знаков пунктуации. Все другие символы необходимо перекодировать. Например, перекодироваться должны буквы кириллицы, буквы с диакритическими знаками, лигатуры, иероглифы. Перекодирующая кодировка описана в стандарте RFC 3986 и называется URL-encoding, URLencoded или percent‐encoding.

Пример кодирования можно видеть в русскоязычной Википедии, использующей в URL русский язык. Например, строка вида:

https://ru.wikipedia.org/wiki/Википедия

кодируется как:

https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F

Реализация[править | править код]

Преобразование происходит в два этапа: сначала каждый символ кириллицы кодируется в UTF-8 в последовательность из двух байтов, а затем каждый байт этой последовательности записывается в шестнадцатеричном представлении с предшествующим знаком процента (%):

В → D0 и 92 → %D0%92
и → D0 и B8 → %D0%B8
к → D0 и BA → %D0%BA
и → D0 и B8 → %D0%B8, и т. д.

Все другие символы в URI кодируются.

Зарезервированные символы кодируются в таком соответствии:

! » #[5] $ % &[5] * + ,[5] :[5] ;[5] < =[5] > ?[5] [ ] ^ ` { | } <пробел>
%21 %22 %23 %24 %25 %26 %27 %2A %2B %2C %3A %3B %3C %3D %3E %3F %5B %5D %5E %60 %7B %7C %7D %20[6]

Кодирование параметров в Internet Explorer и старом Firefox происходит несколько иначе[7].

В некоторых случаях URL формируется с использованием кодирования Base58[8].

Стандарт IRI[править | править код]

Поскольку такому преобразованию подвергаются буквы всех алфавитов, кроме базовой латиницы, то URL со словами подавляющего большинства языков может стать нечитаемым для человека.

Это всё входит в противоречие с принципом интернационализма, провозглашаемого всеми ведущими организациями Интернета, включая W3C и ISOC. Эту проблему призван решить стандарт IRI (англ. Internationalized Resource Identifier) — международных идентификаторов ресурсов, в которых можно было бы без проблем использовать символы Юникода, и которые поэтому не ущемляли бы права других языков. Хотя заранее сложно сказать, смогут ли когда‐либо идентификаторы IRI заменить столь широко используемые URL (и URI в целом).

Формально, длина URL не ограничена, но браузеры имеют ограничения по длине URL. Не рекомендуется использовать URL длиной более 2048 символов, так как Microsoft Internet Explorer имеет именно такое ограничение[9].

Ещё один кардинальный недостаток URL состоит в отсутствии гибкости. Ресурсы во Всемирной паутине и Интернете перемещаются, а ссылки в виде URL остаются, указывая на уже отсутствующие ресурсы. Это особенно болезненно для электронных библиотек, каталогов и энциклопедий. Для решения этой проблемы были предложены постоянные локаторы PURL (англ. Persistent Uniform Resource Locator). В сущности это те же URL, но они указывают не на конкретное место расположения ресурса, а на запись в базе данных PURL, где, в свою очередь, записан уже конкретный URL‐адрес ресурса. При обращении к PURL сервер находит нужную запись в этой базе данных и перенаправляет запрос уже на конкретное местоположение ресурса. Если адрес ресурса меняется, то нет нужды исправлять все бесчисленные ссылки на него — достаточно лишь изменить запись в БД. В настоящий момент эта идея не стандартизирована и не имеет широкого распространения.

Разное

Отправить ответ

avatar
  Подписаться  
Уведомление о