Что такое URL: понятия, особенности и рекомендации по созданию
Что такое URL: понятия, особенности и рекомендации по созданию

Что такое URL: понятия, особенности и рекомендации по созданию

Знакомство с каждой веб-страницей начинается с адреса в строке браузера. Простой, информативный и логичный URL легче воспринимается пользователями. Это положительно влияет на позицию сайта в поисковой выдаче, увеличивает узнаваемость компании и трафик. А значит, правильный выбор URL-адреса позволяет без особых затрат увеличить прибыль.

Новости технологий, IT и бизнеса. Полезные и вдохновляющие истории.

Каждый день в нашем Telegram-канале. Подписывайтесь! 🙂

Редакция MC.today разобралась, что такое URL, как его правильно генерировать, и какие рекомендации при работе с ним следует учитывать.

Содержание

  • Что такое URL
  • История URL адреса
  • Структура URL адреса
  • Виды URL
  • Форматы URL
  • Кириллические URL и URL-шифрование
  • Человекопонятные URL
  • Рекомендации по созданию URL

Что такое URL

URL – это адрес любого ресурса во Всемирной паутине: сайта, веб-страницы, видео, документа или файла для загрузки. Аббревиатура расшифровывается, как Uniform Resource Locator, или «всеобщий указатель ресурсов». Зная этот код, пользователь может открыть нужный ему сайт, найти файл или поделиться с кем-нибудь ссылкой. 

Определить URl-адрес веб-страницы просто – достаточно посмотреть на адресную строку браузера. Например, адрес страницы, которую вы читаете, выглядит так:  https://mc.today/chto-takoe-url/. ‎Если вам нужно его скопировать, нажмите на значок «Поделиться этой страницей» и выберите в выпадающем меню пункт «Копировать ссылку».

Курс
Для новичков в ІТ
Получи востребованную профессию и работу в IT компании. Онлайн обучение с помесячной оплатой за курс
РЕГИСТРИРУЙТЕСЬ!
Что такое URL: понятия, особенности и рекомендации по созданию - Фото 1

История URL адреса

В 1989 году программист международного центра высоких энергий в Женеве Тим Бернерс-Ли предложил проект Всемирной паутины, или World Wide Web. Идея состояла в том, чтобы создать систему взаимосвязанных гипертекстовых документов, которые расположены на компьютерах по всему миру. 

Тим Бернерс-Ли

Тим Бернерс-Ли

Для реализации замысла Тиму и его помощникам пришлось разработать три технологии, благодаря которым появилось то, что мы сегодня считаем интернетом. Это HTTP, HTML и URL.

Протокол  HTTP позволяет передавать файлы между клиентом и сервером. Язык гипертекстовой разметки HTML помогает создавать документы, которые ссылаются друг на друга. А URL дает надежный способ ссылаться на файл. Для этого в него входит информация о протоколе передачи данных, местонахождении сервера в интернете и файла на этом сервере.

Первый в мире веб-сайт Бернерс-Ли создал 20 декабря 1990 года по адресу http://info.cern.ch (теперь он находится в архиве). В 1994 году он же выложил в сеть официальный стандарт технологии URL. А в 1996 году браузеры научились добавлять http:// и www. за пользователей автоматически.

Структура URL адреса

URL состоит из различных частей. Одни из них являются обязательными в любом адресе, другие используют в зависимости от типа запроса. На сайте веб-документации MDN анатомию URL иллюстрируют таким примером:

Протокол

Протокол

Протокол

Наверное, вы заметили, что адреса многих сайтов начинаются с последовательности символов http:// – это протокол. Его можно сравнить с языком, на котором общаются через Интернет компьютеры. Чаще всего встречается HTTP-протокол или его безопасная версия – HTTPS. Однако существуют и менее известные протоколы, такие как ftp: для передачи файлов, или mailto:, который открывает почтовый клиент.

Доменное имя

Основная часть URL-адреса – доменное имя. В нашем случае это www.example.com. Доменное имя состоит из префикса, например, www., названия сайта и расширения домена, например, .com. Префикс www указывает на функциональное значение домена. В данном случае это веб-сервер. Для ftp-сервера запись выглядела бы ftp.example.com. А для почтового сервера – mail.example.com.

Расширения домена также известны как доменные зоны, или домены верхнего уровня (Top Level Domains). Они бывают национальными и общими. Национальные домены выделены для конкретных стран и состоят из двух букв. Например, .ua значит – Украина, .uk – Великобритания, .me – Черногория и так далее. 

Наиболее распространены общие домены, которые, как правило, состоят из трех букв. Например, .com, .org, и .net. Каждый из них используется для сайтов определенной тематики. Для бизнеса – .com, для некоммерческих организаций – .org, для интернет-компаний – .net.

Доменные имена помогают браузерам находить веб-серверы. Однако тут не всё просто. Дело в том, что компьютеры оперируют адресами из чисел. Так, например, «компьютерный», или IP-адрес сайта MC.today выглядит так: 188.114.98.224. Понятно, что запоминать такие адреса людям было бы крайне неудобно. 

Запрос к DNS-серверу

Запрос к DNS-серверу

Поэтому, когда вы вводите в браузере название сайта, он сначала обращается к специальной базе данных, которую называют система доменных имен (DNS). Там домен MC.today превращается в 188.114.98.224, и браузер получает фактический адрес сайта, по которому его можно найти в сети.

Порт

Порт

Порт

В нашем примере порт :80 – это технический параметр, который помогает системе определить, от кого поступили данные и какой программе их передать дальше. Обычно веб-сервер использует порт 80 для протокола HTTP и порт 443 для HTTPS.

Путь к ресурсу на веб-сервере

Адрес /path/to/myfile.html определяет расположение ресурса на веб-сервере. В данном случае файл myfile.html находится в папке to, которая вложена в папку path.

Запрос

Запрос в URL-адресе

Запрос в URL-адресе

Запрос – это часть URL после знака «?» Эта информация нужна для передачи дополнительных данных на сервер. Например, если в поиске интернет-магазина stylus.ua ввести слово «samsung», то адрес URL поменяет вид на https://stylus.ua/uk/search?q=samsung.

Якорь

Якорь в URL-адресе

Якорь в URL-адресе

Якорем называют идентификатор, который используется для перемещения к определенной части страницы. Обычно он расположен в конце URL-адреса после символа #. Так, например, ссылка на эту часть статьи выглядит так: 

Виды URL

URL-адреса веб-страниц могут быть статическими и динамическими.

  • Статический URL это постоянный адрес, который остается неизменным, пока владелец сам не внесет в него какие-нибудь изменения. Пример: https://mc.today/uk/category/korisni-teksti/
  • Динамический URL генерируется в ответ на запросы пользователей и содержит разделительные символы «?», «=», «&», после которых указаны дополнительные параметры страницы. Динамические адреса можно увидеть, когда пользователи применяют фильтры в интернет-магазинах или пользуются поиском по сайту. Например, в результате поиска по слову IT получаем https://mc.today/uk/?cat=19200&s=IT 

Форматы URL

Транслитерация

Веб-стандарт RFC3986 определяет список разрешенных и запрещенных для использования в URL символов. К запрещенным в частности относятся пробелы и кириллические символы. Поэтому владельцы сайтов в Украине широко используют транслитерацию.

К примеру, адрес этой страницы https://mc.today/chto-takoe-url/. Сразу понятно, что она отвечает на вопрос «Что такое URL?» Адреса, которые получены с помощью транслитерации легко читать и запоминать. Кроме этого поисковые системы легко распознают в них ключевые слова, что положительно влияет на продвижение сайтов.

Латиница

Еще один способ замены кириллических знаков в URL – перевод слов на английский. Фразу «что такое» в этом случае следует заменить на «what is». Этот вариант легко распознается поисковыми роботами, но может быть понятен не всем пользователям.

Кириллические URL и URL-шифрование

Рабочая группа по доменным именам на национальных языках (IDN) начала работу в 1999 году. Чтобы не разрабатывать новую систему доменных имен, там придумали кодировку, которая шифрует символы других алфавитов с помощью уже доступных. 

Ее назвали Punycode и постепенно внедрили в популярные браузеры. Однако за эти годы кириллические домены так и не стали популярны. С одной стороны, они лучше запоминаются и позволяют использовать в URL ключевые фразы. С другой – имеют ряд серьезных недостатков.  

  1. Как мы уже говорили, запись URL-адресов возможна определенными символами. Поэтому при копировании и вставке кириллического URL в сообщение он шифруется. В результате вы получите длинный набор непонятных знаков. Не каждый отважится перейти по такой ссылке, так как ее сложно отличить от спама.
  2. Создать адрес электронной почты в формате «@домен.укр» не получится. Он будет выглядеть, как «@xn--d1acufc.xn--j1amh». 
  3. Кириллические адреса тяжело распознавать поисковым роботам, что негативно влияет на SEO.

Человекопонятные URL

Google и другие поисковые системы советуют использовать при создании сайтов понятные для пользователей адреса. Такие URL называют семантическими, человекопонятными или просто ЧПУ. Они состоят из логических частей, содержат информацию о текущей веб-странице и отображают ее место в структуре сайта.

Несемантические адреса, напротив, состоят из адреса сайта, названия скрипта (набора команд) и строки запроса. При этом часто содержат данные, не имеющие смысла для обычного пользователя. Это могут быть цифровые индикаторы содержания, номер сессии, кодированные данные и так далее.

Например, по адресу https://example.com/viewpage.php?category_id=13 сложно сделать какой-то вывод о содержании страницы. Зато семантический адрес https://example.com/news/2022 сразу говорит нам, что это раздел с новостями за 2022 год. При этом понятно, что если подняться на уровень выше, то можно посмотреть новости за другие годы. Человекопонятные URL имеют ряд преимуществ:

  • Позволяют оценить контент еще до перехода по ссылке.
  • Легко читаются и запоминаются. Поэтому их можно передать кому-нибудь даже устно.
  • В ЧПУ легко ввести ключевые фразы.
  • Семантические ссылки обеспечивают ускоренную и интуитивно понятную навигацию по сайту. Зачастую пользователю достаточно удалить часть адреса, чтобы перейти к нужному разделу.

Есть ряд правил, которые нужно соблюдать, чтобы сформировать на сайте правильные ЧПУ:

  • Использовать транслитерацию по заранее согласованным правилам. Добавим, что правила транслитерации украинского алфавита латиницей установлены постановлением Кабинета Министров Украины N 55 от 27 января 2010 года.
  • Заменять пробелы и знаки препинания на дефис или нижнее подчеркивание.
  • Не использовать в адресах заглавные буквы.
  • По возможности делать адреса короткими.

Рекомендации по созданию URL

Чтобы выбрать хороший адрес сайта, нужно учесть множество факторов. Часть из них описана в разделе по оптимизации URL справки Google. 

  • Основной частью URL-адреса является доменное имя. Идеально, если оно будет коротким и запоминающимся. Желательно также, чтобы оно воспринималось на слух так же, как пишется. Лучше не использовать в названии буквы, которые можно ввести несколькими способами. Например, ц (c или ts), в (v или w), я (ya или ja)  и так далее. 
  • Используйте в URL ключевые слова. Поисковые системы учитывают этот фактор при сортировке сайтов в результатах поиска. 
  • Общая длина URL не должна превышать 80 символов. Более длинные ссылки в поисковой выдаче обрезаются на средине.
  • Если подраздел сайта находится далеко от главной страницы, то его URL может быть слишком длинным. Поэтому в некоторых случаях лучше убрать из адреса упоминания о разделах и  категориях.
  • Если ваш сайт посещают люди из разных регионов, используйте структуру URL, которая указывает на регион страниц. Рекомендуется использовать домен страны, например, example.ua. Или подкаталог с указанием на конкретную страну, например, example.com/ua/.
  • Слова в веб-адресе лучше разделять знаком дефиса «-», а не нижним подчеркиванием «_».
  • Не рекомендуется использовать в URL символы, не относящиеся к кодировке ASCII. Например, https://www.example.com/杂货/薄荷.

В популярных видах бизнеса самые короткие и красивые домены могут быть уже заняты. И если с формированием URL возникли сложности, на помощь придут сервисы для генерации доменных имен. Например, Instant Domain Search или DomainWheel

Пример генерации доменных имен со словом «car»

Пример генерации доменных имен со словом «car»

Может случиться, что вы придумали идеальный домен, но он уже кем-то занят. Не стоит расстраиваться. Можно выкупить домен у владельца, перехватить его продление, если владелец забудет сделать это вовремя, или подобрать другую доменную зону.

Итак, мы выяснили, что URL-адрес – это адрес любого веб-сайта, страницы или файла во Всемирной паутине. URL состоит из обязательных и опциональных частей. Адреса большинства сайтов состоят из доменного имени и протокола. При этом протоколы HTTP/HTTPS браузеры подставляют автоматически, поэтому указывать их необязательно.

Самый удобный формат адресов – семантический. Он позволяет пользователям заранее понять, какая информация находится на странице, легко запоминается, может содержать ключевые фразы, облегчает навигацию по сайту. При создании URL-адреса для сайта следует придерживаться ряда правил, с которыми можно ознакомиться в справочном центре Google.

Источник материала
loader