Meta-теги
Все meta-теги записываются в заголовке web-странички - между тегами <head> и </head>. Желательно записывать meta-теги после тегов <title> и </title>.
Существует 2 типа meta-тегов, различающихся атрибутами и соответственно назначением:
- <meta http-equiv="имя" content="содержимое">;
- <meta name="имя" content="содержимое">.
Meta-теги с атрибутом <meta http-equiv= - эквивалентны http-заголовкам. Обычно они управляют действиями браузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками с сервера.
Теги такой формы могут дать такой же эффект, что и http-заголовки, и на некоторых серверах автоматически могут быть переведены в настоящие http-заголовки.
Теги с атрибутом <meta name= используются поисковыми роботами (пауками) при индексации сайта. Они участвуют в определении информации, которая будет занесена в базу данных поисковой системы.
Использование таких meta-тегов увеличивает шансы попадания сайта, посвященного например автомобилям, ближе к началу списка после запроса на поиск слова "автомобиль".
Как правило, поисковые машины еще и анализируют текст странички, а так же значения атрибутов alt (описание того, что показано на изображении) тега IMG. Поэтому значения meta-тегов с атрибутом name должно соотносится с содержимым сайта.
Некоторые наглядные примеры meta-тегов:
Refresh (значение атрибута content) - время (в секундах), после которого, браузер автоматически произведет обновление документа. Аналогично нажатию кнопки Обновить (F5) в браузере. Страница с таким meta-тегом будет автоматически обновляться через указанное количество секунд:
<meta http-equiv="Refresh" content="30">
Кроме того, используя дополнительный параметр (URL) в атрибуте content, можно задать перенаправление пользователя на другой адрес:
<meta http-equiv="Refresh" content="30; url=http://gonchij1.livejournal.com/"> - через 30 секунд обеспечит автоматический переход на страницу http://gonchij1.livejournal.com.
Перенаправление (редирект) применяется в случае, если сайт сменил адрес. Тогда на сервере со старым адресом Вы оставляете (как правило в файле index.htm или index.html) предупреждение о переезде сайта, а в заголовке используете вышеприведенный meta-тег.
Content-type - тип документа. Может быть расширено указанием кодировки страницы (charset). Если указать charset в содержании meta-тега, то браузер выведет web-страницу в кодировке, заданной в charset:
<meta http-equiv="content-type" content="text/html; charset=KOI8-R"> - отбражение браузером текста страницы в кодировке KOI8-R.
Использовать возможность жесткой установки кодировки следует внимательно - если в meta-теге задана одна кодировка, а страничка написана в другой, бывает очень сложно перевести такую страничку в читаемый вид. Например создаете страничку в Блокноте - в кодировке Windows и соответственно прописываете в meta-теге эту кодировку: windows-1251. Тестируете - все нормально. Но на сервере, где располагается Ваш сайт, все документы находятся в кодировке KOI8-R и при копировании на сервер через протокол FTP все записи автоматически - кодируются в эту кодировку. А в meta-теге указана кодировка Windows...
Viewport - сообщает браузеру, как обрабатывать размеры и масштаб страницы. Необходим для адаптации страниц, при их просмотре с мобильного устройства имеющего малый экран.
- width=device-width - ширина страницы выбирается в соответствии с размером экрана устройства;
- initial-scale=1 - заставит браузер установить соответствие 1:1 независимо от ориентации устройства.
<meta name="viewport" content="width=device-width, initial-scale=1">
Лучше избегать значений:
- minimum-scale;
- maximum-scale;
- user-scalable.
Указанные значения позволяют установить минимальный и максимальный масштаб (лишь для одного вида устройств), или соответственно вовсе отключить масштабирование страницы.
Expires - дата устаревания страницы (для протокола http). Если указанная дата прошла, то содержимое странички загружается с сервера, а не из кеша браузера.
Зачастую в данной директиве указывают заведомо устаревшую дату - чтобы избежать кеширования документа:
<meta http-equiv="Expires" content="Wed, 26 Feb 1997 08:21:57 GMT">
Дата со значением 0 - интерпретируется как сейчас. Такое значение заставляет браузер каждый раз при запросе проверять - изменялся ли этот документ.
Поисковые роботы могут либо совсем не индексировать такой документ, либо проверять его постоянно.
Дата должна быть задана в определенном [RFC850] формате, указанном в примере.
Cache-Control - определяет как будет работать механизм кеширования в документе. Возможные значения:
- Public - документ кешируется в доступных для всех кешах;
- Private - кешируется только в частном кеше;
- No-cache - документ не может быть кеширован;
- No-store - может быть кеширован, но не сохраняется.
<meta http-equiv="Cache-Control" content="Public">
Ext-cache - имя расширенного (альтернативного) кэша для браузера:
<meta http-equiv="Ext-cache" content="name=/some/path/index.db; istructions=User Instructions">
Pragma - Контроль кэширования. Если Вы хотите принципиально избежать кеширования, установите значение "no-cache":
<meta http-equiv="Pragma" content="no-cache">
Этот тег не влияет на поисковых роботов. Он может быть нужен пользователям. Например если у вас есть сайт с часто меняющимся содержанием, то Pragma будет обеспечивать пользователю загрузку самой последней версии страницы. При этом естественно время загрузки страницы будет несколько увеличено, как соответственно повысится и нагрузка на сервер.
Content-language - язык документа. Может использоваться поисковыми машинами при индексировании страниц. Комбинация поля Accept-Language (посылаемого браузером) с содержимым content-language может быть условием выбора сервером того или иного варианта языка.
Язык описывается парой значений (язык-диалект):
<meta http-equiv="content-language" content="en-GB"> - здесь Английский-Великобритания.
Однако в спецификации HTML 4.0 имеется и другая (более краткая) возможность явного указания языка: <html lang="en">
Window-target - окно для текущей страницы. Может быть использован для прекращения появления новых окон браузера при применении фреймовых структур. Действует не для всех браузеров:
<meta http-equiv="Window-target" content="_top">
Set-Cookie - cookie браузера:
<meta http-equiv="Set-Cookie" content="name=value; expires=date; domain=domain_name; path=path; secure">
Pics-label - Platform-Independant Content rating Scheme - Обычно используется для определения рейтинга "взрослости" (adult) содержания:
<meta http-equiv="PICS-Label" content='(PICS-1.1 "http://q2212.narod.ru/Index.html" LR (s 0))'> - безопасно для детей;
<meta http-equiv="PICS-Label" content='(PICS-1.1 "http://q2212.narod.ru/Index.html" LR (s 1))'> - под надзором родителей;
<meta http-equiv="PICS-Label" content='(PICS-1.1 "http://q2212.narod.ru/Index.html" LR (s 2))'> - только для взрослых.
Эта схема ограничений постепенно внедряется в современные браузеры. Маркировка должна осуществляться специальными службами - labeling services. Здесь возможны два варианта:
- Специалисты Labeling Services осуществляют оценку содержания сайта и заносят ее в свою базу данных, интегрированную с web-сервером;
- Разработчик сайта сам заполняет для Labeling Services специальную форму и тем самым генерирует соответствующий тэг meta http-equiv="PICS-Label" content=...>. Такая возможность бесплатно предоставляется, например на сервере Vancouver-Webpages.
Audience - целевая аудитория сайта. Если для взрослых, то следует установить в атрибуте content значение adults. Если для всех - all. Многие поисковые системы (кроме специализированных) не регистрируют веб-страницы со значением adults:
<meta name="audience" content="all">
Vary - доступные альтернативы для указанных в content полей http-заголовка:
<meta http-equiv="Vary" content="content-language">
Robots - управляет индексацией страницы для поисковых роботов. Возможны следующие значения:
- all - разрешена индексация всех страниц;
- none - индексация запрещена;
- index - разрешена индексация индексных страниц;
- noindex - запрещена индексация индексных страниц;
- follow - разрешено следовать по ссылкам данной страницы;
- nofollow - запрещено следовать по ссылкам данной страницы.
Например:
<meta name="Robots" content="noindex,follow"> - означает, что данную страницу индексировать не надо, а следовать по ссылкам с данной страницы (для изучения других страниц) можно.
Этот meta-тег может и не поддерживаться поисковой системой. В этом случае рекомендуется создать отдельный файл robots.txt, в котором и прописать разрешения и запреты на индексацию - согласно указаниям, с которыми уже следует ознакомиться на сайте самой поисковой системы.
Revisit (или Revisit-after) - как часто обновляется информация на Вашем сайте, и соответственно - как часто поисковая система должна на него заходить чтобы увидеть обновления. Значение прописывается в днях - от 1 до 30:
<meta name="revisit" content="15">
<meta name="revisit-after" content="15 days">
В действительности поисковые роботы посещают сайт по своему усмотрению.
Document-state - управление индексацией страницы для поисковых роботов. Определяет частоту индексации - индексировать один раз (Static), или регулярно (Dynamic):
<meta name="document-state" content="Dynamic">
Url - каким образом необходимо индексировать документ. Значение атрибута content может быть например: absolute_url:
<meta name="url" content="absolute_url">
Description (значение атрибута content) - текстовое описание (краткую аннотацию) страницы. Рекомендуется ограничиться кратким - до 100 символов - описанием, поскольку поисковые машины, в большинстве случаев, имеют ограничение на количество индексируемых символов.
Может помочь в случаях, когда в документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты:
<meta name="description" content="Данный сайт содержит информацию о жизни бездомного">
Keywords (значение атрибута content) - список ключевых слов - как правило через запятую - соответствующих содержимому сайта. Рекомендуется ограничиться списком до 30 слов. Можно поместить и наиболее частые опечатки ключевых слов. Также можете здесь записать и английские слова, соответствующие содержимому сайта:
<meta name="keywords" content="вся, правда, бездомной, жизни">
Abstract (значение атрибута content) - описание содержимого сайта и перечня ключевых выражений - через запятую.
Иногда используется поисковыми роботами с нестандартными алгоритмами индексации:
<meta name="abstract" content="борьба за выживание">
Subject (значение атрибута content) - выраженная несколькими словами главная тема сайта.
Практически бесполезен из-за отсутствия согласованной классификации тем в разных поисковых системах:
<meta name="subject" content="выживание">
Page-type (значение атрибута content) - тематическая группа, в которую будет занесен сайт. Но поскольку в поисковых системах может быть разная классификация, то можете указать information resourse:
<meta name="page-type" content="жизнь">
Distribution - область действия информации. Есть три классификации распределения, которые состоят из:
- Global - страница предназначена для всех;
- Local - зарезервирована для локального блока IP Вашего сайта;
- IU (internal use) - внутреннее использование - не для распространения.
<meta name="Distribution" content="Global">
Не рекомендуется использовать этот мета-тег. Если уж хотите иметь ограниченное распространение вашего сайта, лучше используйте файл robots.txt.
Rating - рейтинг - подобно рейтингам фильмов. По сути примерно то же, что и предыдущий (distribution), лишь в атрибуте content указывается (при условии что информация для всех) значение General:
<meta name="Rating" content="General">
Title - название страницы. Как правило, имеют те же названия, что и в <title></title> "шапки" страницы (документа):
<meta name="title" content="Meta-теги">
Предположительно некоторые поисковые системы (например Yahoo! и MSN) индексируют метатег title, но его влияние на алгоритм поиска неизвестно.
Page-topic - аналогичен вышеуказанному (Title). Название/тема страницы. Предназначен для поисковых машин не умеющих обрабатывать значение тега Title. Но наверно таких поисковых машин уже нет:
<meta name="page-topic" content="Meta-теги">
Site-created (значение атрибута content) - дата создания сайта:
<meta name="site-created" content="30.06.2010"> - указывает на то, что сайт Бездомная война создан 30 июня 2010 года.
Resource-type - тип документа (страницы). Если его значение document, то поисковая система приступает к его индексированию. Возможны следующие значения:
- Build;
- Classification;
- Creation;
- Document;
- Formatter;
- Host;
- Operator;
- Random text;
- Rating;
- Site-languages;
- Subject;
- Template;
- Version.
<meta name="Resource-type" content="Document">
Если тип отличен от Document - страница не индексируется.
Author и Copyright - авторские права. Обычно эти теги не используются одновременно. Тег Author содержит имя автора Интернет-страницы. Если же сайт принадлежит организации, целесообразнее использовать тег Copyright.
Кроме этого, теги Author и Copyright могут содержать дополнительный атрибут lang, указывающий на язык:
<meta name="author" content="Виктор Борисов">
<meta name="copyright" lang="ru" content="ООО Виктор Борисов">
Reply-to - адрес электронной почты для связи с автором. Иногда отображается в результатах поиска некоторых поисковых систем:
<meta http-equiv="Reply-to" content="q2212@yandex.ru">
Owner (Владелец) - полное имя владельца (частного лица) или названия фирмы:
<meta name="owner" content="Борисов Виктор Евгеньевич">
Address - адрес офиса, где предоставляется дополнительная информация:
<meta name="address" content="тайга">
Owner-type - тип компании:
- Corporation - крупная корпорация;
- Company/small - небольшая фирма;
- Personal - физическое лицо (или частный предприниматель).
<meta name="owner-type" content="personal">
Publisher-name - информация о тех, кто занимался опубликованием сайта. Бывает что публикует сайт не автор (или даже не владелец), а например издатель:
<meta name="publisher-name" content="Виктор Борисов, автор">
Publisher-type - тип издательской компании:
- Corporation - крупная корпорация;
- Company/small - небольшая фирма;
- Personal - физическое лицо (или частный предприниматель):
<meta name="publisher-type" content="personal">
Publisher-location - домен (доменная зона) страны, где был опубликован сайт. Для России например - это RU. Для США - US:
<meta name="publisher-location" content="ru">
Home-url - адрес домашней странички (url) разработчика сайта. Обычно указывается ссылка на ресурс разработчика - когда сайт создавался для стороннего заказчика. Таким образом, информация из этой строки может помочь потенциальным клиентам найти тех, кто разрабатывал этот сайт:
<meta name="home-url" content="http://q2212.narod.ru/Index.html">
Generator - имя и версия html-редактора, в котором создана данная страничка. Этот тег изобрели разработчики html-редакторов в качестве рекламного средства своих программ. Соответственно почти все визуальные html-редакторы для собственной рекламы автоматически подставляют этот meta-тег в html-код страницы. Наличие данного тега как абсолютно безвредно для документа, так и бесполезно:
<meta name="generator" content="Mobile TextEditor-11.jar">
Существуют и могут быть многие другие meta-теги. Разрешается создание и использование произвольных значений атрибута name и соответствующего ему значения, записанного в атрибуте content.
Карта сайта
Мой адрес Электронной почты: q2212@yandex.ru
Номер моего мобильного телефона: +79030100732