DbfWebServer. Способ эффективной работы с таблицами DBFв среде Интернет - А. Шевелёв 7 стр.


Краткое введение в SGML

SGML  это система определения языков разметки. Авторы размечают свои документы, представляя информацию о структуре, представлении и семантике в одном документе. HTML является одним из примеров языка разметки. Вот пример документа на языке HTML:


<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0//EN»

«http://www.w3.org/TR/REC-html40/strict.dtd">

<HTML>

<HEAD>

<TITLE> My first HTML document </TITLE>

</HEAD>

<BODY>

<P> Hello world!

</BODY>

</HTML>

Документ HTML состоит из раздела заголовка (здесь  между тэгами <HEAD> и </HEAD>) и тела (здесь  между заголовками <BODY> и </BODY>). Заголовок документа отображается в заголовке (вместе с другой информацией о документе), а содержимое документа находится в теле. В этом примере тело документа состоит только из одного абзаца, помеченного <P>.

Конструкции SGML, используемые в HTML

Элементы

Определение типа документа. SGML объявляет типы элементов, представляющие структуры или желательное поведение. HTML включает типы элементов, представляющие абзацы, гипертекстовые ссылки, списки, таблицы, изображения и т. д.

Каждое объявление типа элемента обычно включает три части: начальный тэг, содержимое и конечный тэг.

Имя элемента отображается в начальном тэге (пишется <имя-элемента>) и в конечном тэге (пишется </имя-элемента>); не забывайте про слеш перед именем элемента в конечном тэге. Например, начальные и конечные тэги элемента UL определяют список:

<UL>

<LI> <P> элемент списка 1

КОНЕЦ ОЗНАКОМИТЕЛЬНОГО ОТРЫВКА

<LI> <P> элемент списка 2

</UL>

Некоторые типы элементов HTML позволяют авторам опускать конечные тэги (например, типы элементов P and LI). Несколько типов элементов также позволяют опускать начальные тэги; например, HEAD и BODY. HTML DTD указывает для каждого типа элемента, являются ли начальный и конечный тэги обязательными.

Некоторые типы элементов HTML не имеют содержимого. Например, элемент перехода на следующую строку BR не имеет содержимого; его роль  прерывание строки текста. Такие пустые элементы никогда не имеют конечных тэгов. Определение типа документа и текст спецификации указывают, является ли тип элемента пустым (не имеет содержимого) или, если он может иметь содержимое, что является допустимым содержимым.

Имена элементов всегда учитывают регистр.

Информацию о правилах, управляющих элементами (например, что они могут быть вложенными соответствующим образом, конечный тэг закрывает все опущенные начальные тэги вплоть до соответствующего ему начального тэга и так далее), смотрите в стандарте SGML.

Например, следующий абзац:

<P> Это первый абзац. </P>

элемент блока

можно перезаписать без конечного тэга:

<P> Это первый абзац.

элемент блока

поскольку начальный тэг <P> закрывается следующим элементом блока. Точно так же записывают, если абзац включен в элемент блока, например:

<DIV>

<P> Это абзац.

</DIV>

конечный тэг включающего элемента блока (здесь  </DIV>) служит также конечным тэгом открытого начального тэга <P>.

Элементы  это не тэги. Иногда элементы называют тэгами (например, «тэг P»). Помните, что элемент  это одно, а тэг (не имеет значения, признак начала или конца)  другое. Например, элемент HEAD всегда присутствует, даже если начальный и конечный тэги HEAD отсутствуют.

Атрибуты

С элементами могут быть связаны свойства, называемые атрибутами, которые могут иметь значения (стандартные или устанавливаемые авторами или сценариями). Пары атрибут/значение помещаются перед закрывающей скобкой ">" начального тэга элемента. В начальном тэге элемента может содержаться любое число (допустимых) пар атрибут/значение, разделенных пробелами. Они могут указываться в любом порядке.

В данном примере для элемента H1 установлен атрибут id:

<H1 id=«section1»>

В результате имеем маркированный заголовок, благодаря атрибуту id </H1>.

По умолчанию в SGML необходимо, чтобы все значения атрибутов были разделены с помощью двойных (десятичный код ASCII 34) или одинарных (десятичный код ASCII 39) кавычек. Одинарные кавычки могут включаться в значение атрибута, если значение отделяется двойными кавычками, и наоборот. Авторы могут также использовать цифровые ссылки на символы для представления двойных (&#34;) и одинарных (&#39;) кавычек. Для двойных кавычек авторы могут также использовать character entity reference &quot;.

В определенных случаях авторы могут указывать значение атрибута без кавычек. Значение атрибута может включать только буквы (a  z и A  Z), цифры (0  9), знаки переноса (десятичный код ASCII 45) и точки (десятичный код ASCII 46). Рекомендуется всегда использовать кавычки.

Имена атрибутов всегда учитывают регистр.

Значения атрибутов обычно учитывают регистр. Через определение каждого атрибута в списке атрибутов указывается, учитывать ли значение регистра.

Список всех атрибутов, определенных в этой спецификации, приводится в указателе атрибутов [10,11].

Ссылки на символы

Ссылки на символы  это числовые или символьные имена символов, которые могут быть включены в документ HTML. Они удобны для обращения к редко используемым символам или к символам, которые трудно или невозможно вводить в средствах разработки документов. Вы увидите ссылки на символы в этом документе; они начинаются со знака "&" и заканчиваются точкой с запятой (;).

Вот некоторые примеры:

 &lt; представляет знак <.

 &gt; представляет знак>.

 &quot; представляет знак».

 &#229; (десятичное число) представляет букву «a» с кружком сверху.

 &#1048; (десятичное число) представляет кириллическую букву «I».

 &#x6C34; (шестнадцатеричное число) представляет китайский знак воды.


Ссылки на символы в HTML подробно обсуждаются далее в разделе под заголовком «набор символов документа HTML». В спецификации также содержится список ссылок на символы, которые могут использоваться в документах в формате HTML 4.0.

КОНЕЦ ОЗНАКОМИТЕЛЬНОГО ОТРЫВКА

Комментарии

Комментарии в HTML имеют следующий синтаксис:

<!  это комментарий  >,

<!  это тоже комментарий, он занимает несколько строк  >.

Пробелы между открывающим разделителем разметки (» <!») и открывающим разделителем комментария (»  ») недопустимы, но их можно использовать между закрывающим разделителем комментария (»  ») и закрывающим разделителем разметки (»>»). Распространенной ошибкой является включение в комментарий строки символов переноса (»  -»). Следует избегать использования в комментариях двух или более символов переноса.

Информация в комментариях не имеет специального значения (например, ссылки на символы не интерпретируются).

Что такое World Wide Web

World Wide Web (Web)  это сеть информационных ресурсов. Для того чтобы сделать эти ресурсы доступными наиболее широкой аудитории, в Web используются три механизма:

1). единая схема наименования для поиска ресурсов в Web (например, URI);

2). протоколы для доступа к именованным ресурсам через Web (например, HTTP);

3). механизм гипертекста для перемещения по ресурсам (например, HTML).

Связи между этими тремя механизмами становятся очевидными по прочтении этой спецификации.

Введение в URI

Каждый ресурс в Web  документ HTML, изображение, видеоклип, программа и т. д.  имеет адрес, который может быть закодирован с помощью универсального идентификатора ресурсов (Universal Resource Identifier), или URI.

URI обычно состоит из трех частей:

1). схема наименования механизма, используемого для доступа к ресурсу;

2). имя машины, на которой располагается ресурс;

3). имя собственно ресурса, заданное в виде пути.

Рассмотрите URI этой спецификации HTML на сервере ixBbase:

http://ixbase.info/ixbase/index.html

Этот URI может читаться следующим образом: этот документ можно получить по протоколу HTTP (см. [RFC2068]), он располагается на машине ixbase.info, путь к этому документу  /ixbase/index.html». Кроме того, в документах в формате HTML Можно увидеть схемы «mailto» для электронной почты и «ftp» для протокола FTP.

Вот еще один пример URI. Он относится к почтовому ящику пользователя:

текст

Комментарии отправляйте <A href=mailto:ixbase@msn.com»> A.Shevelev </A>.


Примечание. Большинство читателей уже знакомо с термином «URL», но не знает термина «URI». URL образуют подмножество более общей схемы наименования URI.

Идентификаторы фрагментов

Некоторые URI указывают на местоположение внутри ресурса. Этот тип URI заканчивается символом «#», за которым следует указатель (идентификатор фрагмента). Например, следующий URI указывает на фрагмент с именем section_2:

http://somesite.com/html/top.html#section_2.

Относительные URI

Относительный URI не содержит информации о схеме наименования. Путь в нем указывает на ресурс на машине, на которой находится текущий документ. Относительные URI могут содержать компоненты относительного пути (например,»..» означает один уровень выше в иерархии) и идентификаторы фрагментов.

Относительные URI приводятся к полным URI с помощью базового URI. В качестве примера приведения относительного URI предположим, что у нас имеется базовый URI http://www.acme.com/support/intro.html. Относительный URI в ссылке

<A href="suppliers.html»> Suppliers </A>

будет преобразован в полный URI http://www.acme.com/support/ suppliers.html», а относительный URI в фрагменте

<IMG src=../icons/logo.gif» alt=«logo»>

будет преобразован в полный URI

«http://www.acme.com/icons/logo.gif.

В HTML URI используются для:

 ссылки на другие документы или ресурсы (см. элементы A и LINK);

 ссылки на внешние таблицы стилей или скрипты (см. элементы LINK и SCRIPT);

 включения в страницу изображений, объектов или апплетов (см. элементы IMG, OBJECT, APPLET и INPUT);

 создания изображений-карт (см. элементы MAP и AREA);

 отправки форм (см. FORM);

 создания документов с использованием кадров (см. элементы FRAME и IFRAME);

 ссылок на внешние источники (см. элементы Q, BLOCKQUOTE, INS и DEL);

 ссылок на соглашения о метаданных, описывающих документ (см. элемент HEAD).

Подробнее об URI см. в разделе о типах URI.

Что такое HTML

Чтобы представить информацию для глобального использования, нужен универсальный язык, который понимали бы все компьютеры. Языком публикации, используемым в World Wide Web, является HTML (HyperText Markup Language  язык разметки гипертекстов).

HTML дает авторам средства для:

 публикации электронных документов с заголовками, текстом, таблицами, списками, фотографиями и т.д.;

КОНЕЦ ОЗНАКОМИТЕЛЬНОГО ОТРЫВКА

HTML дает авторам средства для:

 публикации электронных документов с заголовками, текстом, таблицами, списками, фотографиями и т.д.;

Назад Дальше