Дерево разбора. Преобразование дерева разбора в дерево операций

⇐ Предыдущая 55 56 57 585960 61 62 63 64 Следующая ⇒

Синтаксические деревья

Синтаксическое дерево (дерево операций) - это структура, представляющая собой результат работы синтаксического анализатора. Она отражает синтаксис конструкций входного языка и явно содержит в себе полную взаимосвязь операций.

В синтаксическом дереве внутренние узлы (вершины) соответствуют операциям, а листья представляют собой операнды. Как правило, листья синтаксического дерева связаны с записями в таблице идентификаторов. Структура синтаксического дерева отражает синтаксис языка программирования, на котором написана исходная программа.

Синтаксические деревья могут быть построены компилятором для любой части входной программы. Не всегда синтаксическому дереву должен соответствовать фрагмент кода результирующей программы — например, возможно построение синтаксических деревьев для декларативной части языка. В этом случае операции, имеющиеся в дереве, не требуют порождения объектного кода, но несут информацию о действиях, которые должен выполнить сам компилятор над соответствующими элементами. В том случае, когда синтаксическому дереву соответствует некоторая последовательность операций, влекущая порождение фрагмента объектного кода, говорят о дереве операций.

Дерево операций можно непосредственно построить из дерева вывода, порожденного синтаксическим анализатором. Для этого достаточно исключить из дерева вывода цепочки нетерминальных символов, а также узлы, не несущие семантической (смысловой) нагрузки при генерации кода. Примером таких узлов могут служить различные скобки, которые меняют порядок выполнения операций и операторов, но после построения дерева никакой смысловой нагрузки не несут, так как им не соответствует никакой объектный код.

То, какой узел в дереве является операцией, а какой — операндом, невозможно определить из грамматики, описывающей синтаксис входного языка. Также ниоткуда не следует, каким операциям должен соответствовать объектный код в результирующей программе, а каким — нет. Все это определяется только исходя из семантики — «смысла» — языка входной программы. Поэтому только разработчик компилятора может четко определить, как при построении дерева операций должны различаться операнды и сами операции, а также то, какие операции являются семантически незначащими для порождения объектного кода.

Алгоритм преобразования дерева вывода в дерево операций:

1). Если в дереве больше не содержится узлов, помеченных нетерминальными символами, то выполнение алгоритма завершено, иначе — перейти к шагу 2.

2). Выбрать крайний левый узел дерева, помеченный нетерминальным символом грамматики и сделать его текущим. Перейти к шагу 3.

3). Если текущий узел имеет только один нижележащий узел, то текущий узел необходимо удалить из дерева, а связанный с ним узел присоединить к узлу вышележащего уровня (исключить из дерева цепочку) и вернуться к шагу 1;

иначе — перейти к шагу 4.

4). Если текущий узел имеет нижележащий узел (лист дерева), помеченный терминальным символом, который не несет семантической нагрузки, тогда этот лист нужно удалить из дерева и вернуться к шагу 3; иначе — перейти к шагу 5.

5). Если текущий узел имеет один нижележащий узел (лист дерева), помеченный терминальным символом, обозначающим знак операции, а остальные узлы помечены как операнды, то узел, помеченный знаком операции, надо удалить из дерева, текущий узел пометить этим знаком операции и перейти к шагу 1; иначе — перейти к шагу 6.

6). Если среди нижележащих узлов для текущего узла есть узлы, помеченные нетерминальными символами грамматики то необходимо выбрать крайний левый среди этих узлов, сделать его текущим узлом перейти к шагу 3; иначе — выполнение алгоритма завершено.

Этот алгоритм всегда работает с узлом дерева, который считается текущим и стремится исключить из дерева, все узлы, помеченные нетерминальными символами. То, какие из символов считать семантически незначащими, а какие считать, знаками операций, решает разработчик компилятора. Если семантика языка задана корректно, то в результате работы алгоритма из дерева будут исключены все нетерминальные символы.

Пример синтаксического дерева, построенного для цепочки (а+а)*b из языка, заданного различными вариантами грамматики арифметических выражений представлен на рис. 42.

В результате применения алгоритма преобразования деревьев синтаксического разбора, в дерево операций, получим дерево операции, представленное на рис. 42. Причем, несмотря на то, что исходные синтаксические деревья имели различную структуру, зависящую от используемой грамматики, результирующее дерево операций всегда имеет одну и ту же структуру, зависящую только от семантики входного языка.

Рис. 42. Пример дерева операций для языка арифметических выражений

Дерево операций является формой внутреннего представления программы, которой удобно пользоваться на этапах синтаксического разбора, семантического анализа и подготовки к генерации кода, когда еще нет необходимости работать непосредственно с кодами команд результирующей программы.

Преимущества внутреннего представления в виде дерева операций:

1) четко отражает связь всех операций между собой, поэтому его удобно использовать для преобразований, связанных с перестановкой и переупорядочиванием операций без изменений конечного результата;

2) синтаксические деревья – это машинно-независимая форма внутреннего представления программы.

Недостаток синтаксических деревьев заключается в том, что они представляют собой сложные связанные структуры, а поэтому не могут быть тривиальным образом преобразованы в линейную последовательность команд результирующей программы. Тем не менее, они удобны при работе с внутренним представлением программы на тех этапах, когда нет необходимости непосредственно обращаться к командам результирующей программы.

Синтаксические деревья могут быть преобразованы в другие формы внутреннего представления программы, представляющие собой линейные списки, с учетом семантики входного языка. Эти преобразования выполняются на основе принципов СУ-компиляции.

8.5 Трехадресный код. Типы трехадресных инструкций

Трехадресный код представляет собой последовательность инструкций вида

х:= у op z

где х, у и z — имена, константы или временные переменные, генерируемые компилятором; ор означает некоторый оператор, например арифметический оператор для работы с числами с фиксированной или плавающей точкой или оператор для работы с логическими значениями. Например, выражение исходного языка наподобие х+у*z может быть транслировано в следующую последовательность.

t₁:= у * z

t₂:= х + t₁

Здесь t₁ и t₂— сгенерированные компилятором временные имена. Использование имен для вычисленных программой промежуточных значений обеспечивает трехадресному коду, в отличие от постфиксной записи, возможность легкого переупорядочения.

Термин "трехадресный код" отражает тот факт, что каждая инструкция обычно содержит три адреса — два для операндов и один для результата.

Список некоторых основных трехадресных инструкций, используемых в большинстве языков программирования:

1. Инструкции присвоения вида х:= у op z, где ор— бинарная арифметическая или логическая операция.

2. Инструкция присвоения вида х:= ор у, где ор — унарная операция. Основные унарные операции включают унарный минус, логическое отрицание, операторы сдвига и операторы преобразования, которые, например, преобразуют число с фиксированной точкой в число с плавающей точкой.

3. Инструкции копирования вида х: = у, в которых значение у присваивается х.

4. Безусловный переход goto L. После этой инструкции будет выполнена трехадресная инструкция с меткой L.

5. Условный переход типа if х relop у goto L. Эта инструкция применяет оператор отношения relop (<, >= и т.п.) к х и у, и следующей выполняется инструкция с меткой L, если соотношение х relop у верно. В противном случае выполняется следующая за условным переходом инструкция.

7. Индексированные присвоения типа х:= y[i] x[i]:= у. Первая инструкция присваивает х значение, находящееся в i-й ячейке памяти по отношению к у. Инструкция х[i]: = у заносит в i-ю ячейку памяти по отношению к х значение у. В обеих инструкциях х, у и i ссылаются на объекты данных.

8. Присвоение адресов и указателей вида х: = &у, х: = *у и *х: = у. Первая инструкция устанавливает значение х равным положению у в памяти. Предположительно, у представляет собой имя, возможно временное, обозначающее выражение с l-значением типа А [i,j ], а х — имя указателя или временное имя. Таким образом, r-значение х представляет собой значение некоторого объекта. Во второй инструкции под у подразумевается указатель или временная переменная, l-значение которой представляет собой местоположение ячейки памяти. В результате l-значение х становится равным содержимому этой ячейки. И наконец, инструкция *х:= у устанавливает l-значение объекта, указываемого х, равным l-значению у.

Выбор приемлемых операторов, представляет собой важный вопрос в создании промежуточного представления. Очевидно, что множество операторов должно быть достаточно богатым, чтобы позволить реализовать все операции исходного языка. Небольшое множество операторов легче реализуется на новой целевой машине, однако ограниченное множество инструкций может привести к генерации длинных последовательностей инструкций промежуточного представления для некоторых конструкций исходного языка и добавить работы оптимизатору и генератору целевого кода.

⇐ Предыдущая 55 56 57 585960 61 62 63 64 Следующая ⇒

Поделиться с друзьями:

Дата добавления: 2014-12-27; Просмотров: 5863; Нарушение авторских прав?; Мы поможем в написании вашей работы!

Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет

studopedia.su - Студопедия (2013 - 2025) год. Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав! Последнее добавление

Генерация страницы за: 0.007 сек.