编译原理期末总复习题(含答案) 下载本文

第八节 习题一、单项选择题

1、将编译程序分成若干个“遍”是为了 b 。 a.提高程序的执行效率 b.使程序的结构更加清晰

c.利用有限的机器内存并提高机器的执行效率 d.利用有限的机器内存但降低了机器的执行效率 2、构造编译程序应掌握 d 。 a.源程序 b.目标语言 c.编译方法 d.以上三项都是 3、变量应当 c 。 a.持有左值 b.持有右值

c.既持有左值又持有右值 d.既不持有左值也不持有右值 4、编译程序绝大多数时间花在 b 上。 a.出错处理 b.词法分析 c.目标代码生成 d.管理表格 5、 d 不可能是目标代码。 a.汇编指令代码 b.可重定位指令代码 c.绝对指令代码 d.中间代码 6、使用 a 可以定义一个程序的意义。 a.语义规则 b.词法规则 c.产生规则 d.词法规则 7、词法分析器的输入是 a 。 a.单词符号串 b.源程序 c.语法单位 d.目标程序 8、中间代码生成时所遵循的是- d 。 a.语法规则 b.词法规则 c.语义规则 d.等价变换规则 9、编译程序是对 d 。 a.汇编程序的翻译 b.高级语言程序的解释执行 c.机器语言的执行 d.高级语言的翻译 10、语法分析应遵循 b 。 a.语义规则 b.语法规则 c.构词规则 d.等价变换规则 解答

1、将编译程序分成若干个“遍”是为了使编译程序的结构更加清晰,故选b。 2、构造编译程序应掌握源程序、目标语言及编译方法等三方面的知识,故选d。 3、对编译而言,变量既持有左值又持有右值,故选c。 4、编译程序打交道最多的就是各种表格,因此选d。

5、目标代码包括汇编指令代码、可重定位指令代码和绝对指令代码3种,因此不是目标代码的只能选d。

6、词法分析遵循的是构词规则,语法分析遵循的是语法规则,中间代码生成遵循的是语义规则,并且语义规则可以定义一个程序的意义。因此选a。 7、b 8、c 9、d 10、c 二、多项选择题

1、编译程序各阶段的工作都涉及到 bc 。 a.语法分析 b.表格管理 c.出错处理 d.语义分析 e.词法分析

2、编译程序工作时,通常有 abce 阶段。 a.词法分析 b.语法分析 语义分析? c.中间代码生成 中间代码优化 d.语义检查 e.目标代码生成 解答

1.b、c 2. a、b、c、e 三、填空题

1、解释程序和编译程序的区别在于是否生成目标程序( 解释不产生目标程序,边翻译边执行 。

2、编译过程通常可分为5个阶段,分别是 词法分析 、语法分析 语义分析中间代码生成 、代码优化和目标代码生成。

3、编译程序工作过程中,第一段输入是 源程序 ,最后阶段的输出为 目标程序 程序。

4、编译程序是指将 源程序 程序翻译成 目标程序 程序的程序。 解答

是否生成目标程序 2、词法分析 中间代码生成 3、源程序 目标代码生成 4、源程序 目

标语言

一、单项选择题

1、文法G:S→xSx|y所识别的语言是 c 。

nn a. xyx b. (xyx)* c. xyx(n≥0) d. x*yx*(是指多个x) 2、文法G描述的语言L(G)是指 ab 。

+ α , α∈V*} *α, α∈V*} a. L(G)={α|S?b. L(G)={α|S?TT*+ c. L(G)={α|S?α,α∈(VT∪VN*)} d. L(G)={α|S?α, α∈(VT∪VN*)}

3、有限状态自动机能识别 。 a. 上下文无关文法 b. 上下文有关文法

c.正规文法 d. 短语文法

4、设G为算符优先文法,G的任意终结符对a、b有以下关系成立 。 a. 若f(a)>g(b),则a>b b.若f(a)

c. a~b都不一定成立 d. a~b一定成立

5、如果文法G是无二义的,则它的任何句子α 。 a. 最左推导和最右推导对应的语法树必定相同

b. 最左推导和最右推导对应的语法树可能不同 c. 最左推导和最右推导必定相同

d. 可能存在两个不同的最左推导,但它们对应的语法树相同

6、由文法的开始符经0步或多步推导产生的文法符号序列是 。 a. 短语 b.句柄 c. 句型 d. 句子 7、文法G:E→E+T|T

T→T*P|P P→(E)|I

则句型P+T+i的句柄和最左素短语为 。 a.P+T和i b. P和P+T c. i和P+T+i d.P和T 8、设文法为:S→SA|A

A→a|b

则对句子aba,下面 是规范推导。 a. S?SA?SAA?AAA?aAA?abA?aba

b. S?SA?SAA?AAA?AAa?Aba?aba c. S?SA?SAA?SAa?Sba?Aba?aba d. S?SA?Sa?SAa?Sba?Aba?aba 9、文法G:S→b|∧(T)

T→T,S|S

则FIRSTVT(T) 。 a. {b,∧,(}

b. {b,∧,)} c.{b,∧,(,,} d.{b,∧,),,}

10、产生正规语言的文法为 。

a. 0型 b. 1型 c. 2型 d. 3型 11、采用自上而下分析,必须 。 a. 消除左递归 b. 消除右递归 c. 消除回溯 d. 提取公共左因子 12、在规范归约中,用 来刻画可归约串。 a. 直接短语 b. 句柄 c. 最左素短语 d. 素短语 13、有文法G:E→E*T|T

T→T+i|i

句子1+2*8+6按该文法G归约,其值为 。

a. 23 B. 42 c. 30 d. 17 14、规范归约指 。 a. 最左推导的逆过程 b. 最右推导的逆过程 c. 规范推导 d. 最左归约的逆过程 [解答]

1、选c。

2、选a。 3、选c。 4、虽然a与b没有优先关系,但构造优先函数后,a与b就一定存在优先关系了。所以,由f(a)>g)(b)或f(a)

5、如果文法G无二义性,则最左推导是先生长右边的枝叶:对于d,如果有两个不同的是了左推导,则必然有二义性。故选a。

6、选c。

7、由图2-8-1的语法树和优先关系可以看出应选b。

E

E + F

E + T P

T i

P

#<·+·>+<·i·># 图2-8-1 句型P+T+I的语法及优先关系

8、规范推导是最左推导,故选d。

9、由T→T,?和T→(? 得FIRSTVT(T))={(,,)};

由T→S得FIRSTVT(S)?FIRSTVT(T),而FIRSTVT(S)={b,∧,(};即 FIRSTVT(T)={b,∧,(,,}; 因此选c。 10、d 11、c 12、b 13、b 14、b 二、多项选择题

1、下面哪些说法是错误的 。 a. 有向图是一个状态转换图 b. 状态转换图是一个有向图

c.有向图是一个DFA d.DFA可以用状态转换图表示 2、对无二义性文法来说,一棵语法树往往代表了 。

a. 多种推导过程 b. 多种最左推导过程 c.一种最左推导过程 d.仅一种推导过程 e.一种最左推导过程

3、如果文法G存在一个句子,满足下列条件 之一时,则称该文法是二义文法。 a. 该句子的最左推导与最右推导相同

b. 该句子有两个不同的最左推导 c. 该句子有两棵不同的最右推导 d. 该句子有两棵不同的语法树 e.该句子的语法树只有一个 4、有一文法G:S→AB A→aAb|ε B→cBd|ε 它不产生下面 集合。

a. {anbmcndm|n,m≥0} b. {anbncmdm|n,m>0} c. {anbmcmdn|n,m≥0} d. {anbncmdm|n,m≥0} e. {anbncndn|n≥0}

5、自下而上的语法分析中,应从 开始分析。 a. 句型 b. 句子 c. 以单词为单位的程序 d. 文法的开始符 e. 句柄

6、对正规文法描述的语言,以下 有能力描述它。

a.0型文法 b.1型文法 c.上下文无关文法 d.右线性文法 e.左线性文法

解答 1、e、a、c 2、a、c、e 3、b、c、d 4、a、c 5、b、c 6、a、b、c、d、e 三、填空题

1、文法中的终结符和非终结符的交集是 。词法分析器交给语法分析器的文法符号一定是 ,它一定只出现在产生式的 部。

2、最左推导是指每次都对句型中的 非终结符进行扩展。

3、在语法分析中,最常见的两种方法一定是 分析法,另一是 分析法。 4、采用 语法分析时,必须消除文法的左递归。 5、 树代表推导过程, 树代表归约过程。

6、自下而上分析法采用 、归约、错误处理、 等四种操作。

7、Chomsky把文法分为 种类型,编译器构造中采用 和 文法,它们分别产生 和 语言,并分别用 和 自动机识别所产生的语言。 解答 1、空集 终结符 右 2、最左

3、自上而上 自下而上 4、自上而上

5、语法 分析 6、移进 接受

7、4 2 型 3型 上下文无关语言 正规语言 下推自动机 有限 四、判断题

1、文法 S→aS|bR|ε描述的语言是(a|bc)* ( ) R→cS

2、在自下而上的语法分析中,语法树与分析树一定相同。 ( ) 3、二义文法不是上下文无关文法。 ( ) 4、语法分析时必须先消除文法中的左递归。 ( ) 5、规范归约和规范推导是互逆的两个过程。 ( ) 6、一个文法所有句型的集合形成该文法所能接受的语言。 ( ) 解答 1、对 2、错 3、错 4、错 5、错 6、错 五、简答题

1、句柄 2、素短语 3、语法树 4、归约 5、推导 [解答]

1、句柄:一个句型的最左直接短语称为该句型的句柄。

2、素短语:至少含有一个终结符的素短语,并且除它自身之外不再含任何更小的素短语。 3、语法树:满足下面4个条件的树称之为文法G[S]的一棵语法树。 ①每一终结均有一标记,此标记为VN∪VT中的一个符号;

②树的根结点以文法G[S]的开始符S标记;

③若一结点至少有一个直接后继,则此结点上的标记为VN中的一个符号; ④若一个以A为标记的结点有K个直接后继,且按从左至右的顺序,这些结点的标记分别为X1,X2,?,XK,则A→X1,X2,?,XK,必然是G的一个产生式。 4、归约:我们称αγβ直接归约出αAβ,仅当A→γ 是一个产生式,且α、β∈(VN∪VT)*。归约过程就是从输入串开始,反复用产生式右部的符号替换成产生式左部符号,直至文法开

始符。

5、推导:我们称αAβ直接推出αγβ,即αAβ?αγβ,仅当A→ γ 是一个产生式,且α、β∈(VN∪VT)*。如果α1?α2???αn,则我们称这个序列是从α1至α2的一个推导。若存在一个从α1αn的推导,则称α1可推导出αn。推导是归约的逆过程。 六、问答题

1、给出上下文无关文法的定义。 [解答]

一个上下文无关文法G是一个四元式(VT,VN,S, P),其中: ●VT是一个非空有限集,它的每个元素称为终结符号;

●VN是一个非空有限集,它的每个元素称为非终结符号,VT∩VN=Φ; ●S是一个非终结符号,称为开始符号; ●P是一个产生式集合(有限),每个产生式的形式是P→α,其中,P∈VN, α∈(VT∪VN)*。开始符号S至少必须在某个产生式的左部出现一次。 2、文法G[S]:

S→aSPQ|abQ QP→PQ bP→bb bQ→bc cQ→cc

(1)它是Chomsky哪一型文法? (2)它生成的语言是什么? [解答] (1)由于产生式左部存在终结符号,且所有产生式左部符号的长度均小于等于产生式右部的符号长度,所以文法G[S]是Chomsky1型文法,即上下文有关文法。

(2)按产生式出现的顺序规定优先级由高到低(否则无法推出句子),我们可以得到: S?abQ?abc

S?aSPQ?aabQPQ?aabPQQ?aabbQQ?aabbcQ?aabbcc

S?aSPQ?aaSPQPQ?aaabQPQPQ?aaabPQQPQ?aaabPQPQQ?aaaPPQQQ? aaabbPqqq?aaabbQQQ?aaabbbcQQ?aaabbbccQ?aaabbbccc ??

于是得到文法G[S]生成的语言L={anbncn|n≥1} 3、按指定类型,给出语言的文法。

L={aibj|j>i≥1}的上下文无关文法。 【解答】

(1)由L={aibj|j>i≥1}知,所求该语言对应的上下文无关文法首先应有S→aSb型产生式,以保证b的个数不少于a的个数;其次,还需有S→Sb或S→bS型的产生式,用以保证b的个数多于a的个数;也即所求上下文无关文法G[S]为:

G[S]:S→aSb|Sb|b

4、有文法G:S→aAcB|Bd

A→AaB|c B→bScA|b

(1)试求句型aAaBcbbdcc和aAcbBdcc的句柄; (2)写出句子acabcbbdcc的最左推导过程。 【解答】(1)分别画出对应两句型的语法树,如图2-8-2所示 句柄:AaB Bd

S

S

a A c B

a A c B

A a B b S c A

B S c A

B d c

B d c

b (b) (a)

图2-8-2 语法树

(2)句子acabcbbdcc的最左推导如下:

S?aAcB?aAaBcB?acaBcB?acabcB?acabcbScA?acabcbBdcA ?acabcbbdcA?acabcbbdcc 5、对于文法G[S]:

S→(L)|aS|a L→L, S|S (1)画出句型(S,(a))的语法树。(2)写出上述句型的所有短语、直接短语、句柄和素短语。 【解答】 S (1)句型(S,(a))的语法树如图2-8-3所示 ( L )

L , S

S ( L ) S (2)由图2-8-3可知:

①短语:S、a、(a)、S,(a)、(S,(a)); a ②直接短语:a、S;

图2-8-3 句型(S,(a))的语法树 ③句柄:S;

④素短语:素短语可由图2-8-3中相邻终结符之间的优先关系求得,即;

# ·(·, ·( ·a· )· )· # 因此素短语为a。

6、考虑文法G[T]: T→T*F|F F→F↑P|P P→(T)|i

证明T*P↑(T*F)是该文法的一个句型,并指出直接短语和句柄。 T 【解答】 T * F 首先构造T*P↑(T*F)的语法树如图2-8-4所示。 F ↑ P 由图2-8-4可知,T*P↑(T*F)是文法G[T]的一个句型。 P ( T ) 直接短语有两个,即P和T*F;句柄为P。

T * F 图2-8-4 句型T*P↑(T*F)的语法树

一、单项选择题

1、词法分析所依据的是 。

a. 语义规则 b. 构词规则 c. 语法规则 d. 等价变换规则 2、词法分析器的输出结果是 。

a. 单词的种别编码 b. 单词在符号表中的位置 c. 单词的种别编码和自身值 d. 单词自身值 3、正规式M1和M2等价是指 。

a. M1和M2的状态数相等 b. M1和M2的有向弧条数相等

c. M1和M2所识别的语言集相等 d. M1和M2状态数和有向弧条数相等 4、状态转换图(见图3-6-1)接受的字集为 。

0

X 1 Y 0

图3-6-1

a. 以 0开头的二进制数组成的集合 b. 以0结尾的二进制数组成的集合 c. 含奇数个0的二进制数组成的集合 d. 含偶数个0的二进制数组成的集合 5、词法分析器作为独立的阶段使整个编译程序结构更加简洁、明确,因此, 。 a. 词法分析器应作为独立的一遍 b. 词法分析器作为子程序较好

c. 词法分析器分解为多个过程,由语法分析器选择使用 d. 词法分析器并不作为一个独立的阶段 解答 1、b 2、c 3、c 4、d 5、b 二、多项选择题

1、在词法分析中,能识别出 。 a. 基本字 b. 四元式 c. 运算符 d. 逆波兰式 e. 常数

2、令∑={a,b},则∑上所有以b开头,后跟若干个ab的字的全体对应的正规式为 。 a. b(ab)* b. b(ab)+ c.(ba)*b

+

d. (ba)b e. b(a|b) 解答 1、a、c、e 2、a、b、d 三、填空题

1、确定有限自动机DFA是 的一个特例。

2、若二个正规式所表示的 相同,则认为二者是等价的。 3、一个字集是正规的,当且仅当它可由 所 。 解答 1、NFA 2、正规集 3、DFA(NFA)所识别 四、判断题

1、一个有限状态自动机中,有且仅有一个唯一终态。 ( ) 2、设r和s分别是正规式,则有L(r|s)=L(r)|L(s)。 ( ) 3、自动机M和M′的状态数不同,则二者必不等价。 ( ) 4、确定的自动机以及不确定的自动机都能正确地识别正规集。 ( ) 5、对任意一个右线性文法G,都存在一个NFA M,满足L(G)=L(M)。 ( ) 6、对任意一个右线性文法G,都存在一个DFA M,满足L(G)=L(M)。 ( ) 7、对任何正规表达式e,都存在一个NFA M,满足L(G)=L(e)。 ( ) 8、对任何正规表达式e,都存在一个DFA M,满足L(G)=L(e)。 ( ) 解答 1 、2、3、错 4、5、6、7、8、正确 五、基本题

1、设M=({x,y}, {a,b}, f,x,{y})为一非确定的有限自动机,其中f定义如下:

f(x,a)={x,y} f(x,b)={y} f(y,a)=φ f(y,b)={x,y}

试构造相应的确定有限自动机M′。

解答:对照自动机的定义M=(S,Σ,f,S0,Z),由f的定义可知f(x,a)、f(y,b)均为多值函数,所以是一非确定有限自动机,先画出NFA M相应的状态图,如图3-6-2所示。

a a

b

X b Y

b

图3-6-2 NFA M

用子集法构造状态转换矩阵表3-6-3所示。

I {x} {y} {x,y} Ia {x,y} — {x,y} Ib {y} {x,y} {x,y} 将转换矩阵中的所有子集重新命名而形成表3-6-4所示的状态转换矩阵。 表3-6-4 状态转换矩阵 0 1 2 a 2 — 2 b 1 2 2 即得到M′=({0,1,2}, {a,b}, f,0, {1,2}),其状态转换图如图3-6-5所示。

a

a,b

0 2 b b 1 图3-6-5 DFA M′ 将图3-6-5的DFA M′最小化。首先,将M′的状态分成终态组{1,2}与非终态组{0};其次,考察{1,2}。由于{1,2}a={1,2}b={2}?{1,2},所以不再将其划分了,也即整个划分只有两组{0},{1,2}:令状态1代表{1,2},即把原来到达2的弧都导向1,并删除状态2。最后,得到如图3-6-6所示化简DFA M′。

a

a,b 1 0

b

图3-6-6 化简后的DFA M′

2、对给定正规式b*(d|ad)(b|ab)+,构造其NFA M;

解答:首先用A+=AA*改造正规式得:b*(d|ad)(b|ab)(b|ab)*;其次,构造该正规式的NFA M,如图3-6-7所示。

b*(d|ad)(b|ab)(b|ab)* X Y b* 1 (d|ad) 2 (b|ab) 3 (b|ab)* Y X

b X ε 4 ε b X ε 4 ε 1 a 1 ad d 2 a 6 d d 2 ab b b b|ab 3 ε 5 ε b 3 ε 5 a 7 b 8 ε b Y Y 图3-6-7 的NFA M

1、 构造下面文法的LL(1)分析表。

D→ TL

T→ int | real L→ id R R→ , id R | ε

解答: LL(1)分析表见表4-3-1

分析 虽然这个文法很简单,我们还是从求开始符号集合和后继符号集合开始。

FIRST(D)=FIRST(T)={int, real} FOLLOW(D)=FOLLOW(L)={#}

FIRST(L)={id} FOLLOW(T)={id} FIRST(R)={,, ε} FOLLOW(R)={#}

有了上面每个非终结符的FIRST集合,填分析表时要计算一个产生式右部α的FIRST(α)就不是件难事了。

填表时唯一要小心的时,ε是产生式R→ε右部的一个开始符号,而#在FOLLOW(R)中,所以R→ε填在输入符号#的栏目中。

表4-3-1 LL(1)分析表 非终结符 D T L R int D→TL T→int 输入符号 real D→TL T→real id L→id R , R→,id R # R→ ε

2、 下面文法G[S]是否为LL(1)文法?说明理由。

S → A B | P Q x A → x y B → b c P → d P | ε Q → a Q | ε

解答: 该文法不是LL(1)文法,见下面分析中的说明。 分析 只有三个非终结符有两个选择。

1、P的两个右部d P 和ε 的开始符号肯定不相交。

2、Q的两个右部a Q 和 ε 的开始符号肯定不相交。

3、对S来说,由于x ∈ FIRST(A B),同时也有x ∈ FIRST(P Q x)(因为P和Q都可能为空)。所以该文法不是LL(1)文法。 3、 设有以下文法:

G[S]:S→aAbDe|d A→BSD|e B→SAc| cD| ε D→Se| ε

(1)求出该文法的每一个非终结符U的FOLLOW集。 (2)该文法是LL(1)文法吗? (3)构造C[S]的LL(1)分析表。

解答: (1)求文法的每一个非终结符U的FOLLOW集的过程如下: 因为:

① S是识别符号,且有A→BSD、B→SAc、D→Se,所以FOLLOW(S)应包含

FIRST(D)∪FIRST(Ac) ∪FIRST(e) ∪{#} ={a,d}∪{a,d,c,e}∪{e}∪{#} ={a,c,d,e#}

② 又因为A→BSD和D→ε,所以FOLLOW中还包含FOLLOW(A)。 因为S→aAbDe和B→SAc,所以

FOLLOW(A)=FIRST(bDe)∪FIRST(c)={b,c}

综合①、②得FOLLOW(S)={a,d,c,e,#}∪{a,b,c,d,e,#}

因为A→BSD,所以 FOLLOW(B)=FIRST(SD)={a,d} 因为S→aAbDe | d、A→BSD| e和B→SAc | cD,所以 FOLLOW(D)=FIRST(e)∪FOLLOW(A)∪FOLLOW(B) ={e}∪{b,c}∪{a,d}={a,b,c,d,e} (2)G[S]不是LL(1)文法。 因为产生式B→SAc|cD| ε 中

FIRST(SAc)∩FOLLOW(B)={a,d}≠? (3)构造G[S]的LL(1)分析表。

按照LL(1)分析表的构造算法构造方法G[S]的LL(1)分析表如表4-3-2所示。

表4-3-2 G[S]的LL(1)分析表 S A B D a aAbDe BSD Sac/ε Se/ε b ε c BSD cD ε d d BSD Sac/ε Se/ε e e ε # 4、 将文法G[V]改造成为LL(1)的。

G[V]:V→N|N[E] E→V|V+E N→i

解答: 对文法G[V]提取公共左因子后得到文法: G′[V]:V→NA

A→ε|[E] E→VB B→ε|+E N→i

求出文法G′[V]中每一个非终结符号的FIRST集: FIRST(V)={i} FIRST(A)={[, ε} FIRST(E)={i} FIRST(B)={+, ε} FIRST(N)={i}

求出文法G′[V]中每一个非终结符号的FOLLOW集: FOLLOW(V)={#}∪FIRST(B)\\{ε}∪FOLLOW(E)={#,+,]} FOLLOW(A)= FOLLOW(V)={+,,#} FOLLOW(E)= FIRST(])\\{ε}∪FOLLOW(B)= FIRST(])\\{ε}∪FOLLOW(E)={]} FOLLOW(B)= FOLLOW(E)={ ]} FOLLOW(N)= FIRST(A)\\{ε}∪FOLLOW(V)={[,],+,#}

可以看到,对文法G′[V]的产生式A→ε|[E],有 FIRST([E])∩FOLLOW(A)={[}∩{+,],#}= ? 对产生式B→ε|+E,有

FIRST(+E)∩FOLLOW(B)={+}∩{]}= ?

而文法的其他产生式都只有一个不为ε的右部,所以文法G′[V]是LL(1)文法。 5、已知文法: G[A]: A→aAa|ε

(1)该文法是LL(1)文法吗?为什么?

(2)若采用LL(1)方法进行语法分析,如何得到该文法的LL(1)分析表? (3)若输入符号串“aaaa”,请给出语法分析过程。 解答:(1)因为产生式A→aAa|ε 有空产生式右部,而 FOLLOW(A)={#}∪FIRST(a)={a, #}

造成 FIRST(A)∩FOLLOW(A)={A, ε}∩{a, #}≠? 所以该文法不是LL(1)文法。

(2)若采用LL(1)方法进行语法分析,必须修改该文法。 因该文法产生偶数(可以为0)个a,所以得到文法 G′[A]: A→aaA|ε

此时对产生式A→aaA|ε, 有 FOLLOW(A)={#}∪FOLLOW(A)={#},因而 FIRST(A)∩FOLLOW(A)={a, ε}∩{#}=? 所以文法G′[A]是LL(1)文法,按LL(1)分析表构造算法构造该文法的LL(1)分析表如表4-3-3所示。

表4-3-3 文法G′[A]的LL(1)分析表 A

(3)若采用LL(1)方法进行语法分析,对符号串“aaaa”的分析过程如表4-3-4所示。

表4-3-4 对符号串“aaaa”的分析过程 步骤 1 2 3 4 5 6 7 8

分析栈 #A #A a a #A a #A #A a a #A a #A # 输入串 a a a a # a a a a # a a a # a a # a a # a# # # 产生式/动作 A→aaA 匹配 匹配 A→aaA 匹配 匹配 A→ε 接受 A A→aaA # A→ε 第七节 习题

设有文法G[S]为: S→a|b|(A)

A→SdA|S

(1) 完成下列算符优先关系表,见表5-7-1,并判断G[S]是否为算符优先文法。

表5-7-1 算符优先关系表

a b ( ) d # a ? ? b ? ? ( ? ? ) ? ? ? ? d # ? ? ? ?

(2)给出句型(SdSdS)的短语、简单短语、句柄、素短语和最左素短语。 (3)给出输入串(adb)#的分析过程。 解答:

(1)先求文法G[S]的FIRSTVT集和LASTVT集:

由S→a|b|(A)得:FIRSTVT(S)={a,b,( );

由A→Sd?得:FIRSTVT(A)={d};又由A→S?得:FIRSTVT(S) ? FIRSTVT(A),即FIRSTVT(A)={d,a,b,(};

由S→a|b|(A)得;LASTVT(S)={a,b,}};

由A→?dA得:LASTVT(A)={d},又由A→S得:LASTVT(S) ? LASTVT(A),即LASTVT(A)={d,a,b,)}。

构造优先关系表方法如下:

① 对P→?ab?,或P→?aQb?,有a?b; ② 对P→?aR?,而b∈FIRSTVT(R),有a?b; ③ 对P→?Rb?,而a∈FIRSTVT(R),有a?b。 由此得到:

① 由S→(A)得:(?);

② 由S→(A?得:(?FIRSTVT(A),即:(?d,(?a ,(?b,(?(;由A→?dA得:d?FIRSTVT(A), 即:d?d,d?a,d?b,d?(;

③ 由S→A)得,LASTVT(A)?),即:d?),a?),b?),)?);由A→Sd?得:LASTVT(S)?d,即:a?d,b?d,)?d;

此外,由#S#得:#?#;

由#?FIRSTVT(S)得:#?a,#?b,#?(;脂由LASTVT(S)?#得:d?#,a?#,b?#,)?#。

最后得到算符优先关系表,见表5-7-2。

表5-7-2 算符优先关系表

a b ( ) d # a ? ? ? b ? ? ? ( ? ? ? ) ? ? ? ? ? d ? ? ? ? # ? ? ? ? ?

由表5-7-2可以看出,任何两个终结符之间至少只满足?、?、?三种优先关系之一,故G[S]为算符优先文法。

(2)为求出句型(SdSdS)的短语、简单短语、句柄,我们先画出该句型对应的语法树,如图5-7-3所示。由图5-7-3得到: 短语:S,SdS,SdSdS,(SdSdS)

S 简单短语(即直接短语):S 句柄(即最左直接短语):S

素短语:SdS,它同时也是该句型的最左素短语。

A ( ) S

d A

(3)输入串(adb)#的分析过程见表5-7-4

表5-7-4 输入串(adb)#的分析过程

符号栈 # #( #(a #(S #(Sd #(Sdb #(SdS #(SdA #(A #(A) #S

输入串 (adb)# adb)# db)# db)# b)# )# )# )# )# # # 说明 移进 移进 用S→a归约 移进 移进 用S→b归约 用A→S归约 用A→SdA归约 移进 用S→(A)归约 分析成功 第四节 习题

一、单项选择题

1、若a为终结符,则A→α·aβ为 项目 a.归约 b.移进 c.接受 d.待约

2、若项目集Ik含有A→α·,则在状态k时,仅当面临的输入符号a∈FOLLOW(A)时,才采取“A→α·”动作的一定是 。

a.LALR文法 b.LR(0)文法 c.LR(1)文法 d.SLR(1)文法 3、就文法的描述能力来说,有 。

a. SLR(1)?LR(0) b. LR(1)?LR(0)c. SLR(1)?LR(1)d.无二义文法?LR(1) 4、在LR(0)的ACTION子表中,如果某一行中存在标记“rj”的栏,则 。 a.该行必定填满rj b.该行未填满rj

c.其他行也有rj d.goto子表中也有rj

5、一个 指明了在分析过程中的某时刻所能看到产生式多大一部分。 a.活前缀 b.前缀 c.项目 d.项目集 解答:

1、A→α·称为归约项目,对文法开始符S′的归约项目,如S′→α·称为接受项目,A→α·aβ(a为终结符)称为移进项目。在此选b.

2、当用产生式A→α归约时,LR(0)无论面临什么输入符号都进行归约;SLR(1)则仅当面临的输入符号a∈FOLLOW(A)时进行归约;LR(1)则当在把α归约为A的规范句型的前缀βAa前提下,当α后跟终结符a时,才进行归约;因此选d。

3、由于LR(0)?SLR(1)? LR(1)?无二义文法,故选c。 4、选a。 5、选c。 二、多项选择题

1、一个LR分析器包括 。

a.一个总控程序 b.一个项目集 c.一个活前缀

d.一张分析表 e.一个分析栈

2、LR分析器核心部分是一张分析表,该表包括 等子表。 a.LL(1)分析 b.优先关系 c.GOTO d.LR e.ACTION

3、每一项ACTION[S,a]所规定的动作包括 。

a.移进 b.比较 c.接受 d.归约 e.报错 4、对LR分析表的构造,有可能存在 动作冲突。

a.移进 b.归约 c.移进/归约 d.移进/移进 e.归约/归约 5、就文法的描述能力来说,有 。 a. SLR(1)?LR(1) b. LR(1)?SLR(1) c. LR(0)?LR(1)

d. LR(1)?无二义文法 e. SLR(1)?无二义文法 6、对LR分析器来说,存在 等分析表的构造方法。 a.LALR b.LR(0) c.SLR(1) d.SLR(0) e.LR(1) 7、自上而下的语法分析方法有 。 a.算符优先分析法 b.LL(1)分析法 c.SLR(1)分析法

d.LR(0)分析法 e.LALR(1)分析法

解答:

1、一个LR分析器包括一个总控程序和一张分析表,选a、d。

2、选c、e。

3、选a、c、d、e。

4、在LR分析表的构造中有可能存在“移进”/“归约”和“归约”/“归约”冲突;故选c、e。 5、选a、b、c、d、e。 6、选a、b、c、e。 7、选a、c、d、e。 三、填空题

1、对于一个文法,如果能够构造 。使得它的 均是唯一确定的,则称该文法为LR文法。 2、字的前缀是指该字的 。

3、活前缀是指 的一个前缀,这种前缀不含 之后的任何符号。

4、在LR分析过程中,只要 的已扫描部分保持可归约成一个 ,则扫描过的部分正确。 5、将识别 的NFA确定化,使其成为以 为状态的DFA,这个DFA就是建立 的基础。

6、A→α·称为 项目;对文法开始符S′→α·为 项目;若a为终结符,则称A→α·aβ为 项目;若B为非终结符,则称A→α·aβ为 项目。 7、LR(0)分析法的名字中“L”表示 ,“R”表示 ,“0”表示 。 解答:

1、一张分析表 每个入口

2、任意首部

3、规范句型 句柄 4、输入串 活前缀

5、活前缀 项目集合 LR分析算法 6、归约 接受 移进 待约

7、自左至右分析 采用最右推导的逆过程即最左归约 向右查看0个字符 四、综合题

1、对于文法G[S]: S→AS|b A→SA|a (1)列出所有LR(0)项目

(2)列出构成文法LR(0)项目集规范族。 解答:

首先将文法G拓广为G[S′]: S′→S S→AS|b A→SA|a

(1)文法G[S′]的LR(0)项目是: 1、S′→·S 5、S→AS· 9、A→S·A 2、S′→S· 6、S→·b 10、A→SA· 3、S→·AS 7、S→b· 11、A→·a 4、S→A·S 8、A→·SA 12、A→a·

2、列出构成文法LR(0)项目集规范族。

用ε-CLOSURE(闭包)办法构造文法G′的LR(0)项目集规范族如下: I0:1、S′→·S I3: 9、A→S·A I6:12、A→a· 3、S→·AS 8、A→·SA I7:7、S→b· 8、A→·SA 3、S→·AS 11、A→·a 6、S→·b 6、S→·b 11、A→·a

I1:2、S′→S· I4:10、A→SA· 9、A→S·A 4、S→A·S 8、A→·SA 3、S→·AS 11、A→·a 6、S→·b 3、S→·AS 8、A→·SA 6、S→·b 11、A→·a I2:4、S→A·S I5: 5、S→AS· 3、S→·AS 9、A→S·A 6、S→·b 8、A→·SA 8、A→·SA 11、A→·a 11、A→·a 3、S→·AS 6、S→·b

注意:I1中的S′→S·和A→·SA是由状态I0中的1和3读入一个S字符后得到的下一个项目;,而I4中的A→SA和A→A·S则是由I3中的9和3读入一个A字符后得到的下一个项目;I5中的S→AS·和A→S·A 则是由I4中的4和8读入一个S字符后得到的下一个项目。

状态全体构成了文法G′的LR(0)规范族。

第八节 习题

一、单项选择题

1、中间代码生成所依据的是 。

a.语法规则 b.词法规则 c.语义规则 d.等价变换规则 2、四元式之间的联系是通过 实现的。 a.指示器 b.临时变量 c.符号表 d.程序变量 3、后缀式ab+cd+/可用表达式 来表示。

a.a+b/c+d b.(a+b)/(c+d) c.a+b/(c+d) d.a+b+c/d 4、表达式(┓A∨B)∧(C∨D)的逆波兰表示为 。 a. ┓AB∨∧CD∨ b. A┓B∨CD∨∧

c. AB∨┓CD∨∧

+ + 5、中间代码的树型表示A B + C D 所对应的表达式为 。

d. A┓B∨∧CD∨

a.A+B+C+D b.A+(B+C)+D c.(A+B)+C+D d.(A+B)+(C+D) 6、四元式表示法的优点为 。

a.不便于优化处理,但便于表的更动 b.不便于优化处理,但节省存储空间 c.便于优化处理,也便于表的更动 d.便于表的更动,也节省存储空间 7、终结符具有 属性。

a.传递 b.继承 c.抽象 d.综合

解答

1、选c。

2、四元式之间的联系是通过临时变量实现的,故选b。 3、选b。 4、选b。 5、选d。

6、四元式表示法的优点与间接三元式相同,故选c。

7、选d。 二、多顶选择题

1、中间代码主要有 。 a.四元式 b.二元式 c.三元式 d.后缀式 e.间接三元式 2、下面中间代码形式中,能正确表示算术表达式a+b+c的有 。

+ + e.a+b+c a.ab+c+ b.abc++ c. d.+ c a +

a b

b c

3、在下面的 语法制导翻译中,采用拉链-回填技术。 a.赋值语句 b.goto语句 c.条件语句 d.循环语句 4、下列 中间代码形式有益于优化处理。 a.三元式 b.四元式 c.间接三元式 d.逆波兰表示法 e.树形表示法 5、在编译程序中安排中间代码生成的目的是 。 a.便于进行存储空间的组织 b.利于目标代码的优化

c.利于编译程序的移植 d.利于目标代码的移植 e.利于提高目标代码的质量 6、下面的中间代码形式中, 能正确表示算术表达式a+b*c。题) * +

a.ab+c*

b.abc*+

+ c c.a+b*c d. a * e.

7、三地址代码语句具体实现通常有 表示方法。 a.逆波兰表示 b.三元式 c.间接三元式 d.树形表示 e.四元式 解答

1、选a、c、d、e。

2、b、d的中间代码不能正确表示a+b+c,而e 不是中间代码:故选a、c。 3、凡涉及到跳转的语句都需要采用拉链——回填技术,故选 b、c、d。 4、选b、c。 5、选b、d。 6、选b、e。 7、选b、c、e。

三、填空题

1、中间代码有 等形式,生成中间代码主要是为了使 。 2、语法制导翻译既可以用来产生 代码,也可以用来产生 指令,甚至可用来对输入串进行 。

3、当源程序中的标号出现“先引用后定义”时,中间代码的转移地址须持 时才能确定,因而要进行 。

4、文法符号的属性有两种,一种称为 ,另一种称为 。

5、后缀式abc-/所代表的表达式是 ,表达式(a-b)*c可用后缀式 表示。 6、用一张 辅以 的办法来表示中间代码,这种表示法称为间接三元式。 解答

1、逆波兰记号、树形表示、三元式、四元式 目标代码的优化容易实现 2、中间 目标 解释执行 3、标号定义 回填 4、继承属性 综合属性 5、a/(b-c) ab-c* 6、间接码表 三元式表 四、综合题

1、给出下列表达式的逆波兰表示(后缀式): ① a*(-b+c)

② (A∨B)∧(C∨┑D∧E)

2、写出算术表达式:A+B*(C-D)+E/(C-D)↑N的 ①四元式序列;②三元式序列;③间接三元式序列 解答1、

① ab@c+*;

② AB∨CD┑E∧∨∧

2、 ①表达式的四元式序列: ②表达式的三元式序列 ③间接三元式序列 (1)(-,C,D,T1) (1)(-,C,D) ⑴ (1)(-,C,D) (2)(*,B,T1,T2) (2)(*,B,(1)) ⑵ (2)(*,B,(1)) (3)(+,A,T2,T3) (3)(+,A,(2)) ⑶ (3)(+,A,(2)) (4)(-,C,D,T4) (4)(-,C,D) ⑴ ⑷ (↑,(1),N)

(5)(↑,T4,N,T5) (5)(↑,(4),N) ⑷ ⑸ (/,E,(4)) ⑹ (/,E,T5,T6) ⑹ (/,E,(5)) ⑸ ⑹ (+,(3),(5)) ⑺ (+,T3,T6,T7) ⑺ (+,(3),(6)) ⑹

第三节 习题

一、单项选择题

1、编译程序使用 区别标识符的作用域。 a. 说明标识符的过程或函数名 b. 说明标识符的过程或函数的静态层次

c. 说明标识符的过程或函数的动态层次 d. 标识符的行号 2、在目标代码生成阶段,符号表用于 。 a. 目标代码生成 b. 语义检查 c. 语法检查 d. 地址分配 3、过程信息表不包含 。

a. 过程入口地址 b. 过程的静态层次 c. 过程名 d. 过程参数信息 4、下列关于标识符和名字叙述中,正确的是 。 a. 标识符有一定的含义 b. 名字是一个没有意义的字符序列

c. 名字有确切的属性 d. a~c都不正确

解答:1、b 2、d 3、b 4、c 二、多项选择题

1、符号表的每一项均包含 。 a. 名字栏 b. 类型栏 c. 信息栏 d. 值栏 e. a~d均包含 2、对编译程序所用到的符号表,涉及的操作有 。 a. 填写或更新信息栏内容 b. 填入新名 c.给定名字,访问它的有关信息 d. 杂凑技术 e.线性表和排序二叉树 3、源程序中的错误一般有 。 a. 词法错误 b. 语法错误 c. 语义错误

d. 编译错误 e. 违反环境限制的错误

解答:1、a 、c 2、a、b、c 3、a、b、c、e 三、填空题

1、符号表中名字栏内容有两种填写方式,它们是 填写和 填写。 2、词法分析阶段的错误主要是 ,可通过 的办法纠正错误。 3、符号表中名字的有关信息在 和 过程中陆续填入。 4、在目标代码生成阶段,符号表是 的依据。

解答:1、标识符 标识符地址及长度2、拼写错误 最小距离匹配 3、词法分析 语法语义分析

4、地址分配 四、问答题:

1、在编译过程中为什么要建立符号表? 解答:

在编译过程中始终要涉及到对一些语法符号的处理,这就需要用到语法符号的相关属性。为了在需要时能找到这些语法成分及其相关属性,就必须使用一些表格来保存这些语法成分及其属性,这些表格就是符号表。

第四节 习题

一、单项选择题

1、程序所需的数据空间在程序运行前可确定,称为 管理技术。 a. 动态存储 b. 栈式存储 c. 静态存储 d. 堆式存储

2、堆式动态分配申请和释放存储空间遵守 原则。 a. 先请先放 b. 先请后放 c. 后请先放 d. 任意 3、静态分配允许程序出现 。

a. 递归过程 b. 可变体积的数据项目 c. 静态变量 d. 待定性质的名字 4、在编译方法中,动态存储分配的含义是 。

a. 在运行阶段对源程序中的数组、变量、参数等进行分配

b. 在编译阶段对源程序中的数组、变量、参数进行分配

c. 在编译阶段对源程序中的数组、变量、参数等进行分配,在运行时这些数组、变量、参数的地址可根据需要改变 d. 以上都不正确

5、在编译时有传名功能的高级程序语言是 。 a. Fortran b. Basic c. Pascal d. ALGOL

6、栈式动态分配与管理在过程返回时应做的工作有 。 a. 保护SP b. 恢复SP c.保护TOP d. 恢复TOP 解答1、c 2、d 3、c 4、a 5、d 6、b 二、多项选择题

1、下面 需要在运行阶段分配存储空间。

a. 数组 b. 指针变量 c.动态数组 d. 静态变量 e. 动态变量 2、栈式动态分配允许 。 a. 递归过程 b. 分程序结构 c. 动态变量

d. 动态数组 e. 静态数组

3、动态存储分配可采用的分配方案有 。 a. 队式存储分配 b.栈式存储分配 c.链式存储分配 d. 堆式存储分配 e.线性存储分配

4、栈式动态分配与管理因调用而进入过程之后,要做的工作是 。

a. 定义新的活动记录的SP b. 保护返回地址 c. 传递参数值 d. 建立DISPLAY表 e. 定义新的活动记录的TOP 5、静态分配不允许程序出现 。 a.递归过程 b. 静态数组 c.可变体积的数据项目

d. 待定性质的名字 e. 静态变量 6、活动记录包括 。 a. 局部变量 b. 连接数据 c. 形式单元

d. 局部数组的内情变量 e. 临时工作单元

解答 1、c e 2、a b d e 3、b d 4、abde 5、acd 6、abcde 三、填空题

1、FORTRAN语言采用了 存储空间分配方案,其程序所需的存储空间在 时确定。 2、一个函数的活动记录体积在 时确定,数组内情向量表的体积在 时确定, 3、目标程序运行的动态分配策略中,含有 和 分配策略

4、在Pascal中,由于允许用户动态地申请与释放内存空间,所以必须采用 存储分配技术。

5、如果两个临时变量名 不相交,则它们可分配在同一单元中。 6、堆式动态分配策略允许用户动态的 和 存储空间。 解答

1、静态 编译 2、编译 编译 3、栈式 堆式 4、堆式 5、作用域 6、申请 释放

第五节 习题

一、单项选择题

1、优化可生成 的目标代码。

a.运行时间较短 b.占用存储空间较小 c.运行时间短但占用内存空间大 d.运行时间短且占用存储空间小 2、下列 优化方法不是针对循优化进行的。 a.强度削弱 b.删除归纳变量 c.删除多余运算 d.代码外提 3、基本块内的优化为 。 a.代码外提,删除归纳变量 b.删除多余运算,删除无用赋值

c.强度削弱,代码外提 d.循环展开,循环合并 4、关于必经结点的二元关系,下列叙述中不正确的是 。 a.满足自反性 b.满足传递性 c.满足反对称性 d.满足对称性 5、对一个基本块来说, 是正确的。 a.只有一个入口语句和一个出口语句 b.有一个入口语句和多个出口语句

c.有多个入口语句和一个出口语句 d.有多个入口语句和多个出口语句 6、在程序流图中,我们称具有下述性质 的结点序列为一个循环。 a.它们是非连通的且只有一个入口结点 b.它们是强连通的但有多个入口结点

c.它们是非连通的但有多个入口结点 d.它们是强连通的且只有一个入口结点 7、 不可能是目标代码。 a.汇编指令代码 b.可重定位指令代码 c.绝对指令代码 d.中间代码 [解答]

1、优化的目的是使目标程序运行时间短、占用存储空间小,故选d。

2、删除多余运算属基本块优化,故选c。

3、基本块优化包括:合并已知量、删除无用赋值及删除多余运算,故选b。 4、必经结点满足自反性、传递性和反对称性关系,故选d。 5、选a。 6、选d。 7、选d。 二、多项选择题

1、根据优化所涉及的范围,可将优化分为 。 a.局部优化 b.过程优化 c.全局优化

d.循环优化 e.四元式优化 2、下列优化中,属于循环优化的有 。 a.强度削弱 b.合并已知量 c.删除无用赋值

d.删除归纳变量 e.代码外提

3、如果a→b是程序流图中的一条边,则由这条回边构成的循环由 结点组成。 a.a b.b c.有通路到达b的结点

d.有通路到达a且该通路上不经过b的结点 e.有通路到达b且该通路上不经过a的结点 4、采用无环有向图(DAG),可以实现的优化有 。 a.合并已知量 b.删除公共子表达式 c.强度削弱

d.删除无用赋值 e.删除归纳变量

5、编译程序的输出结果可以是 。 a.目标代码 b.汇编语言代码 c.中间代码

d.优化后的中间代码 e.可重定位代码

[解答] 1、选a、c、d。

2、循环优化包括:代码外提、强度削弱、删除归纳变量、循环展开和循环合并,故选a、b、e。 3、如果a→b是回边,则该回边的构成的循环由结点a、b和能够到达a但通路不经过b的结

点组成;故选a、b、d。

4、DAG图可进行基本块范围内的优化,故选a、b、d。 5、选b、c、d、e。 三、填空题 1、局部优化是 范围内进行的一种优化。

2、在一个基本块内,可实行3种优化方法,即合并已知量、 、 。 3、优化就是对程序进行各种 变换,使之能生成更有效的 。 4、在优化中,可把循环中的 提到循环外面去,这种方法称为 。 [解答]

1、基本块

2、删除无用赋值 删除多余运算 3、等价 目标代码 4、不变运算 代码外提