小C语言--词法分析程序

  

小C语言–词法分析程序
Time Limit: 1000 ms Memory Limit: 65535 KiB
Problem Description

小C语言文法

  1. <程序>→(){<声明序列><语句序列>}

  2. <声明序列>→<声明序列><声明语句>|<声明语句>|<空>

  3. <声明语句>→<标识符表>;

  4. <标识符表>→<标识符>,<标识符表>|<标识符>

  5. <语句序列>→<语句序列><语句>|<语句>

  6. <语句>→< if语句>|< while语句>|< for语句>|<复合语句>|<赋值语句>

  7. < if语句>→< if关键字>(<表达式>)<复合语句>|(<表达式>)<复合语句>< else关键字><复合语句>

  8. < while语句>→< while关键字>(<表达式>)<复合语句>

  9. < for语句>→< for关键字>(<表达式>;<表达式>;<表达式>)<复合语句>

  10. <复合语句>→{<语句序列>}

  11. <赋值语句>→<表达式>;

  12. <表达式>→<标识符>=<算数表达式>|<布尔表达式>

  13. <布尔表达式>→<算数表达式> |<算数表达式><关系运算符><算数表达式>

  14. <关系运算符>→>|<|>=|<=|==|!=

  15. <算数表达式>→<算数表达式>+<项>|<算数表达式>-<项>|<项>

  16. <项>→<项>*<因子>|<项>/<因子>|<因子>

  17. <因子>→<标识符>|<无符号整数>|(<算数表达式>)

  18. <标识符>→<字母>|<标识符><字母>|<标识符><数字>

  19. <无符号整数>→<数字>|<无符号整数><数字>

  20. <字母>→a|b|…|z|A|B|…|Z

  21. <数字>→0|1|2|3|4|5|6|7|8|9

  22. < main关键字>→main

  23. < if关键字>→if

  24. < else关键字>→else

  25. < for关键字>→for

  26. < while关键字>→while

  27. < int关键字>→int

每行单词数不超过10个
小C语言文法如上,现在我们对小C语言写的一个源程序进行词法分析,分析出关键字、自定义标识符、整数、界符
和运算符。
关键字:main if else for while int
自定义标识符:除关键字外的标识符
整数:无符号整数
界符:{ } ( ) , ;
运算符:= + - * / < <= > >= == !=
Input

输入一个小C语言源程序,源程序长度不超过2000个字符,保证输入合法。
Output

按照源程序中单词出现顺序输出,输出二元组形式的单词串。

(单词种类,单词值)

单词一共5个种类:

关键字:用keyword表示
自定义标识符:用identifier表示
整数:用integer表示
界符:用boundary表示
运算符:用operator表示

每种单词值用该单词的符号串表示。
Sample Input

main()
{
int a, b;
if(a == 10)
{
a = b;
}
}

Sample Output

(keyword,main)
(boundary,()
(boundary,))
(boundary,{)
(keyword,int)
(identifier,a)
(boundary,)
(identifier,b)
(boundary,; )
(keyword,if)
(boundary,()
(identifier,a)
(operator,==)
(integer,10)
(boundary,))
(boundary,{)
(identifier,a)
(operator,=)
(identifier,b)
(boundary,; )
(boundary,})
(boundary,})

Hint
Source
cai++

#include <stdio.h>
#include <string.h>

int main()
{
    char str[85];
    char ss[80];
    memset(str,0,sizeof(str));
    while(gets(str) != NULL)
    {
        int i,j,len;
        memset(ss,0,sizeof(ss));      //把字符置为空串
        len = strlen(str);
        j = 0;
        for(i = 0; i < len; i++)
        {
            if((str[i] >= 'a' && str[i] <= 'z') || (str[i] >= 'A' && str[i] <= 'Z') || str[i] == '_')    //若第一个字符为字母或者下划线,则可能为标识符或者关键字
            {
               for(; i < len ; i++)
               {
                   if( (str[i] >= 'a' && str[i] <= 'z') || (str[i] >= 'A' && str[i] <= 'Z') || str[i] == '_' || (str[i] >= '0' && str[i] <= '9'))   //标识符可以由数字组成
                   {
                       ss[j++] = str[i];          //所有的满足条件的保存在ss数组里
                   }
                   else            //遇到的第一个非字母非数字非下划线 退出循环
                   {
                       break;
                   }
               }
               ss[j] = '\0';             
               //判断是否是关键字
               if(strcmp(ss,"main") == 0 || strcmp(ss,"if") == 0 || strcmp(ss,"else") == 0 || strcmp(ss,"for") == 0 || strcmp(ss,"while") == 0 || strcmp(ss,"int") == 0)
               {
                   printf("(keyword,%s)\n",ss);
               }
               else
               {
                   printf("(identifier,%s)\n",ss);
               }
               memset(ss,0,sizeof(ss));   //字符数组保存为空串,以免影响下一次的判断
               j = 0;
               
               i = i - 1;

            }
            else if(str[i] == '(' || str[i] == ')' || str[i] == '{' || str[i] == '}' || str[i] == ',' || str[i] == ';')    //界符直接输出
            {
                printf("(boundary,%c)\n",str[i]);
            }
            else if(str[i] >= '0' && str[i] <= '9')
            {
                for(;i < len; i++)
                {
                    if(str[i] >= '0' && str[i] <= '9')        //把所有整数保存到ss数组里
                    {
                        ss[j++] = str[i];
                    }
                    else
                    {
                        break;
                    }
                }
                ss[j] = '\0';
                printf("(integer,%s)\n",ss);

                memset(ss,0,sizeof(ss));
                j = 0; 
                i = i - 1;
            }
            else if(str[i] == '=' || str[i] == '+' || str[i] == '-' || str[i] == '*' || str[i] == '/' || str[i] == '<' || str[i] == '>' || str[i] == '!')   //若是运算符
            {
                if(i == len - 1)    //若后面没有等号了,则直接输出
                {
                    printf("(operator,%c)\n",str[i]);
                }
                else
                {
                    if(str[i+1] == '=')     //若后面还有等号,为一个运算符
                    {
                        printf("(operator,%c%c)\n",str[i],str[i+1]);
                        i += 1;
                    }
                    else
                    {
                        printf("(operator,%c)\n",str[i]);
                    }
                }
            }
            
        }
        memset(str,0,sizeof(str));
    }
    return 0;
}

相关文章