用C语言写解释器(一)——我们的目标

声明

为提高教学质量,我所在的学院正在筹划编写C语言教材。《用C语言写解释器》系列文章经整理后将收入书中“综合实验”一章。因此该系列的文章主要阅读对象定为刚学完C语言的学生(不要求有数据结构等其它知识),所以行文比較罗嗦,请勿见怪。本人水平有限,如有描写叙述不恰当或错误之处请指教!特此声明。

起因

近期,我们学院老师联系我,希望我能提供一段用 C 语言编写的 BASIC 解释器,用于 C 语言课程设计教学。我前段时间也正好着迷于“语言”本身,本就有打算写一个解释器,这下正中我下怀,于是欣然接受。

曾经在图书馆看过梁肇新的《编程高手箴言》,第四章“编程语言的运行机理”中就包括了一段 C 语言编写的 BASIC 解释器代码,但代码好像并不完整(我翻了好几遍,都没发现函数 get_token 的实现代码);再者,这次的代码还有其它用处,不宜牵涉版权问题;最后的原因是我有“想自己编码”的冲动 ^_^。综上所述,我要从零開始用 C 语言来编写一个 BASIC 解释器。

前置知识

1. 要编写解释器,首先就要明确什么是解释器(具体的解释请參看维基百科:http://zh.wikipedia.org/zh-cn/解释器)。盗用《编程高手箴言》里的话:解释程序就是一个字符串的解释器(P165 解释语言的原理)。所以,假设仅仅是为我个人编写的话,我宁可会借助 lex & yacc 甚至 perl,而不会纯粹用 C 语言来写。

2. 在起因中已经提过,这个程序会在学弟学妹们学完 C 语言后作为综合实验。因此须要你熟悉 C 语言的语法、单链表加入/删除节点等操作以及栈的概念(这些内容大部分都能在 C 语言的教材中找到),一些相对冷僻的技术(比如 setjmp/longjmp)则不会出如今程序中。

关于语言

我在《编程和语言之我见》一文中提过,编程是一个非常宽泛的概念。从某种意义上来说全部的软件都是一种特定的语言,但依据程序本身的灵活性能够分为“硬编码”、“可配置”、“可控制”和“可编程”四类(详见《四类程序》)。假设一个程序的灵活性达到了“可编程”,它的配置文件就能够被看作一种“编程语言”,而该程序本身也就是一个“解释器”。

要做到“可编程”,程序至少应该具备“输入/输出”、“表达式运算”、“内存管理”和“按条件跳转”四个功能(详见《用DOS批处理来做数字图像处理》)。这正好相应了冯·诺依曼计算机的结构:以运算器和控制器为中心,输入/输出设备与存储器之间的传输数据都要经过运算器。以下具体介绍各个部分。

我们的目标

我们要编写解释器,自然也逃不出上面的条条例例。语法就參考 BASIC,但由于是设计我们自己的语言,当然能够依据个人兴趣进行“添油加醋”(比方表达式里提供神往已久的阶乘运算 ^_^)。以下是一段 BASIC 的演示样例代码(example.bas):

0009 N = 0
0010 WHILE N < 1 OR N > 20
0011   PRINT "请输入一个1-20之间的数"
0012   INPUT N
0013 WEND
0020 FOR I = 1 TO N
0030   L = "*"
0040   FOR J = 1 TO N - I
0050     L = " " + L
0060   NEXT
0070   FOR J = 2 TO 2 * I - 1 STEP 2
0080     L = L + "**"
0090   NEXT
0100   PRINT L
0110 NEXT
0120 I = N - 1
0130 L = ""
0140 FOR J = 1 TO N - I
0150   L = L + " "
0160 NEXT
0170 FOR J = 1 TO ((2*I) - 1)
0180   L = L + "*"
0190 NEXT
0200 PRINT L
0210 I = I - 1
0220 IF I > 0 THEN
0230   GOTO 130
0240 ELSE
0250   PRINT "By redraiment"
0260 END IF

BASIC 语法要求行首提供一个 1->9999 之间的数字作为该行的行号(当前行的行号不小于上一行的行号),供 GOTO 语句跳转时调用。BASIC 的语法比 C 严格,这不仅能够减少代码的复杂性还使语言本身更易学。上面的代码差点儿相同涵盖了我们须要实现的全部功能,假设能被正确解析,你将看到以下的运行效果:


以下来依次讨论要实现的功能。

输入/输出(IO)

通过输入/输出来和外部程序或人交互,这是脱离“硬编码”的最基本要求。输入/输出也是非常抽象的概念,它并不局限于标准输入输出端(键盘、显示器等),也能够通过文件、互联网等方式获得数据(因此 C 语言中除了 scanf、printf 等,事实上 #include 指令也算是一种 IO 操作)。我们这个程序并不强调 IO,因此仅仅要求实现 INPUT 和 PRINT 两条指令,分别用于从键盘输入数据和打印到屏幕。指令的格式例如以下:

INPUT var[, var ...]当中 var 代表变量名(下同),变量之间用逗号隔开。作用:从键盘获得一个或多个值,并赋值到相应的变量。同一时候输入多个变量时,输入的每一个数之间用空格、回车或制表符隔开。比如:INPUT A, B, C
PRINT expression[, expression ...]当中 expression 为表达式(下同),表达式之间用逗号隔开。作用:对表达式求值,将结果输出到屏幕并换行。假设有多个表达式,表达式之间用制表符(/t)隔开。比如:PRINT I * 3 + 1, (A + B)*(C + D)

表达式运算

在《DOS》中我称呼它为“算术运算”。但对于计算机来说,“算术运算”不仅包括诸如“四则运算”等算术运算,还包括“关系运算”和“逻辑运算”。为了避免歧义,在此就改称它为“表达式运算”。“表达式运算”是整个程序的核心,地位相当于计算机的运算器。在我们的程序中,须要实现以下几种运算符:

符号名称优先级结合性
(左括号17left2right
)右边17left2right
+12left2right
-12left2right
*13left2right
/13left2right
%取模13left2right
^求幂14left2right
+正号16right2left
-负号16right2left
!阶乘16left2right
>大于10left2right
<小于10left2right
=等于9left2right
<>不等于9left2right
<=不大于10left2right
>=不小于10left2right
AND逻辑与5left2right
OR逻辑或4left2right
NOT逻辑非15right2left

内存管理

在我们这个迷你型的解释器中,能够不用考虑内存空间动态分配的问题,仅仅要实现简单的变量管理。我们默认提供 A-Z 26个可用的弱类型变量(能够任意赋值为整数、浮点数或字符串)。变量要求先赋值才干使用,否则就会提示变量不可用(因此演示样例代码中第一行就是给 N 赋值为 0)。赋值语句的格式为

[LET] var = expression当中 LET 是可选的keyword。BASIC 中不同意出现 var1 = var2 = expression 这种赋值语句,由于在表达式中“=”被翻译为“等于”,所以赋值符合没有出如今上面的表格中。作用:计算表达式的值,并将结果赋值给变量 var。比如:I = (123 + 456) * 0.09

按条件跳转

假设设计一门最简洁的语言,那它的控制语句就仅仅需提供像汇编中的 JMP、JNZ 等依据条件跳转的语句就可以,通过它们的组合就可以模拟出 IF、WHILE、FOR、GOTO 等控制语句。但 BASIC 作为一门高级语言,须要提供更高层、更抽象的语句。我们将会实现以下四条语句:

1)
GOTO expression当中 expression 是一个数值表达式,计算结果必须为可用的行号。由于它是一个表达式,通过动态计算就能模拟子程序调用。作用:无条件跳转到指定行。比如:GOTO 120+10
2)
IF expression THENsentence1
[ELSEsentence2]
END IF当中 sentence 是语句块(下同),包括一条或多条可运行语句。ELSE 为可选部分。作用:分支结构。但表达式值为真(数字不等于0或者字符串不为空)时运行语句块1;否则,有 ELSE 语句块时运行 ELSE 语句块。比如:IF 1=1 THENPRINT "TRUE"ELSEPRINT "FALSE"END IF
3)
FOR var = expression TO expression [STEP expression]sentence
NEXT全部表达式均为数值表达式。STEP 为可选部分,为迭代器的步长。步长表达式的值不同意为 0。作用:循环迭代结构比如:FOR I = 1 TO 10 STEP 3PRINT INEXT
4)
WHILE expressionsentence
WEND作用:迭代运行语句块,直到表达式的值为假。比如:WHILE N < 10N = N + 1WEND

很多其它细节

  1. BASIC 的源代码不区分大写和小写;
  2. 本程序在实现中没有处理字符转义,因此无法无法输出双引號。在介绍全然部源代码后,假设你有兴趣能够尝试自行完好;
  3. 本程序相同没有考虑凝视(REM keyword)。事实上这非常easy,但这个问题相同留给你来处理 ^_^;
  4. 或许你也会有兴趣加入 GOSUB 和 RETURN keyword,让子程序功能从 GOTO 中解放出来。

总结

这一篇主要介绍了我们编写的解释器要实现的功能,接下来会有一系列文章来逐步具体介绍解释器的实现。在下一篇中会首先介绍解释器的核心部分——表达式求值。请关注《用C语言写解释器(二)》。


版权声明

请尊重原创作品。转载请保持文章完整性,并以超链接形式注明原始作者“redraiment”和主网站地址,方便其它朋友提问和指正。

联系方式

我的邮箱,欢迎来信(redraiment@gmail.com)
我的Blogger(子清行):http://redraiment.blogspot.com/
我的Google Sites(子清行):https://sites.google.com/site/redraiment
我的CSDN博客(梦婷轩):http://blog.csdn.net/redraiment
我的百度空间(梦婷轩):http://hi.baidu.com/redraiment

转载于:https://www.cnblogs.com/bhlsheji/p/4298144.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/259351.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【详解Java中格式化处理】

在Java中我们需要对一个数字进行四舍五入处理或者是对一个字符串进行格式化处理&#xff0c;我们需要使用String.Format方法或者其他格式化方法 一、Format方法 比如&#xff1a;DecimalFormat df new DecimalFormat&#xff08;"#.00"&#xff09;&#xff1b;S…

HDU4506 小明系列故事——师兄帮帮忙

问题链接&#xff1a;HDU4506 小明系列故事——师兄帮帮忙。 问题描述&#xff1a;参见上述链接。 问题分析&#xff1a;&#xff08;略&#xff09;。 程序说明&#xff1a;函数powermod()是快速模幂函数。 AC的C语言程序如下&#xff1a; /* HDU4506 小明系列故事——师兄帮帮…

1_MVC+EF+Autofac(dbfirst)轻型项目框架_core层(以登陆为例)

前言 在上一篇0_MVCEFAutofac(dbfirst)轻型项目框架_基本框架中&#xff0c;我已经介绍了这个轻型框架的层次结构&#xff0c;在下面的这篇文章中&#xff0c;我将以教师登陆功能为例&#xff0c;具体来扩充下我的core层的代码。 在这之前&#xff0c;我想先补充讨论下是否有必…

文字转语音+html5,JS实现文字转语音并播放

html&#xff1a;div>audio>div>js&#xff1a;function doTTS() {var ttsDiv document.getElementById(bdtts_div_id);var ttsAudio document.getElementById(tts_autio_id);var ttsText document.getElementById(ttsText).value;// 文字转语音ttsDiv.removeChild…

字符串的全排列和组合算法

全排列在笔试面试中很热门&#xff0c;因为它难度适中&#xff0c;既可以考察递归实现&#xff0c;又能进一步考察非递归的实现&#xff0c;便于区分出考生的水平。所以在百度和迅雷的校园招聘以及程序员和软件设计师的考试中都考到了&#xff0c;因此本文对全排列作下总结帮助…

设计模式基于C#的工程化实现及扩展

设计模式基于C#的工程化实现及扩展 转载于:https://www.cnblogs.com/gzmg/p/3344833.html

Python实现atm机的功能

主要还是参考网上内容&#xff0c;自己做了修改。虽然代码有小bug&#xff0c;但是不影响学习和测试。功能&#xff1a;1.额度&#xff1a;80002.可以提现&#xff0c;手续费5%3.每月最后一天出账单&#xff0c;写入文件4.记录每月日常消费流水5.提供还款接口1.atm的脚本[rootp…

Direct ByteBuffer学习

ByteBuffer有两种一种是heap ByteBuffer,该类对象分配在JVM的堆内存里面&#xff0c;直接由Java虚拟机负责垃圾回收&#xff0c;一种是direct ByteBuffer是通过jni在虚拟机外内存中分配的。通过jmap无法查看该快内存的使用情况。只能通过top来看它的内存使用情况。 JVM堆内存大…

魔兽争霸Ⅲ运行时不能初始化directX的错误解决

运行魔兽争霸3不能初始化DirectX错误这样解决&#xff1a; 1&#xff1a;在运行中输入(winr)&#xff1a;dxdiag&#xff0c;查看显示栏&#xff0c;确定电脑已安装好directx 8.1以上&#xff0c;且下面的三个加速都已开启。 2&#xff1a;如果没有安装directx就下载安装一个&a…

Android7.0占用空间,Android7.0 开发者注意事项

1、当设备处于充电状态且屏幕已关闭一定时间后&#xff0c;设备会进入低电耗模式并应用第一部分限制&#xff1a;关闭应用网络访问、推迟作业和同步。如果进入低电耗模式后设备处于静止状态达到一定时间&#xff0c;系统则会对 PowerManager.WakeLock、AlarmManager 闹铃、GPS …

Android探索之旅 | 面向对象和Java基础

-- 作者 谢恩铭 转载请注明出处 上一篇 Android探索之旅 | Android简介 中说到&#xff1a; "Android的默认开发语言是Java&#xff0c;入门简单。而且&#xff0c;你的Java水平不需要多好就可以上手开发Android App了。" 不少朋友说看到后很是心安。 不过小编也不想…

DataGirdView 编辑项时的验证

dgvConfig.DataSource CreateTable();dgvConfig.Columns["编号"].ReadOnly true; //只读dgvConfig.AllowUserToAddRows false; //不允许添加新行dgvConfig.EditingControlShowing new DataGridViewEditingControlShowingEventHandler(dgvConfig_EditingControlS…

使用Vitamio打造自己的Android万能播放器(7)——在线播放(下载视频)

前言 本章将实现非常实用的功能——下载在线视频。涉及到多线程、线程更新UI等技术&#xff0c;还需思考产品的设计&#xff0c;如何将新加的功能更好的融入到现有的产品中&#xff0c;并不是简单的加一个界面就行了&#xff0c;欢迎大家交流产品设计和技术细节实现&#xff01…

生成0到1之间随机数的C代码

#include <stdlib.h>#include <stdio.h>#include <time.h>int main(){srand((unsigned)time(NULL));int i;double r;for(i0;i<50;i){r(float)rand()/RAND_MAX; printf("%f\n",r);}return 0;}

HTML声明文档类型后样式出错,doctype如何声明

如何doctype声明&#xff0c;新增的结构元素和功能元素HTML5已形成了最终的标准&#xff0c;概括来讲&#xff0c;它主要是关于图像&#xff0c;位置&#xff0c;存储&#xff0c;多任务等功能的增加。 新增的元素有绘画 canvas &#xff0c;用于媒介回放的 video 和 audio 元素…

Error-Project facet Java version 1.8 is not supported

最近导入最新的Strtus2.5.10.1 Demo时出现了这个错误 解决方案如下&#xff1a; 选中工程——右键——Properties 然后依次展开找到如图所示内容&#xff0c;将1.8改成1.7即可。 原因&#xff1a;工程默认配置是1.8&#xff0c;而本地环境JDK版本为1.7&#xff0c;两则不匹配造…

6.2

转载于:https://www.cnblogs.com/tutuaixiaomei/p/3354356.html

Tomcat全攻略

内容&#xff1a; 一&#xff1a;简单介绍二&#xff1a;安装及配置三&#xff1a;应用四&#xff1a;综述參考资料关于作者宗 锋西北大学计算机系硕士2001 年 12 月 随着java的流行&#xff0c;其在web上的应用也越来越广&#xff0c;tomcat作为一个开源的servlet容器&#xf…

《G档案》中关于游戏程序设计的文章

刚拿到前导的《G档案》&#xff0c;发现了主程刘刚的文章&#xff0c;是目前我所见 到的关于游戏编程的最好的一篇&#xff0c;与大家共享。转载&#xff1a;http://www.360doc.cn/article/2778_53476.html PC游戏编程 目录 1 游戏程序理论 1.1 技术基础 1.2 游戏底层 1.3 编…

shell笔记

system 磁盘 磁盘空间使用情况df查看文件或目录大小du挂载usb sudo fdisk -l # Find what the drive is called e.g. /dev/sdb1 sudo mkdir /media/usb sudo mount /dev/sdb1 /media/usb sudo umount /media/usb# umount sudo umount /media/usb utils awk 打印文件的第一列(域…