Current position: Home >> Scientific Research >> Paper Publications

基于LL(1)文法的印刷体数学公式结构分析方法

Release Time:2019-03-10  Hits:

Indexed by: Journal Article

Date of Publication: 2006-05-30

Journal: 大连理工大学学报

Included Journals: CSCD、ISTIC、PKU

Volume: 46

Issue: 3

Page Number: 454-459

ISSN: 1000-8608

Key Words: 公式重构;结构分析;模式识别;LL(1)文法;神经网络

Abstract: 当前的OCR(optical character recognition)系统对手写、打印文本都有很高的识别率,但是缺少对数学公式的结构进行分析及重组的功能. 为此,将程序设计语言编译程序的基本设计方法用于数学公式的结构分析. 重点介绍了上下标的定位、基于LL(1)文法的表达式构成规则和公式结构分析器的设计,并简略介绍了基于神经网络的数学符号识别方法. 对于印刷体科学文献中的数学表达式,先通过预处理和分类过程识别每一个数学符号,得到按左边界排序的一串字符. 然后通过结构分析器,进行上下标的定位以及前后关系的确定. 最后把结构分析器生成的语法树转换成可编辑的LaTex格式. 实例证明得到了比较满意的结果.

Prev One:Local maximum component-labeling based on parallel local operation sequence for layout analysis

Next One:多输出单元BP神经网络梯度算法的收敛性