location: Current position: Home >> Scientific Research >> Paper Publications

基于LL(1)文法的印刷体数学公式结构分析方法

Hits:

Indexed by:期刊论文

Date of Publication:2006-05-30

Journal:大连理工大学学报

Included Journals:PKU、ISTIC、CSCD

Volume:46

Issue:3

Page Number:454-459

ISSN No.:1000-8608

Key Words:公式重构;结构分析;模式识别;LL(1)文法;神经网络

Abstract:当前的OCR(optical character recognition)系统对手写、打印文本都有很高的识别率,但是缺少对数学公式的结构进行分析及重组的功能. 为此,将程序设计语言编译程序的基本设计方法用于数学公式的结构分析. 重点介绍了上下标的定位、基于LL(1)文法的表达式构成规则和公式结构分析器的设计,并简略介绍了基于神经网络的数学符号识别方法. 对于印刷体科学文献中的数学表达式,先通过预处理和分类过程识别每一个数学符号,得到按左边界排序的一串字符. 然后通过结构分析器,进行上下标的定位以及前后关系的确定. 最后把结构分析器生成的语法树转换成可编辑的LaTex格式. 实例证明得到了比较满意的结果.

Pre One:Local maximum component-labeling based on parallel local operation sequence for layout analysis

Next One:多输出单元BP神经网络梯度算法的收敛性