古籍文档图像的文字切分与识别:基于深度学习的新方法

 

   报告简介

随着历史的变迁,有很多珍贵的历史文化遗产遗留下来,数字化及OCR对保护和研究这些古籍遗产具有极大意义。古籍文档中的文字一般都比较密集,且背景干扰及字迹残缺现象经常出现,这导致对古籍文档图像中的字符分割及识别带来了极大挑战。在此报告中,我将介绍我们提出的一种基于增量弱监督学习方法的古籍文字分类器训练方法、一种基于深度学习分类器指导的字符分割方法,以及一种联合字符识别及文字检测的深度学习字符检测新方法,实验结果表明:利用一个识别准确率超过97%的识别网络作为指导,我们在古籍文献字符的检测及切分方面均取得了比目前State-of-the-art方法更优越的性能。

 

个人简介

金连文,男,1968年出生,1991年本科毕业于中国科技大学无线电系,获无线电新技术专业及计算机软件及应用技术专业双学位,1996年于华南理工大学获博士学位。2006入选教育部新世纪优秀人才,2011年入选广东省“珠江学者”特聘教授。目前为华南理工大学二级教授,博士生导师,曾担任IEEE SPS Guangzhou Chapter主席(2014-2016),目前兼任广东省高校“音视频图文智能信息处理”工程研究中心主任、中国图像图形学学会常务理事、广东省图像图形学会副理事长、中国图像图形学学会文档图像分析与识别专委会主任、中国计算机学会(CCF)计算机视觉专委会委员、CCF人机交互专委会委员、中国人工智能学会模式识别专委会委员等职。主要研究领域为深度学习、机器学习、文字识别、计算机视觉、图像处理、人工智能系统、云计算与移动互联网终端应用技术等。在IEEE TPAMI、TNNLS、IEEE TCYB、IEEE TSMC、IEEE TMM、IEEE TII、IEEE TCSVT、Information Science、Pattern Recognition、Pattern Recognition Letter、Neurocomputing等主流SCI国际期刊上发表学术论文近50篇(其中ESI高引论文3篇),主流国际会议论文100余篇,获得发明专利授权41项,先后主持国家及省部级以上项目20余项,作为主要成员荣获省部级科技奖励4次。

 

发表评论

邮箱地址不会被公开。 必填项已用*标注