如何优化文本检测与识别?类脑大讲堂为你解惑!

点击:2230次发布日期:2021-07-24

7月23日上午,类脑大讲堂第七课正式开讲,本期我们邀请到了中国科学技术大学信息学院特任教授、博导,国家优秀青年科学基金获得者谢洪涛教授及其团队,为公司员工作题为《场景文本检测与识别》的报告分享,中科类脑部分员工代表参与培训。


本期嘉宾/  谢洪涛


谢洪涛,从事多媒体内容安全和医学影像智能分析的研究,包括视觉内容检测与识别、视频图像内容检索、数字图像篡改检测与取证等。以第一或通讯作者在国际著名期刊/会议上发表学术论文80余篇,含顶级期刊/会议论文40余篇;主持科研项目10余项,含国家重点研发计划课题1项、国家自然科学基金联合基金重点项目1项。研究成果在国家相关部门和商业公司的线上系统获得大规模应用,取得积极效果。获国家自然科学奖二等奖、中国电子学会自然科学奖一等奖、入选中科院青年创新促进会。


640.webp.jpg


提到文本检测与识别,想必很多人都不陌生,它正在被广泛运用到我们的日常生产、生活中,例如路牌识别、证件、票据识别,商品识别,文本翻译等,充分发挥文本检测与识别的技术优势,将大大提升我们的工作、学习效率。


641.webp.jpg

▲ 中国科学技术大学信息学院特任教授,博导谢洪涛


但是考虑到文本与背景环境的关联、文本的多样性等元素,如何通过技术手段提升检测与识别的准确率?如何进一步优化技术方案?培训中,谢洪涛教授从文本检测、文本识别的基本概念说起,深入分析了当下文本检测与识别过程中所遇到的难题,着重介绍了团队在该领域所做的创新探索。


他表示,随着研究的进一步深入,检测和识别的连接、更复杂的文本、更轻量级的算法等将成为场景文本检测与识别未来的发展趋势。


642.webp.jpg

▲ 谢洪涛教授团队成员Yuxin Wang


在前段时间落幕的2021年ICDAR国际会议的文档照片组件分割比赛中,中国科学技术大学智能多媒体内容计算实验室(IMCC-Lab)联合中科类脑在文本区域分割任务中夺得全球第三名。培训过程中,谢洪涛教授团队成员Yuxin Wang受邀作此次比赛总结交流,Yuxin Wang立足赛事本身,从任务背景、任务难点、参赛方案等方面出发,全方位地为公司员工带来了宝贵的经验分享。


在随后的互动交流环节,中科类脑参与培训的同事积极提问,围绕文本检测与识别相关话题与谢教授团队展开详实交流。


更多精彩,下期继续!