公示专区

2018年国家科学技术进步奖项目提名公示——语言智能评测关键技术及应用
上传时间:2017年12月14日      浏览次数:

 

一、项目名称:语言智能评测关键技术及应用

二、提名单位意见:

该项目成果是在国家重大项目和北京市高精尖创新项目支持下取得的,项目团队历经近10年的潜心研究,取得了多项原创性成果。项目聚焦国家教育发展和文化传播的重大需求,针对机器评测与人工评测拟合度不高的世界难题,开展联合攻关,突破了句法、篇章、语义等智能评测关键技术,创建语言智能评测体系,研发了系列语言智能评测产品并大规模推广应用。

该项目首次提出了全信息语言评测模型,解决了语言评测的精确性问题;构建了大规模评测本体知识库,解决了评测的语义和推理的问题;构建了大规模评测语料库和规则库,解决了评测中语法搭配问题;提出了篇章主题聚合度模型,解决了篇章与主题一致性的评测问题;提出文档自动编辑和转换模型,解决了评测文本自动生成的难题。集成上述五种语言智能评测关键技术,自主研发了语言智能评测应用产品。

项目成果在教育领域得到大规模应用,累计服务6万多所学校,1.2亿用户。成果创新了教育教学模式,为解决国家教育均衡发展提供了有效技术手段,2017720日人民日报以“人工智能如何献力教育均衡发展”为专题进行了报道,中央人民政府网站全文转载。项目取得了巨大社会效益和经济效益,获得了2017年度北京市科学技术奖二等奖。

对照国家科学进步奖授奖条件,提名该项目申报2018年国家科学技术进步奖二等奖。


 

三、项目简介(不超过1200字):

人工智能已上升为国家战略,语言智能是人工智能的重要组成部分。项目在国际上率先提出“语言智能”概念,取得语言智能评测关键技术重大突破。面向我国每年1亿多学生学外语、全世界每年数以亿计的外国人学汉语的重大需求,研发了具有国际领先水平的语言智能评测产品并大规模应用,有力助推了国家教育均衡发展和国际文化传播战略的实施。本项目主要创新点有:

   1.首次提出全信息语言评测模型,解决了语言评测的精确性问题。提出文本语义离散度表示和多知识融合方法,构建词汇、句法、语义、篇章等多维度的全信息语言评测模型,实现不同粒度的点评、建议和综合评分,突破了机器评测与人工评测拟合度不高的瓶颈。人工拟合度达92.03%,超过美国教育考试服务中心E-rater机器评测人工拟合度。

   2.构建大规模评测本体知识库,解决了评测中的语义和推理关键难题。提出本体半自动生成和本体映射方法,建立确定和不确定知识的本体表示模型,突破人工构建本体知识库耗时耗力的瓶颈,建设评测本体知识库,解决了评测中的语义搭配、语义消歧和逻辑推理等难题。评测本体知识库构建技术处在世界前列,形成知识管理国家标准。

   3.构建大规模评测语料库和规则库,解决了评测中的语法搭配问题。提出异源语料融合方法,构建大规模训练和评测语料库,总结不同词类的句法框架和组合规则,在语料库中统计有效搭配组合,基于规则和大数据统计解决了评测中的语法组合及语序规则等问题。中英文评测语料库和中文评测句法规则库规模处于世界前列,形成术语数据库国家标准。

4.提出篇章主题聚合度模型,突破了篇章与主题一致性评测的难题。提出句法成分和篇章主题的语义关系计算方法,模拟人类大脑神经元非线性结构,构建篇章主题聚合度计算模型,实现了篇章主题语义网络与句法成分语义网络相关性智能判定。中英文主题评测准确度分别提升11.3%9.5%

5.提出文档自动编辑和转换模型,解决了评测文本自动生成的难题。项目研发了XML文档的格式自动排版技术、XML文档自动编辑技术、多线程环境下并行XSLT转换技术和基于XML的不同格式文档的转换技术,解决了大规模评测文档自动生成、格式转换和高效网络传输的难题。评测文档生成效率较之前提升60%

项目已在国内外重要学术期刊和会议上发表论文172篇;出版专著2部;申请发明专利26项(已授权8项),已授权实用新型专利1项;获软件著作权21项;形成国家标准6项。批改网已成为世界最大英语作文批改系统,中文在线数字阅读平台已覆盖全国,累计服务6万多所学校,1.2亿用户。近三年产品直接经济效益15.07亿元。语言评测主要是公益服务,评测作文逾3.65亿篇,若以20/篇普通标准计算,其惠民经济效益逾70亿元,为落实国家教育均衡发展和教育精准扶贫的战略,产品应用于“智能均教百县示范建设工程”,提高了学生核心素养,受到各级政府和大中小学的高度认可,对教育智能化、均衡化以及教育模式改革做出了重大贡献。


 

四、客观评价:2页,分段描述

1.李德毅院士、赵沁平院士等专家对首都师范大学语言智能评测关键技术及应用研究成果形成如下意见:(1)在当前全球人工智能研究的热潮中,科大讯飞和首师大分别在语音和文字上形成了我国语言智能研究的特色,处于国际领先地位。(2)项目集成语言智能评测关键技术,自主研发了语言智能评测系统并在教育领域大规模应用,数千万师生受益,社会效益和经济效益显著。(3)该研究提出了超高维语言评测模型,解决了语言评测的精确性问题,通过构建大规模评测本体知识库,解决了评测语义和推理的问题。研究所提出的语言评测模型和篇章主题聚合度理论,在同类研究中处于国际领先水平。

2.2017720日,人民日报专刊报道:语言智能评测关键技术广泛应用于用智能教育与教育均衡示范工程,促进教育公平,眼光非常独到,信息技术和教育相结合,能够建立贯穿教育教学的三大空间,即课前的教师备课、学生预习,课中的课堂授课过程,课后的作业批改、数据统计分析。互动课堂、智能学习、资源推荐、管理平台、移动学习等智能教育产品为教育均衡发展提供了有力支撑。

3.中国写作学会专家对语言评测技术进行评审,形成如下意见:“汉语作文智能批改系统以计算机为主体在线批改作文,打破了传统作文教学模式所存在的时间和空间限制,既减轻了教师的批改任务,同时又提高了学生的写作兴趣。让汉语批改更快、更科学,让汉语写作更有效、更有趣。作为国内中文批改产品的领导者,汉语作文智能批改系统在国际上也处于技术领先地位。不仅能够有效提高汉语作文教学水平,还能服务于国家重大战略需求,促进教育均衡发展和中华文化传承”。

4.清华大学外国语言文学系专家对批改网的评审意见如下:“批改网“形成性评估模式”提高了学生的自主学习能力,不仅指出基本错误,还能通过英语本族语料库提供不同修改建议,激发学生的写作积极性。批改网辅助英语教学,提高教师工作效率,充分体现教师价值。借助批改网,教师可以摆脱繁重的基础批改任务,从逻辑、内容等宏观层面高效准确地指导学生。批改网将传统教育与现代技术相结合,创建新的教学形式。批改网不仅能够为教师提供个性化教学的数据支持,还可以为教师提供以批改网语料库为基础的分析工具,辅助教师开展教学应用研究。总之,批改网对英语教学起到明显的促进作用”。

5.中国教育技术协会专家对句酷批改网进行评审,形成如下意见:“批改网结合教育专家多年实践教学经验,将语料库和云计算等技术运用于英语文章在线智能评测,具有科学性、实时性、开放性、灵活性、针对性等特点。该系统的布置作文、按句点评、修改建议、语料库数据等主要功能为各级院校师生提供自动化实时反馈。专业语料库和汇总数据还能够为教师提供个性化的教学和研究素材。该系统提供的评测反馈信息为教师节约了批改基本错误的时间,从而提高了教师的工作效率,使其能够为学生提供个性化指导。该系统的自学习、自完善能力体现了人工智能技术的较好应用”。

该项目已获得了北京市科学技术奖二等奖(2017),已在国内外重要学术期刊和会议上发表论文172篇;出版专著2部;申请发明专利26项(已授权8项),已授权实用新型专利1项;获软件著作权21项;形成国家标准6项。

 

五、推广应用情况:

针对语言智能评测技术难题,经过团队近10年联合攻关,取得系列创新成果,抢占世界科技制高点,成果在教育领域得到大规模应用,已累计服务6万多所学校,1.2亿用户。该项目成果创新了教育教学的新模式,为解决国家的教育均衡发展提供有效的技术手段,在“智能教育与教育均衡发展百县示范建设工程”中广泛应用。2017720日人民日报以“人工智能如何献力教育均衡发展”为专题进行了报道,中央人民政府网站当天转载。该项目取得了巨大社会效益和经济效益。

 

 

 


主要应用单位情况(不超过15个)

序号

应用单位名称

应用技术

应用起止时间

应用单位

联系人及电话

应用情况

1

清华大学

语言智能评测系统

2012/052017/12

沈明波

010-62793001

清华大学2011年开始试用,20123月正式应用。截至201712月,共924位老师和25471名学生使用,学生共评测12.5万篇。效果显著。

2

中国人民大学

附属中学

语言智能评测系统

2016/102017/12

谭松柏

010-62516021

人大附中利用项目成果结合教师的科学指导,聚焦学生书面表达能力培养、提升作文批改效率;利用语言智能评测系统及时反馈的特点反复修改,促进学生进步。效果显著。

3

北京市东城区

第一图书馆

语言智能阅读

测评平台

2015/032017/12

高磊

13911761167

东城区第一图书馆2015年正式应用此项成果,到目前为止效果良好。

4

清华附小

语言智能阅读

测评平台

2016/082017/12

汤卫红15910962258

清华附小2016年正式使用此项平台,反应效果良好。

5

北京第六十五中学

语言智能阅读

测评平台

2016/102017/12

蔡雷13522017297

六十五中2016年正式使用测评平台,有效提升了教学质量,效果良好。

6

安徽阜阳第五中学

语言智能阅读

测评平台

2017/102017/12

周群18605582906

阜阳五中2017年正式使用该项成果,有效提升评测效果,反应效果良好。

7

四川南充市

白塔中学

语言智能评测系统

2011/122017/12

 

马长清

0817-3360330

白塔中学2011年开始使用该成果提高该校的教学,有效减轻了老师的负担,节约了教师大量时间。截至201712月,该校57位教师、3187名学生活跃使用系统,评测作文19302篇,该校单篇测评最高记录高达166次。

8

广州市岭南画派

纪念中学

语言智能评测系统

2015/052018/07

彭夏桦

020-84447938

学生使用该项成果收获了自主学习的习惯,提高了语言学习兴趣,语言写作水平也进步了。

9

山东省青岛

第五十八中学

语言智能评测系统

2015/072017/08

兰先芳

0532-87895410

该校29位老师和797名学生活跃使用该成果,评测作文5102篇,修改作文24765次,平均每篇作文修改4.854次,单篇修改最高记录高达97次。

10

宜昌市第一中学

语言智能评测系统

2017/042017/06

蒋伟

0717-6774074

截至201706月,该校共19位老师和802名学生活跃使用该成果,评测作文10479次,平均每篇作文修改6.469次。

11

宜昌市葛洲坝中学

基于语料库的语言智能评测系统

2017/042017/06

李小小

0717-6712073

截至20176月,该校13位老师和532名学生活跃使用语言智能评测系统,共评测作文7074次,平均每篇作文修改6.088次。

12

U学教育

语言智能评测技术

API对接

2016/112017/12

汤颖

13810438864

使用语言智能评测系统英语作文智能评测技术于四六级模考系统的写作批改环节,效果良好。

13

江苏南通中学

语言智能阅读测评平台

2017/112017/12

成锦平

13906281833

南通中学2017年正式使用该项成果,效果反应良好。

14

昌平第二实验小学

语言智能阅读测评平台

2017/062017/12

张榕青

13611374527

昌平二小2017年正式启用该项服务,效果反应良好。

15

湖南卢峰镇中学

语言智能阅读测评平台

2017/072017/12

黄晓峰

13762902116

卢峰镇中学2017年正式启用该项成果,效果反应良好。

 


六、主要知识产权证明目录(不超过10项,前3项为核心知识产权):

序号

知识产权类别

知识产权具体名称

国家

授权号

授权日期

证书编号

权利人

发明人

专利有效状态

1

发明专利

一种英语作文自动评分方法及系统

中国

ZL201210049982.4

2015-06-16

1792037

张跃

张跃

有效

2

发明专利

汉语依存树库中未登录词的

处理方法

中国

ZL201210344884.3

2016-04-06

2017040

北京信息科技大学

吕学强;郑略省;王玥;关晓炟

 

有效

3

实用新型专利

生理信号记录系统及其记录仪

中国

ZL201621424994.0

2017-12-08

6700689

 

首都师范大学

李太豪;周建设;娜仁图雅;史金生;刘杰

有效

4

发明专利

一种文档处理方法和装置

中国

ZL201410778704.1

2017-09-19

2680726

北京信息科技大学

侯霞,李宁

有效

5

发明专利

一种文档互操作度量方法

中国

ZL2012101193401.4

2014-04-16

1392089

北京信息科技大学

侯霞,李宁,梁琦

有效

6

发明专利

文档的编辑方法及装置

中国

ZL200910087296.4

2012-12-05

1125426

北京信息科技大学

李宁,侯霞

有效

7

发明专利

基于XML的不同格式文档的

转换方法

中国

ZL200810115473.0

2012-07-04

990096

北京信息科技大学

李宁,侯霞

有效 

8

软件

著作权

基于不完备知识的模糊本体

构建系统

中国

2013SR073948

2013-07-25

0579710

首都师范大学

周建设、刘杰、史金生

有效

9

软件

著作权

通用领域本体抽取系统V1.0

中国

2011SR087412

2011-05-08

0351086

首都师范大学

周建设、张凯、娜仁图雅

有效

10

软件

著作权

智慧书香阅读平台

中国

2016SR347516

2016-11-30

1526132

北京中文在线教育科技发展有限公司

童之磊

有效

 


七、主要完成人情况(一等奖不超过15人,二等奖不超过10人):

排序

姓名

主要贡献

工作单位

完成单位

职称

职务

1

周建设

1完成人。

项目总设计师,负责项目的组织管理和系统总体方案设计。提出全信息语言智能评测模型、基于计算的语言生成模型、篇章主题聚合度计算模型,指导搭建语言智能评测系统,构建语言资源库及本体知识库。对主要科技创新中的第1、第2、第3、第4、第5创新点做出突出贡献。

首都师范大学

首都师范大学

教授

副校长

2

李舟军

2 完成人。

项目主要完成人,参与项目总体技术方案的论证。开展文章主题智能检测、评测本体知识库中的实体关系抽取等技术的研究,针对语言智能评分模型、本体知识库的构建评测提出关键性解决方案。对主要科技创新中的第2、第3、第4创新点做出突出贡献。

北京航空航天大学

北京航空航天大学

教授

3

吕学强

3完成人。

项目主要完成人,负责核心技术突破研究,参与全信息语言测评模型和语言资源库构建的研究工作,推进项目成果形成国家标准。对主要科技创新中的第2、第3、第5创新点做出突出贡献。

北京信息科技大学

北京信息科技大学

教授

4

刘杰

4完成人。

项目主要完成人,负责解决评测语料库构建中的关键技术难题,参与语言智能测评模型和语言资源库构建的研究工作,指导企业产品开发中相关技术的应用。对主要科技创新中的第2、第3、第4创新点做出突出贡献。

首都师范大学

首都师范大学

副教授

5

张跃

5完成人。

项目主要完成人,负责语言智能评测关键技术的成果转化工作。主持研发了语言智能评测产品(批改网),负责产品的应用推广工作,为用户提供产品+技术+服务的语言智能评测全程解决方案。对主要科技创新中的第1、第2、第3创新点做出突出贡献。

北京词网科技有限公司

北京词网科技有限公司

高工

6

童之磊

6完成人。

项目完成人,在语言智能评测关键技术的成果转化方面,主持研发了阅读学习平台(书香中国),负责产品的应用推广工作,为用户提供产品+技术+服务的语言智能评测全程解决方案。对主要科技创新中的第2、第3、第5创新点做出突出贡献。

中文在线数字出版集团股份有限公司

中文在线数字出版集团

股份有限公司

高工

7

史金生

7完成人。

项目完成人,负责部分项目的组织管理工作,共同构建全信息语言智能评测模型、基于计算的语言生成模型、篇章主题聚合度计算模型,辅助搭建语言智能评测系统,构建语言资源库及本体知识库。对主要科技创新中的第2、第3、第4创新点做出突出贡献。

首都师范大学

首都师范大学

教授

8

张凯

8完成人。

项目完成人,负责项目模型具体实现工作,主要负责搭建语言智能评测系统,构建语言资源库及本体知识库,构建全信息语言智能评测模型、基于计算的语言生成模型、篇章主题聚合度计算模型。对主要科技创新中的第2、第3、第4创新点做出突出贡献。

首都师范大学

首都师范大学

副研究员

9

李宁

9完成人。

项目完成人,共同负责核心技术突破研究,解决文档格式转换及内容展示难题,参与大规模评测本体知识库构建,指导企业产品开发中相关技术应用。对主要科技创新中的第2、第5创新点做出突出贡献。

北京信息科技大学

北京信息科技大学

教授

院长

10

娜仁图雅

10完成人。

项目完成人,辅助篇章主题聚合度计算模型,协助搭建语言智能评测系统、语言资源库及本体知识库。对主要科技创新中的第1、第4创新点做出突出贡献。

首都师范大学

首都师范大学

讲师


八、主要完成单位及创新推广贡献:

1)首都师范大学,第1完成单位。

负责总体方案设计和组织管理。首次提出人工智能范畴的语言智能概念,首创语言智能博士学科。提出全信息语言智能评测模型、基于计算的语言生成模型、篇章主题聚合度计算模型,协同团队在语言智能评测关键技术方面取得重大突破,指导搭建语言智能评测系统,指导语言资源库及本体知识库构建,解决了语言智能评测系列难题。成果发表在中国社会科学、AAAI等知名刊物和国际顶级会议上。对主要创新点12345做出突出贡献。

(2)北京航空航天大学,第2完成单位。

参与项目总体技术方案的论证,负责文章主题智能检测、评测本体知识库中的实体关系抽取等技术的研究,对解决篇章主题一致性判断和评测本体知识库自动构建中的关键技术难题起到重要作用。参与语言智能评分模型、评测本体知识库的构建研究,并提出关键性解决方案。指导企业产品开发中相关技术的应用。成果发表在软件学报、AAAI等知名刊物和国际顶级会议上。对主要创新点234做出贡献。

3)北京信息科技大学,第3完成单位。

参与项目总体技术方案的论证,负责异源知识库融合和词汇语义消歧等技术的研究工作,对解决评测语料库构建中的关键技术难题起到重要作用。参与语言智能评分模型和语言资源库构建的研究工作。推进项目成果形成国家标准,指导企业产品开发中相关技术的应用。在知名刊物发表多篇论文,并申请了发明专利,登记了软件著作权。对主要创新点2345做出贡献。

4)北京词网科技有限公司,第4完成单位。

负责语言智能评测关键技术的成果转化,主持研发语言智能评测产品--批改网,实现了包含词汇、句法、语义、篇章等多维度语言评测,进行不同粒度的点评、建议和综合评分,评测结果与人工评测拟合度达到92.03%,迄今为国际最高水平。负责产品的应用推广工作,几乎完全占有国内英语作文智能批改市场。申请了发明专利,登记了软件著作权。对主要创新点123做出贡献。

5)中文在线数字出版集团股份有限公司,第5完成单位。

负责语言智能评测关键技术的成果转化,主持书香中国阅读学习平台的设计、开发与应用推广工作,建立了阅读、测评、激励的阅读和学习产品应用体系。以北京为中心在全国快速推广,服务5万多家中小学,7000多万读者,产生了显著效益。登记了软件著作权,对主要创新点235做出贡献。

 

九、完成人合作关系说明:

为推动语言智能评测理论与关键技术的深入发展,首都师范大学于2009年开始探索语言智能评测理论研究。周建设(1完成人)陆续联合国内自然语言处理相关的研究优势单位(北京航空航天大学、北京信息科技大学、北京词网科技有限公司、中文在线数字出版集团股份有限公司)和科研人员协同攻关,具体研发人员负责相关内容如下:

周建设负责方案总体设计和组织管理,协同团队在语言智能评测关键技术方面取得重大突破。2014年周建设分别主持了国家社科基金重大项目“语言大数据挖掘与文化价值发现(14@ZH036)”,以及国家语委重大项目“语言文字使用规范化智能监测系统研发与应用(ZDA125-26)”。项目期间周建设与团队成员吕学强(第3完成人)、张跃(5完成人)、史金生(7完成人)、李宁(9完成人)共同提出本体构建与关系抽取模型、语言文字自动监测模型,共同发表多篇论文。为进一步落实语言智能评测的总体理论构想,李舟军(第2完成人)、刘杰(第4完成人)、张凯(第8完成人)、娜仁图雅(第10完成人)共同开展文章主题智能检测、评测本体知识库中的实体关系抽取等技术的研究,针对语言智能评分模型、本体知识库的构建评测提出关键性解决方案。

面对异源知识库融合、词汇语义消岐和文档格式转换等技术难题,吕学强(第3完成人)、李宁(第9完成人)共同负责核心技术突破研究,参与语言智能评分模型、语言资源库构建和文档格式转换的研究工作,获得多项专利,指导企业产品开发,同时推进项目成果形成了国家标准。

在语言智能评测关键技术的成果转化方面,张跃(第5完成人)、童之磊(第6完成人)分别主持研发了语言智能评测产品(批改网)和阅读学习平台(书香中国),各自负责产品的应用推广工作,并建立了完善的产品应用体系,为用户提供产品+技术+服务的语言智能评测全程解决方案。

项目完成单位和相关完成人共同获2017年度北京市科学技术奖二等奖。

 

 

完成人合作关系情况汇总表

序号

合作方式

合作者

(项目排名)

合作时间

合作成果

证明

材料

备注

1

共同获奖

周建设(1);李舟军(2);

吕学强(3);刘杰(4);张跃(5);童之磊(6);史金生(7);张凯(8);李宁(9)

2008.10-

2016.09

北京市科学技术二等奖

获奖

证书

2

共同知识产权

周建设(1);史金生(7);

刘杰(4)

2014.01-

2017.12

机器人表情控制方法

和装置

发明

专利

3

共同知识产权

周建设(1);娜仁图雅(10);史金生(7);刘杰(4)

2014.01-

2017.12

生理信号记录系统

及其记录仪

实用新型专利

4

论文合著

周建设(1);张跃(5)

2012.06-

2014.05

基于大数据的汉语表达智能模型及其理论基础

代表性论文

5

论文合著

周建设(1);吕学强(3);

史金生(7);张凯(8)

2015.09-

2017.09

语言智能研究渐成热点

代表性论文

6

论文合著

李舟军(2);周建设(1)

2014.01-

2016.12

Aggregating  Inter-sentence Information to Enhance Relation Extraction

代表性论文

7

论文合著

李舟军(2);周建设(1)

2014.12-

2016.11

基于文本语义离散度的自动作文评分关键技术研究

代表性论文

8

论文合著

吕学强(3);周建设(1)

2014.12-

2016.11

基于SAO结构的非分类关系抽取研究

代表性论文

9

论文合著

刘杰(4);周建设(1)

2015.06-

2016.12

Ontologyrepresentationandmappingofcommonfuzzyknowledge

代表性论文

10

共同立项

周建设(1);吕学强(3);张跃(5);史金生(7);李宁(9)

2014.08-

2017.12

语言大数据挖掘与文化价值发现(14@ZH036

任务书

11

共同立项

周建设(1);史金生(7);

张跃(5);童之磊(6)

2015.12-

2017.12

语言文字使用规范化智能监测系统研发与应用(ZDA125-26

任务书

 

 

版权所有:北京航空航天大学科学技术研究院    地址:北京市海淀区学院路37号路
邮编:100191    传真:010-82317850    电子信箱:kyy@buaa.edu.cn