一种中文作文句评输出方法与流程

文档序号:27779568发布日期:2021-12-04 10:10阅读:63来源:国知局
一种中文作文句评输出方法与流程

1.本发明属于语言处理技术领域,具体涉及一种中文作文句评输出方法。


背景技术:

2.知识表示方法的日益完善提供了构建底层知识库的技术储备,自然语言处理中的句法分析技术的日益成熟让我们能够更加精准地分析一句话的句子成分,深度学习算法的日益强大提供了更加先进的文本知识表示方法,能让我们在提取文本浅层特征之外提取到更加深层的语义特征。
3.现有的句评输出方案是知识通过词语匹配的方式实现的,其所采用的句评输出方案匹配规则简单,检测点少并且比较泛泛会让句评输出比较单薄,同时准确率不高。


技术实现要素:

4.为了解决现有技术存在的句评语句单薄、准确率不高的问题,本发明提供了一种中文作文句评输出方法,其具有评价更加全面、准确率更高等特点。
5.根据本发明的具体实施方式的一种中文作文句评输出方法,包括:
6.基于不同体裁的作文的评价标准构建作文的分体裁检测维度表;
7.对目标作文进行分句并确定每句的句子主干;
8.获取所述分体裁检测维度表中和所述目标作文体裁对应的检测项,基于所述检测项对每句的句子主干进行维度检测;
9.对检测出的每句的问题进行探测,并基于句评评语库给出每句相应的评语。
10.进一步的,所述分体裁检测维度表至少包括写人类作文、写景类记叙文、叙事类记叙文、状物类记叙文、想象类记叙文、说明文、应用文和议论文对应的维度检测项。
11.进一步的,所述对目标作文进行分句并确定每句的句子主干包括:
12.基于句法分析确定句子的核心,再确定和核心之间具有主谓关系、动宾关系、介宾关系和关联关系的部分以构成句子主干部分。
13.进一步的,维度检测项中包括人物外貌描写,所述人物外貌描写的检测方法包括:
14.构建表示人的词库、表示人身体部位的词库和表示外貌描写的词库,若句子成分满足以下条件则确定为人物外貌描写:
15.表示人物身体部位的词和表示人的词均在句子的句子主干,且表示人的词语与表示身体部位的词语间构成一个定中关系;
16.若没有定中关系则查找和表示人物身体部位的词存在关联关系的词语,并确定定中关系;
17.表示外貌描写的词在句子的句子主干,且表示人的词语与表示外貌描写的词间构成一个主谓关系或中心线关系;
18.若没有主谓关系或中心线关系则查找和表示人物身体部位的词存在关联关系的词语,并确定主谓关系。
19.进一步的,维度检测项中包括人物性格描写,所述人物性格描写的检测方法包括:
20.构建表示人的词库和表示性格描写的词库,若句子成分满足以下条件则确定为人物性格描写:
21.表示人的词和表示性格的词均在句子的句子主干中,且表示人的词和表示性格的词存在主谓关系;
22.若没有主谓关系则查找和表示人的词有关联关系的词,并确定主谓关系。
23.进一步的,维度检测项中包括人物心理描写,所述人物心理描写的检测方法包括:
24.构建表示人物内心的词库、表示身体部位的词库、表示人的词库和表示心理描写的词库,若句子成分满足以下条件则确定为人物心理描写:
25.表示人物内心的词和表示人的词均在句子的句子主干,且表示人物内心的词和表示人的词构成定中关系;
26.若没有定中关系则查找和表示身体部位的词存在关联关系的词语,并确定定中关系;
27.表示心理描写的词和表示人的词均在句子的句子主干,且表示心理描写的词和表示人的词存在主谓关系;
28.如没有主谓关系则查找和表示人物身体部位的词存在关联关系的词语,并确定主谓关系;
29.若表示心理描写的词存在动宾关系,若不为动词则确定相应的主谓关系的表示人的词。
30.进一步的,维度检测项中包括反复修辞和连动修辞,其中反复修辞的检测方法包括:
31.按照逗号、分号将句子划分为子句,若句子中含有连续相同的两个子句;并且这两个子句不在引号内则为反复修辞;
32.连动修辞的检测方法包括:按照逗号将句子划分为子句,若子句中含有连续两个以相同动词开头的成分则为连动修辞。
33.进一步的,维度检测项中包括感觉描述,所述感觉描述包括听觉、嗅觉、味觉、触觉,所述感觉描述的检测方法包括:
34.构建相应感觉的描写词库,若句子中相应感觉的描写词在句子的句子主干且字数大于1则为感觉描述。
35.进一步的,维度检测项中包括比喻修辞,所述比喻修辞的检测方法包括:
36.句子中的名词或代词与具有动词词性的词构成一个主谓关系;
37.具有动词词性的词与名词构成动宾关系或介宾关系,具有动词词性的词前没有否定词,且构成动宾关系和介宾关系的名词数量小于2。
38.进一步的,维度检测项中包括问句描述,所述问句描述的检测方法包括:
39.基于相应的问题词语进行相应的正则匹配进行问题句的确定。
40.本发明的有益效果为:通过基于不同体裁的作文的评价标准构建作文的分体裁检测维度表;对目标作文进行分句并确定每句的句子主干;获取分体裁检测维度表中和目标作文体裁对应的检测项,基于检测项对每句的句子主干进行维度检测;对检测出的每句的问题进行探测,并基于句评评语库给出每句相应的评语。实现了基于句子修辞手法、技法、
常见问题等方面检测的评价方法,扩大了评价维度能够根据文章体裁的不同采用不同的评价维度和策略,进而提升了评价的全面性和准确率。
附图说明
41.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
42.图1是根据一示例性实施例提供的中文作文句评输出方法的流程图;
43.图2是根据一示例性实施例提供的分体裁检测维度表的结构图;
44.图3是根据一示例性实施例提供的句评评语库的问题表的部分内容。
具体实施方式
45.为使本发明的目的、技术方案和优点更加清楚,下面将对本发明的技术方案进行详细的描述。显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所得到的所有其它实施方式,都属于本发明所保护的范围。
46.参照图1所示,本发明的实施例提供了一种中文作文句评输出方法,具体包括以下步骤:
47.101、基于不同体裁的作文的评价标准构建作文的分体裁检测维度表;
48.参照图2所示,可从修辞、技法、不足等多个方面制定评价标准和规则作为先验知识;修辞(比喻,拟人,排比,夸张,反问,反复,连动),技法(人物外貌,人物动作,人物语言,人物心理,人物神态,人物性格,五感描写,结论句,巧用关联词),不足(搭配不当,口语化等),其中技法诊断维度随文章体裁变化,如写人文技法检测人物动作,人物外貌,人物语言,人物心理,人物神态,人物性格,其余不检测,状物文技法检测五感描写,其余不检测,最终形成一个分体裁检测维度表。
49.102、对目标作文进行分句并确定每句的句子主干;
50.根据相应的句法分析可以确定句子中的各个部分的关系,进而确定共同组成句子主干部分。
51.103、获取分体裁检测维度表中和目标作文体裁对应的检测项,基于检测项对每句的句子主干进行维度检测;
52.104、对检测出的每句的问题进行探测,并基于句评评语库给出每句相应的评语。
53.可基于句评评语库中给出的如图3所示的问题表,对句子进行问题检测,对于一个句子可对表中列出的问题进行探测,构建不同类型的句评评语库,基于对句子修辞、技法、问题探测的结果给出相应的评语。
54.在具体实现时可将深度学习相结合实现中文作文评语自动生成,针对句子修辞手法、技法、常见问题等方面检测给出更加全面和准确率更高的评阅结果,使得学生在写作后能够有针对性的提升自己的弱点,获得提高。
55.在本发明的一些具体实施例中,分体裁检测维度表至少包括写人类作文、写景类
记叙文、叙事类记叙文、状物类记叙文、想象类记叙文、说明文、应用文和议论文对应的维度检测项。在对一篇作文首先进行体裁判断,根据文章体裁找到对应的体裁检测维度表,对作文进行分句,对每一个句子进行图2中所示的维度表中的维度检测。
56.其中对目标作文进行分句并确定每句的句子主干包括:
57.基于句法分析确定句子的核心,再确定和核心之间具有主谓关系、动宾关系、介宾关系和关联关系的部分以构成句子主干部分。
58.根据句法分析,可先找句子的hed,再找与hed(核心关系)之间有sbv(主谓关系),vob(动宾关系),pob(介宾关系),coo(关联关系)关系的部分,共同构成句子主干部分。
59.在本发明另一些具体实施例中,维度检测项中包括人物外貌描写,人物外貌描写的检测方法包括:
60.构建表示人的词库、表示人身体部位的词库和表示外貌描写的词库,若句子成分满足以下条件则确定为人物外貌描写:
61.表示人物身体部位的词和表示人的词均在句子的句子主干,且表示人的词语与表示身体部位的词语间构成一个定中关系;
62.若没有定中关系则查找和表示人物身体部位的词存在关联关系的词语,并确定定中关系;
63.表示外貌描写的词在句子的句子主干,且表示人的词语与表示外貌描写的词间构成一个主谓关系或中心线关系;
64.若没有主谓关系或中心线关系则查找和表示人物身体部位的词存在关联关系的词语,并确定主谓关系。
65.具体实施时首先表示人物身体部位的词并且这个词在主干部分;有一个表示人的词语与表示身体部位的词语间构成一个定中关系,并且表示人的词语也在主干部分;如果没有直接找到这种定中搭配,但是表示部位的词语有与之有关联关系的词语,则去找与之有关系的词语有没有定中关系;然后表示外貌描写的词语并且这个词在主干部分;有一个表示人的词语与表示外貌的词语间构成一个主谓关系,并且表示人的词语也在主干部分;如果没有直接找到这种主谓关系,但是表示部位的词语有与之有关联关系的词语,则去找与之有关系的词语有没有关系;最后如果表示外貌描写的词语有一个关联关系,对该词做如上相同的检测,从而确定人物外貌描写。
66.人物性格描写的检测方法包括:
67.构建表示人的词库和表示性格描写的词库,若句子成分满足以下条件则确定为人物性格描写:
68.表示人的词和表示性格的词均在句子的句子主干中,且表示人的词和表示性格的词存在主谓关系;
69.若没有主谓关系则查找和表示人的词有关联关系的词,并确定主谓关系。
70.在句子中有一个表示人的词语与表示性格的词语间构成一个主谓关系,并且表示人的词语也在主干部分;如果没有直接找到这种主谓关系,但是表示部位的词语有与之有关联关系的词语,则去找与之有关联关系的词语有没有主谓关系;检测该性格描写词前后两个词是否有否定词。
71.人物心理描写的检测方法包括:
72.构建表示人物内心的词库、表示身体部位的词库、表示人的词库和表示心理描写的词库,若句子成分满足以下条件则确定为人物心理描写:
73.表示人物内心的词和表示人的词均在句子的句子主干,且表示人物内心的词和表示人的词构成定中关系;
74.若没有定中关系则查找和表示身体部位的词存在关联关系的词语,并确定定中关系;
75.表示心理描写的词和表示人的词均在句子的句子主干,且表示心理描写的词和表示人的词存在主谓关系;
76.如没有主谓关系则查找和表示人物身体部位的词存在关联关系的词语,并确定主谓关系;
77.若表示心理描写的词存在动宾关系,若不为动词则确定相应的主谓关系的表示人的词。
78.首先表示人物内心的词并且这个词在主干部分;有一个表示人的词语与表示身体部位的词语间构成一个定中关系,并且表示人的词语也在主干部分;如果没有直接找到这种定中搭配,但是表示部位的词语有与之有关联关系的词语,则去找与之有关联关系的词语有没有定中关系;然后表示心理描写的词语并且这个词在主干部分;有一个表示人的词语与表示心理描写的词语间构成一个主谓关系,并且表示人的词语也在主干部分;如果没有直接找到这种主谓关系,但是表示部位的词语有与之有关联关系的词语,则去找与之有关系的词语有没有主谓关系;如果表示心理描写的词语有一个动宾关系,如果该词词性为动词,直接返回错误,否则看是否有与该词有主谓关系的人物词语。
79.反复修辞的检测方法包括:
80.按照逗号、分号将句子划分为子句,若句子中含有连续相同的两个子句;并且这两个子句不在引号内则为反复修辞;
81.连动修辞的检测方法包括:按照逗号将句子划分为子句,若子句中含有连续两个以相同动词开头的成分则为连动修辞。
82.感觉描述包括听觉、嗅觉、味觉、触觉,感觉描述的检测方法包括:
83.构建相应感觉的描写词库,若句子中相应感觉的描写词在句子的句子主干且字数大于1则为感觉描述。
84.例如:听觉描写检测方法包括:构建声音描写词库,句子中有表示声音描写的词语并且词语字数大于1,并且这个词在句子主干。
85.嗅觉描写检测方法包括:构建嗅觉描写词库,句子中有表示气味描写的词语并且词语字数大于1,并且这个词在句子主干。
86.味觉描写检测方法包括:构建味觉描写词库,句子中有表示气味描写的词语并且词语字数大于1,并且这个词在句子主干。
87.触觉描写检测方法包括:构建触觉描写词库,句子中有表示气味描写的词语并且词语字数大于1,并且这个词在句子主干。
88.比喻修辞的检测方法包括:
89.句子中的名词或代词与具有动词词性的词构成一个主谓关系;
90.具有动词词性的词与名词构成动宾关系或介宾关系,具有动词词性的词前没有否
定词,且构成动宾关系和介宾关系的名词数量小于2。
91.具体的,名词或代词与动词词性的'如','像','似','好像','如同','好比','好似'构成一个sbv关系,并且这个名词不是'意思','我','劲儿','女儿','血','儿子','罪人','神气劲儿';'如','像','似','好像','如同','好比','好似'等动词与名词构成vob或pob关系;'如','像','似','好像','如同','好比','好似'等词前面没有否定词'不','否','不是','没有','没'修饰;比喻词后面形成vob,pob关系的名词数量小于2;本体词性不是代词。
92.问句描述的检测方法包括:
93.基于相应的问题词语进行相应的正则匹配进行问题句的确定。
94.例如疑问感叹句检测方法包括:构建心理描写词库,构建情感描写词库,句子中含有表示心理描写或者情感描写的词语并且含有!;句子中不含:
“”
等说话的标识。
95.反问句检测方法包括:
96.将"(怎能|怎么是|难道|怎么能|怎么可以|为什么不)(.*)?"正则匹配进行反问句的检测。
97.文末情感表达检测方法包括:文章最后一句话;以?或!结尾;这句话中有一个表示心理描写的词语。
98.情感表达检测方法:构建表示人的词库出现'喜欢','喜爱','爱慕','欣赏','爱'等词语,并且位于句子主干;有一个表示人的词语与上述词语间构成一个主谓关系,并且表示人的词语也在主干部分;如果没有直接找到这种主谓关系,但是表示部位的词语有与之有关联关系的词语,则去找与之有关联关系的词语有没有主谓关系;如果上述词语有一个动宾关系,如果该词词性为动词,直接返回false,否则看是否有与该词有主谓关系的人物词语。
99.连续动作描写检测方法:找到一个动词且位于主干;找到一个与之形成主谓关系的名词,且位于句子主干;找到一个与之形成关联关系的两个动词,且这两个动词没有与其他词形成主谓关系;三个动词之间的距离小于10;三个动词之间的任意两个都不一样;并且动词是表示人物动作的动词
100.拟声词检测方法:构建拟声词库,词性标注为'o',或者句中有在拟声词词库中的词。
101.排比句检测方法:按逗号或分号划分子句,子句分词之后相同词语数量大于1并且在句中的索引位置偏差小于2。
102.夸张检测方法:构建夸张词库,句子中含有夸张词库中的词语。
103.阐述道理检测方法:对["我(.*)道理(.*?)[,。?!,?!]","只有(.*)才能(.*?)[,。?!,?!]","我懂得了(.*?)[,。?!,?!]","事后,我觉得(.*)说(.*?)[,。?!,?!]","(.*)还真是不容易","不过,仔细想想(.*?)[,。?!,?!]","又何尝(.*?)[,。?!,?!]","我明白了(.*?)[,。?!,?!]"]这些表示进行正则匹配从而确定阐述道理的语句。
[0104]
关联词检测方法:构建关联词库,句子中出现关联词库中的前后搭配类关联词。
[0105]
情景交融检测方法:构建景色描写词库,构建心理描写词库,句子中同时含有包含景色描写和心理描写的词语,并且词语位于句子主干中。
[0106]
景色描写检测方法:构建景色描写词库,句子中含有景色描写的词语,并且词语字
数超过两个字。
[0107]
颜色描写检测方法:构建颜色描写词库,句子中有表示颜色描写的词语;并且词语字数大于1;并且这个词在句子主干。
[0108]
状物性格品质描写检测方法:构建性格描写词库,构建表示状物的词库首先表示性格描写的词语并且这个词在主干部分;有一个表示物的代词与表示性格的词语间构成一个主谓关系,并且代词也在主干部分;如果没有直接找到这种主谓关系,但是表示部位的词语有与之有关联关系的词语,则去找与之有关系的词语有没有主谓关系;检测该性格描写词前后两个词是否有否定词。
[0109]
这样通过形成一套规则做先验知识驱动,底层各种类型的词库支撑,依存句法分析与深度学习算法相结合进行特征提取,从而进行各种类型的修辞、技法与问题探测,进而提升了评价的全面性和准确率。
[0110]
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
[0111]
此外,在本发明各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
[0112]
上述提到的存储介质可以是只读存储器,磁盘或光盘等。
[0113]
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0114]
上文的描述包括一个或多个实施例的举例。当然,为了描述上述实施例而描述部件或方法的所有可能的结合是不可能的,但是本领域普通技术人员应该认识到,各个实施例可以做进一步的组合和排列。因此,本文中描述的实施例旨在涵盖落入所附权利要求书的保护范围内的所有这样的改变、修改和变型。此外,就说明书或权利要求书中使用的术语“包含”,该词的涵盖方式类似于术语“包括”,就如同“包括”在权利要求中用作衔接词所解释的那样。此外,使用在权利要求书的说明书中的任何一个术语“或者”是要表示“非排它性的或者”。
[0115]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1