汉语框架网络学习策略研究
时间:07-20
来源:21IC
点击:
2.2 配价模式的学习
通过对语义信息的学习,我们把句子解析成了若干语法要素和语义元素。配价模式学习过程中,参照已有的本体及其语义模式(配价模式)等信息,根据词性分析、语法分析和句法分析的结果及所总结的规则和统计信息,生成框架的配价模式。
框架配价模式学习过程:1)对例句做句法依存分析。2)以句法依存树中的结点为目标词,将目标词所有的子树看作一语义元素,每个子树包含的所有词语默认为最大短语。3)根据子树的根结点与目标的句法依存关系类型,与已有配价模式匹配,确定子树在配价模式中充当的框架元素,比如,它们之间为动宾关系,那么子树就作为"受事"框架元素。若存在使义动词则子树所做框架元素为"施事"。最后,如果子树中存在像并列关系之类的依存关系则应当考虑将其进一步细分为若干框架元素,算法如图2所示。
研究发现,配价模式学习的关键是结合语义信息制定判定规则。利用有用的域约束、依赖约束和相关词语的词性标记限制,我们形成了一系列可操作的启发式规则,提高了配价模式学习的精度。那么,如何来判断初步的配价模式与已有配价模式是匹配的?不同的框架元素在配价模式中的重要性是不同的,应该区别对待。假设句法依存树中的结点受树结构中相邻的结点的特性的影响:如果相邻的结点的关系紧密那么这两个结点也很可能在配价模式中充当重要角色,两者至少有个充当配价模式的很重要框架元素。
2.3 检索特征学习技术策略
个性化查询就是用户根据自身兴趣爱好、关注焦点和查询特征进行扩展,来获取精确完整的知识信息。不同用户对事件关注的角度不一样,比如,罪犯及其律师关心的是如何减轻判刑,而检察官则是要找到罪犯的全部犯罪情节。系统能够对用户的各种信息行为进行智能化追踪及分析,搜集用户个性信息及其关注的焦点的种类等信息,并将用户个性化信息储存到数据库里。当系统收到检索请求后,从语料库中检索符合用户信息需求的信息,并利用个性信息过滤掉相关度小的信息,同时细化语义情景,按用户提问将答案精确到最小语义元素。同时,系统建立反馈机制,允许用户对系统推送的信息进行评价和人工选择,然后将作为此类用户的个性化信息。
3 结束语
在构建汉语框架网络本体时,以思维科学的基本原理为指导,运用元学习器技术,充分发挥两类基本学习器各自的优点,解决了语义信息的鉴别、已做语义处理知识的理解、未标记文献的利用等问题,从而获得了比单一的基本学习器较高的学习能力;同时总结了一些具有代表性和高精确度的实例和规则,作为系统学习的参数,得到了较好学习未知框架网络本体语义信息的近似值。不同学习策略的实施,提高了系统的归纳、演绎、推理的能力,增强了语义理解能力,能够返回精确匹配的答案。
通过对语义信息的学习,我们把句子解析成了若干语法要素和语义元素。配价模式学习过程中,参照已有的本体及其语义模式(配价模式)等信息,根据词性分析、语法分析和句法分析的结果及所总结的规则和统计信息,生成框架的配价模式。
框架配价模式学习过程:1)对例句做句法依存分析。2)以句法依存树中的结点为目标词,将目标词所有的子树看作一语义元素,每个子树包含的所有词语默认为最大短语。3)根据子树的根结点与目标的句法依存关系类型,与已有配价模式匹配,确定子树在配价模式中充当的框架元素,比如,它们之间为动宾关系,那么子树就作为"受事"框架元素。若存在使义动词则子树所做框架元素为"施事"。最后,如果子树中存在像并列关系之类的依存关系则应当考虑将其进一步细分为若干框架元素,算法如图2所示。
研究发现,配价模式学习的关键是结合语义信息制定判定规则。利用有用的域约束、依赖约束和相关词语的词性标记限制,我们形成了一系列可操作的启发式规则,提高了配价模式学习的精度。那么,如何来判断初步的配价模式与已有配价模式是匹配的?不同的框架元素在配价模式中的重要性是不同的,应该区别对待。假设句法依存树中的结点受树结构中相邻的结点的特性的影响:如果相邻的结点的关系紧密那么这两个结点也很可能在配价模式中充当重要角色,两者至少有个充当配价模式的很重要框架元素。
2.3 检索特征学习技术策略
个性化查询就是用户根据自身兴趣爱好、关注焦点和查询特征进行扩展,来获取精确完整的知识信息。不同用户对事件关注的角度不一样,比如,罪犯及其律师关心的是如何减轻判刑,而检察官则是要找到罪犯的全部犯罪情节。系统能够对用户的各种信息行为进行智能化追踪及分析,搜集用户个性信息及其关注的焦点的种类等信息,并将用户个性化信息储存到数据库里。当系统收到检索请求后,从语料库中检索符合用户信息需求的信息,并利用个性信息过滤掉相关度小的信息,同时细化语义情景,按用户提问将答案精确到最小语义元素。同时,系统建立反馈机制,允许用户对系统推送的信息进行评价和人工选择,然后将作为此类用户的个性化信息。
3 结束语
在构建汉语框架网络本体时,以思维科学的基本原理为指导,运用元学习器技术,充分发挥两类基本学习器各自的优点,解决了语义信息的鉴别、已做语义处理知识的理解、未标记文献的利用等问题,从而获得了比单一的基本学习器较高的学习能力;同时总结了一些具有代表性和高精确度的实例和规则,作为系统学习的参数,得到了较好学习未知框架网络本体语义信息的近似值。不同学习策略的实施,提高了系统的归纳、演绎、推理的能力,增强了语义理解能力,能够返回精确匹配的答案。
- 如何更好的利用Oracle全文检索(02-28)