市场监察系统及方法

文档序号:9579775阅读:961来源:国知局
市场监察系统及方法
【技术领域】
[0001] 本发明涉及计算机信息技术与金融市场技术领域,尤其涉及一种监察交易安全的 市场监察系统及方法。
【背景技术】
[0002] 现有的国内外证券市场监察系统主要以监测量价异动为主,只有少数几个系统集 成了文本挖掘功能来分析信息对市场的影响。目前功能比较完备的文本挖掘监管系统是美 国金融监管局自2001年12月投入运行的SONAR系统。该系统每天处理约1万条新闻和 SEC的信息披露,评估2万5千个证券的价/量模型,通过对违规事件的安全级别进行模型 估计,给出事件的概率评分值。但是当前公开的相关文献极少且未涉及其算法与实现细节。 另外,澳交所在2004年引入互联网金融投资谣言搜索系统,该系统每小时能够扫描4万篇 网络信息,识别属于谣言的文章精度仅达到50%。
[0003]SMARTS等主要海外证券市场监测系统也加强了对文本的自动分析处理功能,功 能主要集中于在新闻和公司财务报告中对关键事件和关键信息进行检索和抽取。同时, SMARTS公司也在积极进行文本挖掘技术的开发,但目前还没有成熟的集成产品。在国内,证 券市场信息监察也刚刚起步,具体的市场监察产品还较少。
[0004] 在人工智能研究中,常识知识是指可由普通人预知的信息,它是解决人工智能或 知识工程技术瓶颈难题的一项关键措施。现在已经有许多常识知识库被建立,比较有代表 性的有Cyc,DBpeida和Wordnet。Cyc知识库创建于1984年,现包含上千万的事实和关系 描述。DBpedia则是从wikipeida里面抽取得到的RDF格式的记录,它包含4百万的事物描 述和4. 7亿的事实描述,涵盖了人物、地点、公司等多类信息。Wordnet是对英语语言的词汇 描述,包括对同义词、近义词等词汇之间关系的总结。在处理市场信息时,信息本身纷繁复 杂,因此,常识知识库是处理大数据的一个较好的选择。
[0005] 现有的研究已经将常识知识引入到文本信息的处理中,其研究方法主要是利用词 汇之间的关系,对文本特征进行处理。例如Scott和Green利用Wordnet中的近义词关系 来对文本中的特征进行扩充。Hotho等人则利用Wordnet中上下层关系对文本中的名词和 动词进行汇总。还有一类研究利用Wikipedia中词条的描述信息对相关文本进行扩充。
[0006] 目前,在金融文本挖掘领域,国外高校和研究机构对自动文本分析方面的研究着 重于对英文文本特征的构建和机器学习模型的选择(如表1所示)。信息内容涵盖了新闻、 博客、年报以及研究报告等。预测的市场指标包括股价趋势、汇率趋势、市场指数、风险值和 股票收益等。采用的文本特征包括词袋(Bagofwords)、名词短语(NounPhrase)以及命 名实体(NamedEntity)等,也有一些研究采用了专家定义的词汇表作为文本特征。常用的 分类器包括了k近邻、NalfvcBayes和支持向量机等。相关的研究成果既有通过预测给出风 险提示的,也有用挖掘出的信息指导日内高频交易的。
[0007] 表1英文金融文本分析研究现状
[0008]
[0009] 业内专业的信息分析服务提供商专注于对文本信息的量化表示,该类系统主要被 投资机构用于进行量化交易(如表2所示)。系统的核心是借助于自然语言处理和文本挖 掘技术,自动分析新闻事件的相关性、情感性和新颖性。国外主要提供信息分析服务的公司 主要有RavenPack,ThomsonReuters和RecordedFuture。RavenPack实时扫描各类信息 提供终端收集到的新闻文本,一旦有新闻加入到数据库,系统会对该文本通过一系列的情 感性指标来进行量化衡量。ThomsonReuters也提供了自动新闻分析的服务。同样对于一 条实时新闻报道,系统可以自动分析新闻事件的情感性,相关性和新颖性。相关性由〇到1 之间的数值来衡量。对于情感性,该系统用〇到1之间的数值分别衡量了利好,中性和利空 的概率。另外,该类系统通过新闻发布的时间和关键词出现的位置来确定该报道的新颖性。 RecordedFuture公司提供了更为丰富的图形分析界面。该类系统通过对一批新闻进行时 间、来源和实体关系的分析,在界面中将新闻关系进行图形化直观展示。就单个新闻的量化 表示,系统关注于新闻事件的利好概率和利空概率。
[0010] 表2国外主要新闻分析软件比较
[0011]

[001?-国内长江证#利用网络fir息挖掘建立了国内股松的"长江证#舆情指标",从贝才经 网站和证券类报刊杂志提取信息,自动分析每篇文章对市场的多空观点(强烈看多、看多、 中性、看空和强烈看空)并赋予不同的分数,最后分数均值作为舆情指标。指标大于50的 表示看涨而指标小于50表示看跌,并用分数的标准差作为舆情分歧指标。光大证券构建了 光大中文云文本挖掘系统,该系统分为3个模块,分别是数据获取与清洗模块、数据引擎与 指标构建模块、策略开发模块。该系统实现了四个数据引擎:光大关键词指数、光大情感指 数、光大关键词网络图、光大关注度因子。
[0013] 但是上述的研究与应用过程中,都未能将常识知识与领域(金融)知识及文本信 息之间建立良好的匹配关系。

【发明内容】

[0014] 本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
[0015] 为此,本发明的第一方面的目的在于提出一种能够同时监测市场量价异动及市场 信息异动,并能够对二者之间的关联进行推理的高效的市场监察系统。
[0016] 本发明的第二方面的目的在于提出一种市场监察方法。
[0017] 为了实现上述目的,本发明第一方面的实施例中提出了一种市场监察系统,包括: 证券市场知识库,包括模型库和实例库,其中,所述模型库中包括描述证券市场领域中概念 及概念之间的关系的本领域知识区,和描述常识概念及概念之间的关系的常识知识区;所 述实例库中保存多条与所述模型库的概念关系结构对应的实例信息。
[0018] 根据本发明实施例的市场监察系统,在证券市场知识库中通过概念库将本领域知 识和常识知识有机统一起来,并将其之间的概念关系同实例信息有效地映射为一体,大大 提高了市场监察系统的监察范围和决策支持的智能程度。
[0019] 在一些示例中,所述概念与概念之间的关系采用逻辑语言描述。
[0020] 在一些示例中,还包括:交易分析模块,用于对市场进行监控,发现异常交易;知 识获取与维护模块,用于获取外部的知识和信息并转换为逻辑描述语言后,映射保存到所 述证券市场知识库中;信息分析模块,用于对所述交易分析模块发现的异常交易进行特征 构造,生成异常交易的特征集合以进行风险分类;展示模块,用于对所述异常交易和所述异 常交易的特征集合之间的关系进行图形化展示。
[0021] 进一步地,在一些示例中,所述信息分析模块包括:交易-新闻特征集构建模块, 用于将所述异常交易的股票发行公司映射为实例,从所述证券市场知识库中找出与该实例 相关的其他实例信息作为连接新闻特征与交易的属性,构建交易-新闻特征集;新闻-词汇 特征集构建模块,用于按照所述异常交易的交易时间选取市场新闻并进行词汇挖掘,将所 挖掘的词汇映射为所述概念或实例,从所述证券市场知识库中找出与所述概念或实例相关 的其他概念或实例作为新闻特征,构建新闻-词汇特征集;特征集合生成模块,用于将所述 交易-新闻特征集与所述新闻-词汇特征集进行新闻特征汇总,构建所述异常交易的特征 集合。
[0022] 进一步地,在一些示例中,所述交易-新闻特征集构建模块采用随机漫步的方法 沿所述关系找到与所述股票发行公司的实例相关的其他实例信息作为所述交易与新闻关 系的属性。
[0023] 在一些示例中,所述新闻-词汇特征集构建模块,采用按同义词关系进行随机漫 步的方法沿所述关系找到与所述词汇的概念或实例相关的其他概念或实例作为所述新闻 的词汇特征。
[0024] 在一些示例中,还包括训练模块,用于选取部分所述异常交易进行人工筛选和标 记,作为训练集;所述信息分析模块根据所述训练集进行风险分类。
[0025] 在一些示例中,所述信息分析模块对所述特征集合中的特征进行筛选出来后,利 用所述训练集进行风险分
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1