一种数据交换匹配方法、装置、介质和电子设备与流程

文档序号:18739900发布日期:2019-09-21 01:39阅读:238来源:国知局
一种数据交换匹配方法、装置、介质和电子设备与流程

本公开涉及计算机技术领域,具体而言,涉及一种数据交换匹配的方法、装置、介质和电子设备,尤其涉及一种基于对话的数据交换匹配方法、装置、介质和电子设备。



背景技术:

当今世界网络信息技术日新月异,互联网正在全面融入经济社会生产和生活各个领域,引领了社会生产新变革,创造了人类生活新空间,带来了国家治理新挑战,并深刻地改变着全球产业、经济、利益、安全等格局。随着网络事业的爆炸式增长,交易需求也随之提高,为满足需求,网络交易平台成为一种应运而生的旨在通过电子手段建立一种新的秩序,它不仅涉及电子技术及商务本身,而且涉及到诸如金融,税务,教育,法律等社会其他层面。它是充分利用高清技术而引发革命性的商务实践,也必将对传统的交易模式带来广泛而深刻的影响。

目前市场上的交易系统,都通过用户发布信息和用户自主来检索信息,检索结果的匹配程度依赖于用户,耗费较多的人力成本,且很多情况下都难以匹配。



技术实现要素:

本公开实现用户的数据交换信息集合与其他用户的数据交换集合的信息自动匹配实现自主化数据交换。本发明的目的在于提供一种基于对话的数据交换匹配方法、装置、介质和电子设备,能够解决上述提到的至少一个技术问题。包括一种消息监听机制,接收用户发送的消息,一种自然语言的关键词提取技术,提取用户对话中的关键词,一种关键词匹配算法,来计算关键词之间的匹配程度,一种通知机制,来通知对应的用户来进行数据交换。

本公开实施例具体提供了一种数据交换匹配方法,其中包括:

接收用户数据交换请求信息;

将所述用户数据交换请求信息对应所述用户的用户信息存储到数据库中;

提取所述数据交换请求信息中的关键词;

将所述第一关键词和数据库中的第二关键词进行匹配,计算匹配度;

若匹配度大于设定阈值,则根据所述用户信息以及所述第一关键词向所述用户发送数据交换通知第二关键词。

进一步的,所述提取所述数据交换请求信息中的关键词,包括:

当接收到所述用户数据交换请求信息,对所述用户数据交换请求信息进行自然语言处理,提取所述用户数据交换请求信息中的第一关键词。

进一步的,所述提取用户对话中的关键词,包括:

将所述用户数据交换请求信息进行分词处理;

对所述分词进行过滤,保留形容词和名词,筛选至少两种词性的分词作为第一关键词。

进一步的,包括:

遍历数据库,计算用户的第一关键词和数据库中的第二关键词的编辑距离;

根据关键词长度和编辑距离确定关键词匹配度。

进一步的,

所述关键词匹配度计算如下:

其中,所述第一关键词长度为用户数据交换请求信息中的第一关键词的字符数,所述第二关键词长度为所述第一关键词对应数据库中的第二关键词的字符数,所述编辑距离为所述第二关键词转成所述第一关键词所需的最少编辑次数-。

根据本发明的具体实施方式,另一方面,本发明提供一种数据交换匹配装置,包括:

接收单元,用于接收用户数据交换请求信息;

存储单元,用于将所述用户数据交换请求信息对应所述用户的用户信息存储到数据库中;

提取单元,用于提取所述数据交换请求信息中的第一关键词;

匹配单元,用于将所述第一关键词和数据库中的第二关键词进行匹配,计算匹配度;

通知单元,用于在匹配度大于设定阈值时,根据所述用户信息以及所述第一关键词向所述用户发送数据交换通知。

进一步的,所述装置还包括:

存储单元,用于根据用户信息存储用户数据交换请求信息中的对话内容。

根据本发明的具体实施方式,另一方面,本发明提供一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上任一项所述的数据交换匹配方法。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本发明的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1示出了根据本发明一实施例的数据交换匹配方法流程图;

图2示出了根据本发明的一实施例的数据交换匹配流程示意图;

图3示出了根据本发明的一实施例的数据交换匹配装置图;

图4示出了根据本发明的实施例的电子设备连接结构示意图。

具体实施方式

为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的本公开实施例仅仅是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。

在本公开实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本公开实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义,“多种”一般包含至少两种。

应当理解,本文中使用的术语“和/或”仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。

应当理解,尽管在本公开实施例中可能采用术语第一、第二、第三等来描述……,但这些……不应限于这些术语。这些术语仅用来将……区分开。例如,在不脱离本公开实施例范围的情况下,第一……也可以被称为第二……,类似地,第二……也可以被称为第一……。

取决于语境,如在此所使用的词语“如果”、“若”可以被解释成为“在……时”或“当……时”或“响应于确定”或“响应于检测”。类似地,取决于语境,短语“如果确定”或“如果检测(陈述的条件或事件)”可以被解释成为“当确定时”或“响应于确定”或“当检测(陈述的条件或事件)时”或“响应于检测(陈述的条件或事件)”。

还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的商品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种商品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的商品或者装置中还存在另外的相同要素。

在网络数据交换中,需要卖家和卖家进行交流对话,达成一致后方可进行数据交换,机器人作为即时通信软件的特殊用户,每个用户都可以与之对话,我们需要设计一种服务的程序来分析用户的对话,并设计一种存储程序来存储用户对话的内容。

下面结合附图详细说明本发明的可选实施例。

实施例1

结合附图1,本公开实施例中,通过机器人智能识别用户对话内容,提取对话内容中的关键词,并对该对话中的关键词与数据库中的关键词进行匹配度分析,确定是否进行数据交换,具体的:

步骤S101,接收用户数据交换请求信息。用户在数据交换时可与数据交换方进行对话,其中,数据交换中,用户可采用通信工具进行,例如微信、即时通、旺旺、钉钉以及可自研的聊天工具等,对话形式可采用文字输入、图片输入、语音输入等,本公开实施例着重对文字输入进行分析。使用Web服务器作为监听用户对话的程序,当用户向机器人发送内容时,机器人就会收到一条http(超文本传输协议)请求,这个请求包含用户信息和对话内容。

步骤S102,将所述用户数据交换请求信息对应所述用户的用户信息存储到数据库中。服务器在接收到用户的对话信息后,对该对话信息进行存储,存储时将对应的用户信息进行关联存储。使用Web服务器作为监听用户对话的程序,当用户向机器人发送内容时,机器人就会收到一条http(超文本传输协议)请求,这个请求包含用户信息和对话内容,将用户的对话内容根据用户信息存储到对应的数据库中。

步骤S103,提取所述数据交换请求信息中的关键词。服务器每当接收到用户的聊天信息时,对用户的聊天内容进行自然语言处理,分析用户的请求信息,提取用户对话中的关键词,关键词提取算法如下:

a.利用分词工具将这句话分词;

b.过滤分词中的动词、助词、副词等,保留形容词和名词,保留下来的词称为关键词。当然,过滤分词中的各类型词的方式不限于此,例如也可包括动词、名词等。

另外,当对话内容包括语音信息时,可对语音进行语义分析,将语义转换成文字信息,对文字信息进行上述关键词的提取。

步骤S104,将所述第一关键词和数据库中的第二关键词进行匹配,计算匹配度。

a.遍历数据库,计算用户的第一关键词和数据库中的第二关键词的距离;

b.根据关键词长度和编辑距离确定关键词匹配度。

所述关键词匹配度计算如下:

其中,所述第一关键词长度为用户数据交换请求信息中的第一关键词的字符数,所述第二关键词长度为所述第一关键词对应数据库中的第二关键词的字符数,所述编辑距离为所述第二关键词转成所述第一关键词所需的最少编辑次数-。

编辑距离(Edit Distance),是指两个字串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。一般来说,编辑距离越小,两个串的相似度越大。

例如:用户关键词为sitting,数据库关键词为kitten,用户关键词长度为7,数据库关键词长度为6,编辑长度可按照如下方式进行计算:

将kitten一字转成sitting:

sitten(k→s)

sittin(e→i)

sitting(→g)

即编辑长度为3。

则关键词匹配度为:

关键词的匹配度的数值越大,说明用户的第一关键词与数据库中的第二关键词的匹配度越高,其最大值为100%,即两个关键词完全相同。

步骤S105,若匹配度大于设定阈值,则根据匹配的所述数据交换请求信息中的关键词向所述用户发送数据交换通知。用户关键词与数据库关键词的匹配度越高,说明两者相似度越高,针对数据交换方的搜索准确性越高,发生数据交换的准确性越高,同时服务器根据匹配度推送的推荐消息和链接越准确。这就需要设置一个匹配度阈值,当关键词匹配度大于该阈值时,认定匹配成功,通常情况下可对关键词数据库哦进行正态分析,对其进行训练学习,找到一个合适的阈值。在本公开实施例中,可设置关键词匹配度的阈值为50%,当然,根据不同的场景和领域,可对阈值进行调整,例如可以对匹配度较低的模糊领域可将阈值调低,一些高精度领域可将阈值调高,例如可将设置为30%、40%、50%、60%、70%、80%、90%等,当关键词匹配度大于该阈值时,则根据匹配的关键词及用户的对话判定数据交换可实施。

当有关键词发生匹配时,认为该用户的对话发生匹配,服务器可将可实施的页面、链接、匹配的信息及用户的对话内容发送至所述用户,用户根据接收的机器人发生的消息联系匹配的人,并决定是否发生数据交换,进行数据交换。另外,也可在服务器端进行设置,当有关键词发生匹配时,服务器自动根据数据交换要求对该数据交换进行实施。且同步更新用户数据交换数据库信息,并附提醒机制,向用户发送提醒通知。

附图2示出了本公开实施例的数据交换匹配流程示意图,如图所示,首先,用户作为数据交换发起者,向服务器提出对话请求,对话内容可包括数据交换标的物、数据交换时间、数据交换价格以及数据交换的其他需求。提出数据交换请求后,服务器接收该数据交换请求,并对该对话内容对应用户信息进行存储,将其存储到对应的服务器中。

当服务器接收到用户的聊天信息时,对用户的聊天内容进行自然语言处理,分析用户的请求,提取用户对话中的关键词,关键词提取算法如下:

a.利用分词工具将这句话分词。

b.过滤分词中的动词、助词、副词等,保留形容词和名词,筛选至少两种词性的分词作为第一关键词。

将用户的第一关键词和数据库中的第二关键词进行匹配,计算匹配度,具体的:

a.遍历数据库,计算用户的第一关键词和数据库中的第二关键词的距离;

b.两个关键词a和b的匹配度公式如下

c.当关键词ab匹配度>阈值(一般为0.5,根据实际情况来设置)时,认为关键词a和关键词b匹配,可进行数据交换。当关键词ab匹配度<阈值(一般为0.5,根据实际情况来设置)时,认为关键词a和关键词b匹配不匹配,否决数据交换。

在关键词a和关键词b匹配时,将用户的第一关键词匹配用户的信息存储至数据库。认为该用户的对话发生匹配,将匹配的关键词及用户的对话发送至被匹配关键词用户。

用户根据接收的机器人发生的消息联系匹配的人,并决定是否发生数据交换,进行数据交换。

实施例2

如图3所示,根据本发明的具体实施方式,另一方面,本发明提供一种数据交换匹配装置,包括:

接收单元301,用于接收用户数据交换请求信息。用户在数据交换时可与数据交换方进行对话,其中,数据交换中,用户可采用通信工具进行,例如微信、即时通、旺旺、钉钉以及可自研的聊天工具等,对话形式可采用文字输入、图片输入、语音输入等,本公开实施例着重对文字输入进行分析。

存储单元302,用于将所述用户数据交换请求信息对应所述用户的用户信息存储到数据库中。服务器在接收到用户的对话信息后,对该对话信息进行存储,存储时将对应的用户信息进行关联存储。使用Web服务器作为监听用户对话的程序,当用户向机器人发送内容时,机器人就会收到一条http(超文本传输协议)请求,这个请求包含用户信息和对话内容,将用户的对话内容根据用户信息存储到对应的数据库中。

提取单元303,用于提取所述数据交换请求信息中的关键词。服务器每当接收到用户的聊天信息时,对用户的聊天内容进行自然语言处理,分析用户的请求信息,提取用户对话中的关键词,关键词提取算法如下:

a.利用分词工具将这句话分词;

b.过滤分词中的动词、助词、副词等,保留形容词和名词,筛选至少两种词性的分词作为第一关键词。当然,过滤分词中的各类型词的方式不限于此,例如也可包括动词、名词等。

匹配单元304,用于将所述第一关键词和数据库中的第二关键词进行匹配,计算匹配度。

所述关键词匹配度计算如下:

其中,用户的第一关键词长度为用户的第一关键词的字符数,数据库中的第二关键词长度为所述第一关键词对应数据库中的第二关键词的字符数,编辑距离为数据库中的第二关键词转成用户的第一关键词所需的最少编辑操作次数。

通知单元305,用于在匹配度大于设定阈值时,根据所述用户信息以及所述第一关键词向所述用户发送数据交换通知。设置一个匹配度阈值,当关键词匹配度大于该阈值时,认定匹配成功,通常情况下可对关键词数据库进行正态分析,对其进行训练学习,找到一个合适的阈值。当有关键词发生匹配时,认为该用户的对话发生匹配,服务器可将可实施的页面、链接、匹配的信息及用户的对话内容发送至所述用户,用户根据接收的机器人发生的消息联系匹配的人,并决定是否发生数据交换,进行数据交换。

进一步的,所述装置还包括:

读取单元,当用户向机器人发送请求信息时,读取所述用户数据交换请求信息,所述用户数据交换请求信息包括传输协议请求。设置一个匹配度阈值,当关键词匹配度大于该阈值时,认定匹配成功,通常情况下可对关键词数据库进行正态分析,对其进行训练学习,找到一个合适的阈值。

实施例3

本公开实施例提供一种电子设备,该设备用于图像的识别方法,所述电子设备,包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,

所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

接收用户数据交换请求信息;

将所述用户数据交换请求信息对应所述用户的用户信息存储到数据库中;

提取所述数据交换请求信息中的关键词;

将所述第一关键词和数据库中的第二关键词进行匹配,计算匹配度;

若匹配度大于设定阈值,则根据所述用户信息以及所述第一关键词向所述用户发送数据交换通知。

下面参考图4,其示出了适于用来实现本公开实施例的电子设备的结构示意图。本公开实施例中的终端设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图4示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。

如图4所示,电子设备可以包括处理装置(例如中央处理器、图形处理器等)401,其可以根据存储在只读存储器(ROM)402中的程序或者从存储装置408加载到随机访问存储器(RAM)403中的程序而执行各种适当的动作和处理。在RAM 403中,还存储有电子设备操作所需的各种程序和数据。处理装置401、ROM 402以及RAM 403通过总线404彼此相连。输入/输出(I/O)接口405也连接至总线404。

通常,以下装置可以连接至I/O接口405:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置406;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置407;包括例如磁带、硬盘等的存储装置408;以及通信装置409。通信装置409可以允许电子设备与其他设备进行无线或有线通信以交换数据。虽然图4示出了具有各种装置的电子设备,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。

具体处理方式可参见实施例1和实施例2。

特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置409从网络上被下载和安装,或者从存储装置408被安装,或者从ROM 402被安装。在该计算机程序被处理装置401执行时,执行本公开实施例的方法中限定的上述功能。

附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

实施例4

本公开实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有计算机可执行指令,该计算机可执行指令可执行上述任意实施例的方法中的数据交换匹配的方法。

需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。

上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。

上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:获取至少两个网际协议地址;向节点评价设备发送包括所述至少两个网际协议地址的节点评价请求,其中,所述节点评价设备从所述至少两个网际协议地址中,选取网际协议地址并返回;接收所述节点评价设备返回的网际协议地址;其中,所获取的网际协议地址指示内容分发网络中的边缘节点。

或者,上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:接收包括至少两个网际协议地址的节点评价请求;从所述至少两个网际协议地址中,选取网际协议地址;返回选取出的网际协议地址;其中,接收到的网际协议地址指示内容分发网络中的边缘节点。

可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。

描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定,例如,第一获取单元还可以被描述为“获取至少两个网际协议地址的单元”。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1