一种基于多源数据分析的就诊推荐方法

文档序号:6637106阅读:209来源:国知局
一种基于多源数据分析的就诊推荐方法
【专利摘要】本发明公开了一种基于多源数据分析的就诊推荐方法,包括:通过网络对区域内的医疗卫生机构信息进行注册;采集用户就诊项目信息和用户所处位置信息,发送就诊推荐请求;根据就诊推荐请求,利用每个医疗卫生机构信息、每个医疗卫生机构当前的人口分布密度和用户所处位置信息进行多源数据融合,获得每个医疗卫生机构在某一时段内被用户选择可能性;按选择可能性的值对医疗卫生机构进行排名;将排名前10位的医疗卫生机构以及用户的地理位置通过调用地图应用程序编程接口进行发布;用户最后选择的医疗卫生机构的前往路线在地图上进行导航。本发明实现了实时的就诊推荐,为用户提供了更为切合其需求的就诊推荐和便捷的导航服务。
【专利说明】一种基于多源数据分析的就诊推荐方法

【技术领域】
[0001] 本发明涉及多源数据分析领域,具体涉及一种基于多源数据分析的就诊推荐方 法。

【背景技术】
[0002] 目前,居民在选择就诊医院时,大部分人采取的是慕名原则或就近原则,由于无法 掌握所选择的就诊医院的就诊人数动态信息,所以常常会遇到所选择的就诊医院就诊病患 太多、等待时间过长的情况。
[0003] 手机定位技术的成熟和手机用户的快速增长为实现人口时空动态监控提供了可 实施环境。目前手机定位技术已经能够对目标对象进行位置定位,并连续追踪其位置变化 信息,在此基础上,可通过位置数据处理和建模分析进行相应的人口移动轨迹分析,而这种 基于手机定位技术的人口移动轨迹分析方法相对于传统的调查方法有着明显优势:
[0004] (1)它是利用手机无线通信已有的基础设施,其成本较低;
[0005] (2)它是基于手机定位技术,当追踪目标对象的位置变化时,能够获取各种时间周 期间隔内移动轨迹的动态变化特征,能够获取充足的追踪对象的位置数据样本,获得的数 据具有较强的代表性和真实性,数据质量较高。
[0006] 而随着大数据技术的发展,利用手机定位技术能够随时得到当前各医疗卫生机 构人口时空动态分布数据以及医疗卫生机构各个科室的水平和之前就诊病患的评价等 多源数据,如果将这些关联数据进行就诊推荐分析,并利用地理信息系统(Geographic Information System)进行定位导航,就可以在了解用户就诊需求的基础上,为用户提供更 为切合其需求的就诊推荐和便捷的导航服务。
[0007] 有鉴于此,开发一种基于多源数据分析,利用地理信息系统为用户推荐所需就诊 项最优医疗卫生机构和便捷的导航服务的方案非常符合当前的需求。


【发明内容】

[0008] 本发明所要解决的技术问题是如何为用户推荐所需就诊项最优的医疗卫生机构 和便捷的导航服务的问题。
[0009] 为了解决上述技术问题,本发明所采用的技术方案是提供一种基于多源数据分析 的就诊推荐方法包括以下步骤:
[0010] 第一步、对辖区内医疗卫生机构信息进行注册;
[0011] 第二步、采集用户就诊项目信息和用户所处位置信息,发送就诊推荐请求;
[0012] 第三步、根据就诊推荐请求,利用每个医疗卫生机构信息、每个医疗卫生机构当前 的人口分布密度和用户所处位置信息进行多源数据融合,获得每个医疗卫生机构在某一时 段内被用户选择可能性;
[0013] 第四步、按照每个医疗卫生机构被用户选择可能性由大到小进行排名;
[0014] 第五步、将排名前10位的医疗卫生机构以及用户的地理位置通过调用地图应用 程序编程接口进行发布,其中排第一位的为首推医疗卫生机构;
[0015] 第六步、对用户最后选择的医疗卫生机构的前往路线在地图上进行导航。
[0016] 在上述方法中,医疗卫生机构信息包括以下内容:
[0017] 医疗卫生机构名称、地址;
[0018] 医疗卫生机构面积;
[0019] 医疗卫生机构简介,包含科室种类、各科室的医疗水平、各科室医疗情况简介以及 联系电话;
[0020] 以往就诊病患的评价级别。
[0021] 在上述方法中,在第二步中,采集用户就诊项目信息的方式为:用户通过移动终端 或web终端在固定的多条就诊项目选择需要的就诊项目来完成,若用户对自身病症所属就 诊项目不明确,可进行在线咨询。
[0022] 在上述方法中,在第二步中采集用户所处位置信息的方式包括以下情况:
[0023] 当用户通过移动终端选择就诊项目时,通过移动终端GPS定位自动获取用户当前 所处位置信息;
[0024] 当用户通过web终端选择就诊项目时,提示用户同时输入所处位置信息。
[0025] 在上述方法中,在步骤第三步中,利用多源数据融合获得某一时段内,每个医疗卫 生机构被用户选择可能性的数学模型为:
[0026] y = e +al X xl+a2 X x2+a3 X x3+a4 X x4 ;
[0027] 其中,y为某一时段内用户选择医疗卫生机构可能性的值,e为常数项,xl为医疗 卫生机构人口分布密度,x2为医疗卫生机构各个科室的医疗水平,x3为以往就诊病患的评 价级别,x4为用户与医疗卫生机构之间的距离,aj为因素 xj的影响系数,j取1、2、3、4 ;
[0028] 常数项e和影响系数aj采用如下方式获得:首先通过问卷调查的方式采集各医 疗卫生机构在某一时段内被用户选择可能性y,以及对应的因素 xj值,然后再利用多元回 归分析算法获得数学模型获得在该时段内的常数项e和影响系数aj。
[0029] 在上述方法中,第三步具体包括以下步骤:
[0030] 步骤A310、接收用户就诊推荐请求,并记录该就诊推荐请求的接收时间;
[0031] 步骤A320、根据用户所处位置信息计算用户与每个医疗卫生机构间距离;
[0032] 步骤A330、根据该就诊推荐请求的接收时间获取相应时间段内各医疗卫生机构的 当前人口分布密度;
[0033] 步骤A340、将每个医疗卫生机构的当前人口分布密度、医疗卫生机构各个科室的 医疗水平、以往就诊病患的评价级别以及用户与医疗卫生机构间距离代入数学模型,得到 每个医疗卫生机构在该时间段内用户选择的可能性。
[0034] 在上述方法中,步骤A340中,采用如下方法获得每个医疗卫生机构的当前人口分 布密度:
[0035] 步骤A341、将一天等分为N个时间段T(i),i彡N,i、N为正整数;
[0036] 步骤A342、采用问卷调查的方式获得每个医疗卫生机构覆盖范围内,在每一个时 间段内的手机用户百分比;
[0037] 步骤A343、实时获取每个医疗卫生机构覆盖范围的时间段T (i)内,所有手机用户 的定位信息,据此得到时间段T (i)内各医疗卫生机构的手机用户数量;
[0038] 步骤A344、利用时间段T(i)内,手机用户百分比和各医疗卫生机构的手机用户数 量,获得时间段T(i)内各个医疗卫生机构当前人口总数;
[0039] 步骤A345、将各个医疗卫生机构时间段T (i)内当前人口总数除以对应医疗卫生 机构面积,得到各个医疗卫生机构当前人口分布密度。
[0040] 在上述方法中,步骤A343包括以下步骤:
[0041] 将医疗卫生机构覆盖范围等分为多个分析区域TAZ (n),其中:n为正整数;
[0042] 获取时间段T(i)内所有手机的定位信息,将其与每个分析区域TAZ(n)进行映射, 得到每个手机用户途经的分析区域情况;
[0043] 按预设时间间隔将时间段T(i)等分为m个范围,m为正整数;
[0044] 以手机号为用户ID,将每个预设时间间隔内的手机定位信息按用户ID进行分组, 并对每组手机定位信息按时间戳进行排序;
[0045] 分别获取每个预设时间间隔内每个用户ID对应的最后分析区域,得到在每个预 设时间间隔内各分析区域TAZ (n)所对应的ID集;
[0046] 将分析区域TAZ(n)的每一预设时间间隔的ID集与相邻的上一预设时间间隔的每 一区域的ID集进行合并,ID相同的保留时间戳最新的数据,得到的分析区域TAZ(n)合并 ID集;
[0047] 将分析区域TAZ (n)合并ID集中每个ID对应的时间戳与时间段T⑴结束时刻的 时间间隔与预设时间阈值做比较,删除合并ID集中时间间隔大于预设时间阈值的用户ID, 每个分析区域合并ID集中用户ID的数量即为时间段T (i)内手机用户的数量;
[0048] 将时间段T(i)内每个分析区域手机用户的数量相加,获得每个医疗卫生机构覆 盖范围的时间段T(i)内手机用户的数量。
[0049] 在上述方法中,在第六步中,导航包括获取实时路况信息,给予用户路况提醒
[0050] 本发明利用手机定位技术做到了随时得到当前各医疗卫生机构人口时空动态分 布数据,并通过多源数据分析实现了实时的就诊推荐分析,使用户可以掌握选择就诊医院 的就诊人数动态信息,能够有效的避免遇到就诊病患太多等待时间过长的情况,同时还利 用地理信息系统为用户对选择的就诊医疗机构进行定位导航,在了解用户就诊需求的基础 上,为用户提供更为切合其需求的就诊推荐和便捷的导航服务。

【专利附图】

【附图说明】
[0051] 图1为本发明一种基于多源数据分析的就诊推荐方法的流程图;
[0052] 图2为本发明中第二步的流程图;
[0053] 图3为本发明中获得每个医疗卫生机构的当前人口分布密度的流程图;
[0054] 图4为本发明中步骤A343的流程图。

【具体实施方式】
[0055] 下面结合说明书附图和具体实施例对本发明做出详细的说明。
[0056] 如图1所示,本发明提供的一种基于多源数据分析的就诊推荐方法包括以下步 骤:
[0057] 第一步、通过网络对辖区内医疗卫生机构信息进行注册;
[0058] 医疗卫生机构信息包括以下内容:
[0059] 医疗卫生机构名称、地址;
[0060] 医疗卫生机构面积;
[0061] 医疗卫生机构简介,包含科室种类(就诊项)、各科室的医疗水平、各科室医疗情 况简介以及联系电话等;
[0062] 以往就诊病患的评价级别。
[0063] 具体实施过程中,医疗卫生机构的信息可由医疗卫生机构通过网络自行录入到辖 区医疗卫生机构信息库中。
[0064] 第二步、采集用户就诊项目信息和用户所处位置信息,发送就诊推荐请求;
[0065] 采集用户就诊项目信息的方式为:用户通过移动终端或web终端在固定的多条就 诊项目选择需要的就诊项目来完成,在选择就诊项目时,若用户对自身病症所属就诊项目 不明确,可进行在线咨询。
[0066] 采集用户所处位置信息的方式分包括以下情况:
[0067] 当用户通过移动终端选择就诊项目时,通过移动终端GPS定位自动获取用户当前 所处位置信息;
[0068] 当用户通过web终端选择就诊项目时,提示用户同时输入所处位置信息。
[0069] 第三步、根据就诊推荐请求,利用每个医疗卫生机构信息、每个医疗卫生机构当前 的人口分布密度和用户所处位置信息进行多源数据融合,获得每个医疗卫生机构在某一时 段内被用户选择可能性y。
[0070] 第四步、按照每个医疗卫生机构被用户选择的可能性y由大到小进行排名。
[0071] 第五步、将排名前10位的卫生医疗机构(不满10个的,则全部选择)以及用户的 地理位置通过调用百度地图API (Application Programming Interface,应用程序编程接 口)在百度地图上进行发布,即排名前十位的机构都需在地图上进行标注显示,其中排第 一位的为首推医疗卫生机构。
[0072] 第六步、对用户最后选择的医疗卫生机构的前往路线在地图(百度地图等)上进 行导航。
[0073] 用户根据推荐结果以及自身的需求、意向自行选择要前往就诊的医疗卫生机构, 例如用户选择了排名第一的1号医疗卫生机构,就会为用户提供从用户所在地理位置到1 号医疗卫生机构的路线安排导航。
[0074] 在本发明第六步中,导航包括通过调用百度TrafficControl接口(地图交通控制 接口)获取实时路况信息,给予用户路况提醒。
[0075] 在本发明第三步中,采用可以回归分析法进行多源数据融合,获得某一时段内每 个医疗卫生机构被用户选择可能性。
[0076] 其中,回归分析法,它是对客观事务数量依存关系的分析,是一种重要的统计分析 方法,广泛地应用于各类社会现象变量之间影响因素和关联的研究;例如多元回归、逻辑回 归(logistic regression)分析等算法,这些算法都可以对数据进行融合;而多元回归分 析在自然科学、社会科学和应用技术中都有重要应用,他是研究多个自变量与某个应变量 之间相关关系的一种常用统计方法,其根据统计资料来建立预报公式(经验公式),得到相 应的多元回归数学模型或逻辑回归(logistic regression)数学模型。
[0077] 在本发明中,利用多元回归分析算法进行多源数据融合,获得某一时段内每个医 疗卫生机构被用户选择可能性的数学模型为:
[0078] y = e +al X xl+a2 X x2+a3 X x3+a4 X x4 (I);
[0079] 其中,y为某一时段内用户选择医疗卫生机构可能性的值,e为常数项,xl为医疗 卫生机构人口分布密度,x2为医疗卫生机构各个科室的医疗水平,x3为以往就诊病患的评 价级别,x4为用户与医疗卫生机构之间的距离,aj为因素 xj的影响系数,j取1、2、3、4。
[0080] 常数项e和影响系数aj采用如下方式获得:首先通过问卷调查的方式采集各医 疗卫生机构在某一时段内被用户选择可能性y,以及对应的因素 xj值,然后再利用多元回 归分析算法获得数学模型获得在该时段内的常数项e和影响系数aj。
[0081] 如表1所示,通过问卷调查的方式采集各医疗卫生机构在某一时段内被用户选择 可能性y,以及对应的因素 xj值,这组数据包括:用户选择医疗生卫机构时医疗卫生机构人 口分布密度、医疗卫生机构各个科室的医疗水平数据、以往就诊病患的评价级别数据和用 户与医卫机构间距离以及相应用户选择医疗生卫机构可能性的值,将这些数据分别代入数 学模型(1)中,计算出常数项e及每个因素影响系数&1、&2、&3、 &4的值;例如根据表1中 数据,得到 e ?-1. 30675、al ?2. 3243、a2 ?1. 02695、a3 ?0? 9582、a4 ?-2. 44068,这 样就得到了符合辖区各医疗卫生机构实际情况的数学模型(1):
[0082] y = -L 30675+2. 3243 X xl+1. 02695 X x2+0. 9582 X x3-2. 44068 X x4 ;
[0083] 其中,仅有y、xl、x2、x3和x4为未知数。
[0084] 表I :通过问卷调查的方式采集各医疗卫生机构在某一时段内被用户选择可能性 y,以及对应的因素 xj值列表。

【权利要求】
1. 一种基于多源数据分析的就诊推荐方法,其特征在于,包括以下步骤: 第一步、对辖区内医疗卫生机构信息进行注册; 第二步、采集用户就诊项目信息和用户所处位置信息,发送就诊推荐请求; 第三步、根据就诊推荐请求,利用每个医疗卫生机构信息、每个医疗卫生机构当前的人 口分布密度和用户所处位置信息进行多源数据融合,获得每个医疗卫生机构在某一时段内 被用户选择可能性; 第四步、按照每个医疗卫生机构被用户选择可能性由大到小进行排名; 第五步、将排名前10位的医疗卫生机构以及用户的地理位置通过调用地图应用程序 编程接口进行发布,其中排第一位的为首推医疗卫生机构; 第六步、对用户最后选择的医疗卫生机构的前往路线在地图上进行导航。
2. 如权利要求1所述的方法,其特征在于,医疗卫生机构信息包括以下内容: 医疗卫生机构名称、地址; 医疗卫生机构面积; 医疗卫生机构简介,包含科室种类、各科室的医疗水平、各科室医疗情况简介以及联系 电话; 以往就诊病患的评价级别。
3. 如权利要求1所述的方法,其特征在于,在第二步中,采集用户就诊项目信息的方式 为:用户通过移动终端或web终端在固定的多条就诊项目选择需要的就诊项目来完成,若 用户对自身病症所属就诊项目不明确,可进行在线咨询。
4. 如权利要求1所述的方法,其特征在于,在第二步中采集用户所处位置信息的方式 包括以下情况: 当用户通过移动终端选择就诊项目时,通过移动终端GPS定位自动获取用户当前所处 位置信息; 当用户通过web终端选择就诊项目时,提示用户同时输入所处位置信息。
5. 如权利要求2所述的方法,其特征在于,在步骤第三步中,利用多源数据融合获得某 一时段内,每个医疗卫生机构被用户选择可能性的数学模型为: y = e +al Xxl+a2Xx2+a3Xx3+a4Xx4 ; 其中,y为某一时段内用户选择医疗卫生机构可能性的值,e为常数项,xl为医疗卫生 机构人口分布密度,x2为医疗卫生机构各个科室的医疗水平,x3为以往就诊病患的评价级 另|J,x4为用户与医疗卫生机构之间的距离,aj为因素xj的影响系数,j取1、2、3、4 ; 常数项e和影响系数aj采用如下方式获得:首先通过问卷调查的方式采集各医疗卫 生机构在某一时段内被用户选择可能性y,以及对应的因素xj值,然后再利用多元回归分 析算法获得数学模型获得在该时段内的常数项e和影响系数aj。
6. 如权利要求5所述的方法,其特征在于,第三步具体包括以下步骤: 步骤A310、接收用户就诊推荐请求,并记录该就诊推荐请求的接收时间; 步骤A320、根据用户所处位置信息计算用户与每个医疗卫生机构间距离; 步骤A330、根据该就诊推荐请求的接收时间获取相应时间段内各医疗卫生机构的当前 人口分布密度; 步骤A340、将每个医疗卫生机构的当前人口分布密度、医疗卫生机构各个科室的医疗 水平、以往就诊病患的评价级别以及用户与医疗卫生机构间距离代入数学模型,得到每个 医疗卫生机构在该时间段内用户选择的可能性。
7. 如权利要求6所述的方法,其特征在于,步骤A340中,采用如下方法获得每个医疗卫 生机构的当前人口分布密度: 步骤A341、将一天等分为N个时间段T (i),i彡N,i、N为正整数; 步骤A342、采用问卷调查的方式获得每个医疗卫生机构覆盖范围内,在每一个时间段 内的手机用户百分比; 步骤A343、实时获取每个医疗卫生机构覆盖范围的时间段T (i)内,所有手机用户的定 位信息,据此得到时间段T(i)内各医疗卫生机构的手机用户数量; 步骤A344、利用时间段T(i)内,手机用户百分比和各医疗卫生机构的手机用户数量, 获得时间段T(i)内各个医疗卫生机构当前人口总数; 步骤A345、将各个医疗卫生机构时间段T(i)内当前人口总数除以对应医疗卫生机构 面积,得到各个医疗卫生机构当前人口分布密度。
8. 如权利要求7所述的方法,其特征在于,步骤A343包括以下步骤: 将医疗卫生机构覆盖范围等分为多个分析区域TAZ(n),其中:n为正整数; 获取时间段T(i)内所有手机的定位信息,将其与每个分析区域TAZ(n)进行映射,得到 每个手机用户途经的分析区域情况; 按预设时间间隔将时间段T(i)等分为m个范围,m为正整数; 以手机号为用户ID,将每个预设时间间隔内的手机定位信息按用户ID进行分组,并对 每组手机定位信息按时间戳进行排序; 分别获取每个预设时间间隔内每个用户ID对应的最后分析区域,得到在每个预设时 间间隔内各分析区域TAZ(n)所对应的ID集; 将分析区域TAZ(n)的每一预设时间间隔的ID集与相邻的上一预设时间间隔的每一区 域的ID集进行合并,ID相同的保留时间戳最新的数据,得到的分析区域TAZ(n)合并ID集; 将分析区域TAZ(n)合并ID集中每个ID对应的时间戳与时间段T(i)结束时刻的时间 间隔与预设时间阈值做比较,删除合并ID集中时间间隔大于预设时间阈值的用户ID,每个 分析区域合并ID集中用户ID的数量即为时间段T(i)内手机用户的数量; 将时间段T(i)内每个分析区域手机用户的数量相加,获得每个医疗卫生机构覆盖范 围的时间段T(i)内手机用户的数量。
9. 如权利要求1所述的方法,其特征在于,在第六步中,导航包括获取实时路况信息, 给予用户路况提醒。
【文档编号】G06F17/30GK104391967SQ201410727073
【公开日】2015年3月4日 申请日期:2014年12月3日 优先权日:2014年12月3日
【发明者】许德玮 申请人:武汉邮电科学研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1