一种建立黄页通讯标识库的方法和装置的制造方法_2

文档序号:9910686阅读:来源:国知局
讯标识库的流程图;
[0060] 图4是根据一示例性实施例示出的一种服务器的结构示意图;
[0061] 图5是根据一示例性实施例示出的一种服务器的结构示意图;
[0062] 图6是根据一示例性实施例示出的一种服务器的结构示意图;
[0063] 图7是根据一示例性实施例示出的一种服务器的结构示意图。
[0064] 通过上述附图,已示出本公开明确的实施例,后文中将有更详细的描述。这些附图 和文字描述并不是为了通过任何方式限制本公开构思的范围,而是通过参考特定实施例为 本领域技术人员说明本公开的概念。
【具体实施方式】
[0065] 这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及 附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例 中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附 权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。
[0066] 本公开一示例性实施例提供了一种建立黄页通讯标识库的方法,建立黄页通讯标 识库的方法可以用于服务器中,其中,服务器可以是黄页服务器等。服务器中可以设置有处 理器、存储器、收发器等,处理器可以用于建立黄页通讯标识库过程的处理,存储器可以用 于存储黄页通讯标识库等,收发器可以用于接收以及发送消息。
[0067] 如图1所示,该方法的处理流程可以包括如下的步骤:
[0068] 在步骤101中,根据各通讯标识对应的通讯频率,确定每个通讯标识对应的通讯频 率的排序值。
[0069] 其中,通讯标识可以是电话号码等,通讯频率可以是预设历史时长内的通讯标识 被呼叫频率与呼叫频率之和。
[0070] 在一实施例中,服务器在确定预设历史时长(如两个月、半年等)内各通讯标识对 应的通讯频率后,可以按照各通讯标识对应的通讯频率的高低,为各通讯标识进行排序,也 就是通讯标识对应的通讯频率越高,其排序值越小,随着通讯标识对应的通讯频率的逐渐 减小,通讯标识的排序值逐渐增加。例如,通讯标识A的通讯频率最高,为200次,通讯标识A 的排序值最小为1,通讯标识B的通讯频率仅次于通讯标识A的通讯频率,则通讯标识B的排 序值为2,通讯标识C的通讯频率仅次于通讯标识B的通讯频率,则通讯标识C的排序值为3, 以此类推,确定每个通讯标识的排序值。
[0071] 在步骤102中,基于每个通讯标识对应的通讯频率和排序值,进行曲线拟合,得到 通讯频率排序曲线。
[0072] 在一实施例中,服务器确定每个通讯标识对应的通讯频率和排序值后,可以将各 通讯标识对应的通讯频率作为y,各通讯标识对应的排序值作为X,然后可以基于多组通讯 频率和排序值进行曲线拟合,得到通讯频率排序曲线。该通讯频率排序曲线可以是单调递 减的,并且斜率可以随着排序值的增大而增大、或者随着排序值的增大而减小。
[0073] 可选的,可以基于最小二乘法,得到通讯频率排序曲线,相应的处理可以为:基于 每个通讯标识对应的通讯频率和排序值,基于最小二乘法,进行曲线拟合,得到通讯频率排 序曲线。
[0074] 在一实施例中,服务器在确定每个通讯标识对应的通讯频率和排序值后,根据多 次试验确定对排序值进行对数转换,并且底数为e时,曲线拟合的拟合程度最好。服务器可 以将各通讯标识对应的排序值作对数变换,也就是X=lnx,这样转换后变成了 y与X的关系, 对排序值作对数处理后,曲线的变化幅度趋于平缓,可以利用最小二乘法进行线性回归,X 为通讯标识的排序值,X为对X作对数变换后的值,作为转换后的输入变量,y为通讯频率,作 为输出变量,这样可以得到多组(XnyO,然后确定线性回归后的函数表达式为一次函数,也 就是y与X为一次函数(如y = aX+b),而X是由X作对数变换得到的,这样就得到了通讯频率y 与排序值X的函数表达式(如y = alnx+b),也就是通讯频率排序曲线,如图2所示。例如,得到 多组(Xi,yi),可以利用最小二乘法中
.(其中
>·_分别为Xi与yi的 平均值),可以得到y与X为一次函数的斜率为-22.59,截距为137.75,也就是y = -22.59X+ 137 · 75,则通讯频率排序曲线为y = -22 · 591nx+l 37 · 75。
[0075] 另外,还可以计算根据最小二乘法得到的y与X的关系与实际的y与X的关系的相关 系数,来检验曲线拟合的拟合程度,相关系数的平方值越大,曲线拟合程度越好,也就是最 小二乘法得到的y与X的关系更接近实际y与X的关系,相关系数可以为犮= ,例 如,相关系数R的平方值为0.8548,说明y与X的关系与实际y与X的关系拟合程度为85.48%。
[0076] 在步骤103中,根据通讯频率排序曲线,确定通讯频率高于预设斜率阈值对应的通 讯频率阈值的通讯标识。
[0077]在一实施例中,技术人员可以根据经验值(如处理一个通讯标识所需要的成本、以 及带来的收益等),确定预设斜率阈值(处理一个通讯标识后可以使被使用次数(通讯频率) 提高的幅度),并且存储至服务器,服务器得到通讯频率的排序曲线后,可以计算每个通讯 标识对应的排序值位置处的斜率,并且确定高于预设斜率阈值的排序值范围,然后确定该 排序值范围中包含的排序值对应的通讯标识。
[0078] 可选的,可以根据导数表达式确定通讯频率高于预设斜率阈值对应的通讯频率阈 值的通讯标识,相应的处理可以为:对通讯频率排序曲线对应的函数表达式求导,得到导数 表达式;基于导数表达式,确定使导数值大于预设斜率阈值的排序值范围;确定排序值范围 中包含的排序值对应的通讯标识。
[0079] 在一实施例中,服务器确定通讯频率排序曲线的函数表达式后,可以对通讯频率 排序曲线对应的函数表达式中的排序值X求导数,得到导数表达式,然后可以根据导数表达 式的绝对值和预设斜率阈值(如〇. 01%等),确定使导数值大于预设斜率阈值的排序值范 围,然后可以根据排序值范围,确定排序值范围中各排序值对应的通讯标识。例如,服务器 确定的排序曲线为y = -22.591nx+137.75,求导之后为办/θχ = -22.59/X,也就是通讯频率 排序曲线上每一个排序值位置处的斜率表达式为-22.59/χ,这样可以使-22.59/χ的绝对值 大于预设斜率阈值〇.〇1%,得到1<225900,所以得到的排序值范围为0<1<225900,然后 可以确定排序值范围为〇 < X < 225900中各排序值对应的通讯标识。
[0080] 在步骤104中,根据确定出的通讯标识,建立黄页通讯标识库。
[0081] 在一实施例中,服务器在确定通讯标识后,可以将各通讯标识添加至黄页通讯标 识库,以便后续对这些通讯标识进行更新维护。
[0082] 可选的,可以根据通讯标识对应的菜单信息,建立黄页通讯标识库,相应的处理可 以为:获取确定出的通讯标识对应的菜单信息,建立黄页通讯标识库,其中菜单信息至少包 括以下信息中的一种或任意组合:名称信息、地理位置信息、图像信息、优惠信息。
[0083]其中,通讯标识对应的菜单信息可以至少包括以下信息中的一种或任意组合:通 讯标识对应的名称信息(**商店、**医院等)、地理位置信息(**市**街道**号、经炜度等)、 图像信息商店的全景图、招牌菜等)、优惠信息(8月30日至10月7日全店八折,12月30日 至1月3日进店有礼等)。
[0084] 在一实施例中,服务器可以根据确定出的通讯标识,从网络或已经收录的通讯标 识对应的菜单信息中查找对应的菜单信息,如名称信息、地理位置信息、图像信息、优惠信 息等,然后可以将获取到的菜单信息与通讯标识对应起来,建立通讯标识与菜单信息的对 应关系,如表一所示,然后将其存储至黄页通讯标识库,也就是建立黄页通讯标识库。例如, 服务器在获取到通讯标识后,针对每个通讯标识,可以按照预设搜寻条件(如名称、位置 等),利用网络爬取方式在各个网站中获取该通讯标识对应的菜单信息中的任意信息。
[0085] 表一
[0086]
[0087] 另外,在服务器确定通讯标识后,技术人员可以通过各种方式获取各通讯标识对 应的菜单信息(如查询网络、打电话询问等),然后将各通讯标识对应的菜单信息存储至黄 页通讯标识库。
[0088] 本公开实施例使用最小二乘法来确定通讯标识,同样也可以使用极大似然估计算 法来确定通讯标识,本公开实施例不做限定。另外本公开实施例提到利用相关系数检验曲 线拟合的拟合程度,也可以使用置信水平等来检验曲线拟合的拟合程度,本公开实施例不 做限定。
[0089] 本公开实施例还提供了确定每个通讯标识的通讯频率的方法,如图3所示,相应的 处理流程如下:
[0090] 在步骤20
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1