信息处理装置、信息处理方法和程序与流程

文档序号：16366549发布日期：2018-12-22 08:28阅读：155来源：国知局

本公开涉及信息处理装置、信息处理方法以及程序。

背景技术

随着近年来信息处理和信息通信技术的发展，计算机已经得到了广泛的使用，并且计算机甚至已经被积极地用在日常生活中。例如，诸如智能电话或移动电话终端的移动通信终端的使用使得可以在外出时查看网络上的信息或享受至目的地的导航服务。

另外，作为将网络上的各种文本信息转换成语音并且使得其被享用的服务，例如，下面的专利文献1提出了以下声音合成方法：在设置的条件、例如总音频时间长度、语音速度或基本再现文章的数量的情况下，按兴趣程度降序从文章组中逐一选择具有高兴趣程度的文章，将所选择的文章概括为近似量，并且用合成声音再现文章。

引文列表

专利文献

专利文献1：jp2008-164759a

技术实现要素：

技术问题

此处，在声音信息呈现开始之后不能收听信息的情况下，需要复杂的操作，例如停止音频再现或调低音量。被显示以用于呈现的视觉信息仅要求视线从其转移，但是在音频信息的情况下必须停止音频再现。

本公开于是提出了一种能够控制音频信息量使得在能够呈现信息的时间内完成对音频信息的收听并且提高音频信息呈现的便利性的信息处理装置、信息处理方法和程序。

问题的解决方案

根据本公开，提出了一种信息处理装置，该信息处理装置包括：估计部，其被配置成在确定用户能够接收声音信息呈现的状态的情况下，估计能够接收信息呈现的状态的持续时间；以及调整部，其被配置成根据所估计的持续时间调整要呈现给用户的信息量。

根据本公开，提出了一种信息处理方法，该信息处理方法包括：在确定用户能够接收声音信息呈现的状态的情况下，估计可以接收信息呈现的状态的持续时间；以及根据所估计的持续时间调整要呈现给用户的信息量。

根据本公开，提出了一种用于使得计算机用作以下的程序：估计部，其被配置成在确定用户能够接收声音信息呈现的状态的情况下，估计能够接收信息呈现的状态的持续时间；以及调整部，其被配置成根据所估计的持续时间调整要呈现给用户的信息量。

本发明的有益效果

根据上述本公开，可以控制音频信息量使得在能够接收信息呈现的时间内完成对音频信息的收听并且提高音频信息呈现的便利性。

注意，以上描述的效果不必然是限制性的。与以上效果一起或替代以上效果，可以实现本说明书中描述的任一效果或者可以从本说明书理解到的其他效果。

附图说明

[图1]图1是用于描述根据本实施方式的信息处理装置的概述的图。

[图2]图2是示出根据本实施方式的信息处理装置的配置的示例的框图。

[图3]图3是用于描述根据本实施方式的音频信息呈现控制定时的图。

[图4]图4是用于描述根据本实施方式的基于用户他自己或她自己的动作历史的对可读时间的估计的图。

[图5]图5是用于描述根据本实施方式的基于所有用户的动作历史的对可读时间的估计的图。

[图6]图6是示出根据本实施方式的阅读调整操作处理的流程图。

[图7]图7是示出根据本实施方式的可读时间估计操作处理的流程图。

[图8]图8是示出根据本实施方式的第一修改例的信息处理装置的配置的示例的框图。

[图9]图9是示出根据本实施方式的第一修改例的阅读调整操作处理的流程图。

[图10]图10是示出根据本实施方式的第二修改例的系统配置的示例的图。

[图11]图11是示出根据本实施方式的第二修改例的服务器的配置的示例的图。

具体实施方式

在下文中，将参照附图详细描述本公开的(一个或多个)优选实施方式。注意，在本说明书和附图中，使用相同的附图标记来表示具有基本相同的功能和结构的结构元件，并且省略了对这些结构元件的重复说明。

此外，将按以下顺序给出描述。

1.根据本公开的实施方式的信息处理装置的概述

2.内部配置示例

3.操作处理

4.修改例

4-1.第一修改例

4-2.第二修改例

5.总结

<<1.根据本公开的实施方式的信息处理装置的概述>>

首先，将参照图1描述根据本公开的实施方式的信息处理装置的概述。图1是示出根据本实施方式的信息处理装置1的外部配置的示例的透视图。

如图1中所示，根据本实施方式的信息处理装置1可以是例如围绕用户的颈部悬挂的颈带信息处理终端。颈带信息处理装置1包括可穿戴单元(可穿戴部)，该可穿戴单元被成形为围绕颈部的一半从两侧延伸至后侧(背侧)。颈带信息处理装置1以围绕用户的颈部悬挂的方式被用户穿戴。图1示出了在可穿戴单元被用户穿戴的情况下的透视图。注意，本说明书使用词上、下、左、右、前和后来指示方向，但是假设这些方向指示在用户直立的情况下从用户身体的中心(例如，胃位置)观看时的方向。例如，假设“右”指示朝用户身体的右半部分的方向，而“左”指示朝用户身体的左半部分的方向。“上”指示朝用户头部的方向，并且“下”指示朝用户脚部的方向。另外，假设“前”指示用户的身体面向的方向，并且“后”指示用户的背侧的方向。

如图1中所示，可穿戴单元可以与用户的颈部紧密接触地被穿戴或者在距用户的颈部一些间隔的情况下被穿戴。注意，如围绕颈部悬挂的可穿戴单元的其他形状，例如，通过颈部条带由用户穿戴的悬挂式可穿戴单元以及耳机式可穿戴单元是可以的，其中该耳机式可穿戴单元包括在颈部后侧延伸的颈带而不是围绕头部穿戴的头带。

另外，可穿戴单元的使用形式可以是通过直接穿戴在人体上来使用可穿戴单元的形式。通过直接穿戴来使用可穿戴单元的形式是指在可穿戴单元与人体之间没有任何东西的情况下使用可穿戴单元的形式。例如，与用户的颈部皮肤接触地穿戴图1中所示的可穿戴单元的情况对应于这种形式。此外，诸如围绕头部直接穿戴的耳机式可穿戴单元和眼镜式可穿戴单元的各种形式是可以的。可替选地，可穿戴单元的使用形式可以是通过间接地穿戴在人体上来使用可穿戴单元的形式。通过间接地穿戴来使用可穿戴单元的形式是指在可穿戴单元与人体之间存在某些东西的情况下使用可穿戴单元的形式。例如，经由衣物与用户接触地穿戴图1中所示的可穿戴单元、例如可穿戴单元被穿戴并且隐藏在衬衫领等下面的情况对应于这种形式。此外，诸如通过颈部条带由用户穿戴的悬挂式可穿戴单元和通过针等附接至衣物的胸针式可穿戴单元的各种形式是可以的。

另外，根据本实施方式的信息处理装置1包括多个麦克风12(12a和12b)、多个摄像装置13(13a和13b)以及多个扬声器15(15a和15b)。麦克风12获取音频数据、例如用户语音或周围环境声音。摄像装置13对周围情况进行成像并且获取捕获的数据。另外，扬声器15再现音频数据。在图1中，麦克风12a和12b被设置在信息处理装置1的两个端侧，并且摄像装置13a和13b被设置在信息处理装置1的两端的前部。各个扬声器15a和15b被设置在其中在信息处理装置1被穿戴时扬声器15a和15b位于用户的双耳附近的位置。这些麦克风12、摄像装置13和扬声器15的安装位置和数量是示例，而不限于图1中所示的示例。例如，可以设置一个或三个或更多个麦克风12、摄像装置13和扬声器15，或者安装位置可以与图1的安装位置不同。

此处，存在的问题是：在穿戴可穿戴装置以不断地接收信息呈现以用于信息收集、娱乐和动作支持的情况下，在日常生活中频繁发生的“做其他事情”时不能检查视觉信息呈现。例如，在步行、骑自行车、做家务等时检查信息呈现是危险的，因为它们暂时地吸引眼睛。

相对地，在听觉信息呈现或声音信息呈现的情况下，即使在日常生活中“做其他事情”时，也可以在不使用手或眼睛的情况下检查听觉信息呈现或声音信息呈现。

另外，作为要呈现的信息，考虑到提取信息(pullinformation)和推送信息(pushinformation)。提取信息是当用户希望知道时所请求和呈现的信息，并且根据按钮操作、画面操作和语音操作来激活。另外，推送信息是在用户没有意识的情况下自动呈现的信息，并且其示例包括电子邮件通知、来电、来自应用的调用、通知、剩余电量的警告等。

推送音频通知具有自动呈现信息的优点。同时，推送音频通知还具有在用户不能收听信息的情况下呈现信息的缺点。另外，在用户在信息呈现开始之后变得不能收听信息的情况下，需要音频停止操作。此外，不能像视觉信息一样检查先前的信息，因此不能容易地参考之前已经收听过的内容。

于是，本实施方式估计用户可以接收信息呈现的时间，并且控制音频信息量使得用户在该时间内完成对音频信息的收听，从而可以提高音频信息呈现的便利性。

这使得用户在用户变得能够收听信息时接收声音信息呈现。另外，调整信息量使得在用户能够接收信息的区段内完成信息呈现。因此，不会仅仅因为用户在信息呈现开始之后变得不能收听信息而需要音频停止操作。

另外，简单地传达之前已经收听的内容使得易于参考上次已经收听的内容。

<<2.内部配置示例>>

接下来，将参照图2来描述根据本实施方式的信息处理装置1的内部配置。图2是示出根据本实施方式的信息处理装置1的内部配置的示例的框图。如图2中所示，信息处理装置1包括控制部10、通信部11、麦克风12、摄像装置13、9轴传感器14、扬声器15、位置测量部16、存储部17和生物特征传感器18。

(控制部10)

控制部10用作操作处理装置和控制装置，并且根据各种程序控制信息处理装置1的整体操作。控制部10例如由诸如中央处理单元(cpu)和微处理器的电子电路来实现。另外，控制部10可以包括存储要使用的程序、操作参数等的只读存储器(rom)以及临时存储适当变化的参数等的随机存取存储器(ram)。

另外，如图2中所示，根据本实施方式的控制部10用作用户状况识别部10a、周围状况识别部10b、确定部10c、估计部10d、调整部10e、呈现信息获取部10f以及声音合成部10g。

用户状况识别部10a具有基于关于用户的各种种类的传感器信息识别用户的状况的功能。例如，用户状况识别部10a基于由麦克风12拾取的用户语音、由摄像装置13捕获的用户的面部图像、由9轴传感器14中包括的加速度传感器、陀螺仪传感器、地磁传感器等感测到的传感器数据以及由位置测量部16测量的位置信息来识别用户的动作。当识别用户的动作时，可以掌握步行、跑步和停止的状况以及骑自行车、在机动车中、在火车上、坐着、站立和睡觉的更详细的状况。

另外，还可以基于从生物特征传感器18获取的生物特征传感器数据来识别用户的状况(例如集中程度)。生物特征传感器数据的示例包括脉搏、心率、排汗速率、体温、脑波、视线(可以通过使用通过对眼睛移动进行成像而获得的图像或感测眼睛周围肌肉的移动来检测)等。

用户状况识别部10b具有基于关于环境的各种种类的传感器信息来识别用户周围的环境的功能。例如，用户状况识别部10a基于由麦克风12拾取的环境声音(例如噪声和机动车的声音)、由摄像装置13拍摄的周围风景以及由位置测量部16测量的位置信息，而识别用户周围的状况(例如危险程度)。

确定部10c基于用户的状况或周围状况中的至少任何一个来确定是否是用户能够接收声音信息呈现的状态。根据本实施方式的信息处理装置1确定是否是用户能够接收信息的状态，并且在用户能够接收信息的情况下进行声音信息呈现。例如，确定部10c基于用户状况计算集中程度。在用户专注于一件事情的情况下，假设确定部10c确定信息呈现是不行的(ng)。在用户放松的情况下，假设确定部10c确定信息呈现是可以的(ok)。另外，根据用户正在采取哪种动作，可以确定信息呈现是ok还是ng。例如，当用户正在进行需要来自用户的艰辛的体力活动的运动时，优选地，信息呈现是ng。具体地，当用户正在跑步或踩踏自行车时，信息呈现是ng，并且当用户正在坐着或步行时，信息呈现是ok。更具体地，当用户正在以用户所有的力量踩踏自行车时，信息呈现被确定为ng，并且当用户正在交叉路口等处停止时，信息呈现被确定为ok。另外，当用户正在跑步时，信息呈现被确定为ng，并且当用户正在交通灯处停止时，信息呈现被确定为ok。

另外，确定部10c可以根据周围状况确定是否可以接收信息呈现。例如，确定部10c根据周围视频或声音计算周围危险程度(必须要注意的程度)，并且在危险程度高的情况下确定信息呈现是ng。例如，交通繁忙的交叉路口的危险程度高，因此确定部10c确定信息呈现是ng。更具体地，例如，在虽然用户正在驾驶机动车但是机动车正在平稳地移动的情况下，信息呈现是ok。然而，当必须要注意周围、例如拥挤的交叉路口时，信息呈现被确定为ng。另外，在周围噪声较大的地方，信息呈现被确定为ng。注意，不仅可以经由通信部11接收来自被设置到信息处理装置1的麦克风12或摄像装置13的针对周围状况的传感器数据，而且还可以经由通信部11接收来自安装在附近的监视摄像装置或运动传感器的针对周围状况的传感器数据，并且使用这些传感器数据来识别周围状况。

另外，确定部10c还能够通过综合考虑“用户状况”和“周围状况”来确定是否是用户能够接收声音信息呈现的状态。例如，确定部10c可以分别确定“用户状况”和“周围状况”。仅在能够确定信息呈现针对两种状况均是ok的情况下，确定部10c可以作为整体地输出指示信息呈现是ok的确定结果。在信息呈现针对它们中的至少任何一个是ng的情况下，确定部10c还可以作为整体地输出指示信息为ng的确定结果。可替选地，确定部10c可以分别确定“用户状况”和“周围状况”，并且加权并添加表示针对两种状况是否可以接收信息呈现的分数。在分数超过阈值的情况下，确定部10c可以综合地确定信息呈现是ok。

估计部10d估计用户能够接收信息呈现的状态的持续时间。在本实施方式中，执行控制使得在期间用户能够接收信息的区段(时间)内完成声音信息呈现。例如，在用户踩踏自行车并且在交通信号灯处停止的情况下，用户能够接收信息呈现的状态的持续时间是交通灯变绿并且用户开始移动之前经过的时间。图3是用于描述根据本实施方式的音频信息呈现控制定时的图。参照图3，下面描述期间用户能够接收信息的区段(时间)。

如图3中所示，阅读开始推荐定时是定时t1，在定时t1处，信息呈现ok基于用户状况或周围情况的确定结果而开始，并且阅读结束推荐定时是t3，在定时t3处，信息呈现ok的状态结束。从定时t1到定时t3的区段用作期间用户能够接收信息的区段或“可读时间”。根据本实施方式的信息处理装置1调整“阅读时间”(音频信息呈现时间)，使得例如在定时t1处阅读(音频信息呈现)开始，并且阅读结束的定时t2比可读时间结束的定时t3更早地到来。主要通过控制要呈现的音频信息量来调整“阅读时间”，但是下面将进行详细描述。另外，从阅读结束的定时t2至下一次阅读开始的定时t4的时间被称为“阅读间隔”。

可以例如基于用户他自己或她自己的过去的动作历史或者所有用户的过去的动作历史来估计用户能够接收信息呈现的持续时间(将被称为“可读时间”)。例如，根据本实施方式的存储部17每天累积用户的动作历史(日期和时间、位置和动作)。于是，估计部10d能够基于动作历史统计地获得用户变得“能够接收信息”的状况(位置信息、日期和时间信息以及动作)与在用户变得“不能接收信息”之前经过的时间(可读时间)之间的关系的趋势。即，估计部10d可以在某种状况发生的情况下根据针对过去类似状况的可读时间的平均值来估计可读时间。注意，估计部10d还能够通过机器学习获得可读时间。

图4是用于描述根据本实施方式的基于用户他自己或她自己的动作历史的对可读时间的估计的图。如图4中所示，例如，基于位置信息、一周中的各天、时间、动作和可读时间的历史，估计部10d可以统计地估计当在“工作日早上8:01”“自行车停”在“xx交叉路口”处时可读时间是“42秒”。

另外，根据本实施方式的估计部10d不限于用户他自己或她自己的动作历史，而是还能够基于所有用户的过去的动作历史来类似地估计可读时间。例如，可以从经由通信部11连接的网络上的服务器获取所有用户的过去的动作历史。

图5是用于描述根据本实施方式的基于所有用户的动作历史的对可读时间的估计的图。如图5中所示，例如，基于用户id、位置信息、一周中的各天、时间、动作和可读时间的历史，估计部10d可以统计地估计当在“工作日早上8:01”“自行车停”在“xx交叉路口”处时可读时间是“42秒”。

上面具体描述了使用用户他自己或她自己的动作历史或者所有用户的动作历史的对可读时间的估计。

注意，根据本实施方式的估计部10d可以基于当前位置信息从服务器请求在当前位置的所有用户的动作历史，并且在未获得估计所需要的足够数据(落在预定量以下)的情况下，估计部10d可以切换至基于累积在存储部17中的用户他自己或她自己的动作历史的估计。

另外，在基于所有用户的动作历史的估计的情况下，估计部10d可以从所有用户的动作历史中提取规律性并且使用该规律性来估计可读时间。例如，估计部10d根据最近一小时内在某一交通灯处停止过的人的动作历史来计算交通灯变化的定时的规律性，并且当用户在该交通灯处停止时估计在交通灯变绿并且用户开始移动之前的“期间能够接收信息呈现的持续时间”(可读时间)。在诸如用户的动作和周围状况规律地发生变化的交通灯和道路交叉路口的交通基础设施的情况下，估计部10d可以根据所有用户的移动开始时间和位置信息估计交通灯从红色变成绿色的定时的规律性。因此，可以估计在交通灯变绿之前将要花费多长时间，并且估计可读时间。

例如，在根据所有用户的动作历史，8:01、8:04、8:07、8:10...频繁地作为骑在自行车上的用户在xx交通灯处停止之后再次开始移动的定时的情况下，估计部10d可以估计交通灯在8:1+3n(n＝0，...，19)处从红色变成绿色。在骑自行车的某个用户在8:06在这样的xx交通灯处停止的情况下，可以估计用户停止达一分钟，并且然后开始移动。因此，“一分钟”被估计为可读时间。注意，在系统被构造成可以从交通基础设施或机动车接收控制信息的情况下，估计部10d可以从用户在其处停止的交通灯接收控制信息，掌握交通灯从红色变成绿色的时间，并且更准确地估计可读时间。

在估计部10d能够在基于所有用户的动作历史的估计之后或基于用户他自己或她自己的动作历史的估计之后根据交通基础设施的有规律的变化以高精度进行估计的情况下，估计部10d可以采用该估计的结果。

调整部10e具有将要呈现给用户的信息调整成使得在由估计部10d估计的可读时间内完成音频输出的信息量的功能。要呈现给用户的信息由呈现信息获取部10f获取。如上所述，要呈现给用户的信息例如是诸如推送通知的信息，该推送通知在适当的定时处被自动呈现给用户。例如，除了电子邮件通知、来电、来自应用的调用、通知、剩余电量的警告等之外，还可以呈现预先登记的新闻站点、社交网络服务(sns)等的新信息。

具体地，例如，调整部10e能够调整要阅读的项(item)的数量、要阅读的内容或阅读速度。另外，调整部10e可以组合这些调整方法。

-要阅读的项的数量的调整

调整部10e预先计算阅读要阅读的一条信息(例如将被称为“项”的新闻文章和电子邮件)所需要的时间，计算在可读时间内能够阅读多少项，并且根据可读时间调整要阅读的项的数量。阅读项所需要的时间可以从过去阅读项所需要的平均时间获得，或者根据要阅读的文本的字符数进行估计并获得。例如，调整部10e可以进行调整使得在长可读时间的情况下阅读十篇新闻文章，并且在短可读时间的情况下仅阅读三篇文章。

-要阅读的内容的粒度级(granularitydegree)的调整

调整部10e预先针对信息的每个粒度级，例如仅标题、仅第一句或所有句子，计算阅读所需要的时间，并且根据可读时间和必须阅读的项的数量调整至适当的粒度级。例如，调整部10e可以进行调整使得调整部10e在短可读时间的情况下仅阅读新闻标题，调整部10e在稍长可读时间的情况下阅读到第一句，调整部10e在更长的可读时间的情况下阅读到摘要句子，并且调整部10e在足够时间的情况下阅读所有句子。

-阅读速度的调整

调整部10e根据要阅读的信息量计算针对正常速度的阅读时间。在该时间比可读时间稍短的情况下，进行调整以使速度更高以使得在该时间内完成阅读。例如，在稍短的可读时间的情况下，调节部10e可以进行调整以使阅读速度高于正常速度。

呈现信息获取部10f获取要呈现给用户的信息。呈现信息可以通过通信部11来接收、从存储部17提取或者由在信息处理装置1中启动的应用生成。

声音合成部10g具有基于由调整部10e调整的呈现信息(文本)合成声音的功能。一旦呈现信息由声音合成部10g转换成语音，则从扬声器15输出音频信息以向用户呈现音频。

(通信部11)

通信部11是用于以有线/无线方式向其他装置发送数据以及从其他装置接收数据的通信模块。通信部11以诸如有线局域网(lan)、无线lan、无线保真(wi-fi)(注册商标)、红外通信、蓝牙(注册商标)、短程/非接触通信等的方案直接或经由网络接入点与外部装置进行无线通信。

(麦克风12)

麦克风12拾取用户语音或周围的环境声音，并且将其作为音频数据输出至控制部10。

(摄像装置13)

摄像装置13包括透镜系统、使透镜系统执行聚焦操作和变焦操作的驱动系统、固态图像传感器阵列等，其中该透镜系统包括成像透镜、光圈、变焦透镜、聚焦透镜等，该固态图像传感器阵列用于根据在透镜系统中获得的成像光的光电转换生成成像信号。固态图像传感器阵列可以例如由电荷耦合器件(ccd)传感器阵列和互补金属氧化物半导体(cmos)传感器阵列来实现。例如，摄像装置13被设置成能够利用由用户穿戴的信息处理装置1(可穿戴单元)对用户前方的区域进行成像。在这种情况下，摄像装置13变得能够对用户周围的风景或用户正在看的方向上的风景进行成像。另外，摄像装置13还可以被设置成能够利用由用户穿戴的信息处理装置1对用户的面部进行成像。在这种情况下，信息处理装置1变得能够从捕获的图像识别用户的视线方向或表情。另外，摄像装置13将被转换成数字信号的捕获图像的数据输出至控制部10。

(9轴传感器14)

9轴传感器14包括三轴陀螺仪传感器(其检测角速度(旋转速度))、三轴加速度传感器(其也被称为g传感器，并且检测移动时的加速度)以及三轴地磁传感器(罗盘，其检测绝对方向(方位角))。9轴传感器14具有对穿戴信息处理装置1的用户的状态或周围状态执行感测的功能。注意，9轴传感器14是传感器部的示例。本实施方式不限于此。例如，还可以使用速度传感器、振动传感器等。可以使用加速度传感器、陀螺仪传感器和地磁传感器中的至少任何一个。另外，传感器部可以被设置到与信息处理装置1(可穿戴单元)不同的装置或者被分配到多个装置。例如，可以将加速度传感器、陀螺仪传感器和地磁传感器设置到穿戴在头部上的装置(例如，耳机)，并且可以将速度传感器和振动传感器设置到智能电话。9轴传感器14将指示感测结果的信息输出至控制部10。

(扬声器15)

扬声器15根据控制部10的控制再现音频信号。音频信号由声音合成部10g处理。另外，扬声器15可以具有方向性。

(位置测量部16)

位置测量部16具有基于外部获取的信号检测信息处理装置1的当前位置的功能。具体地，例如，位置测量部16由全球定位系统(gps)测量部实现，从gps卫星接收无线电波，检测信息处理装置1的位置，并且将检测到的位置信息输出至控制部10。另外，除了gps之外，信息处理装置1可以例如根据wi-fi(注册商标)、蓝牙(注册商标)、向移动电话/phs/智能电话等发送并且从移动电话/phs/智能电话等接收、短程通信等来感测位置。

(存储部17)

存储部17存储使得上述控制部10能够执行每个功能的程序和参数。另外，根据本实施方式的存储部17可以累积用户的动作历史。

(生物特征传感器18)

生物特征传感器18感测用户的各种生物特征信息，并且将其作为生物特征传感器数据输出至控制部10。如上所述，生物特征传感器数据的示例包括脉搏、心率、排汗速率、体温、脑波、视线等。注意，可以将生物特征传感器18的至少一部分设置到外部装置。在这种情况下，由外部装置的生物特征传感器感测到的生物特征传感器数据可以由通信部11经由无线通信接收，并且被输出至控制部10。

上面具体描述了根据本实施方式的信息处理装置1的内部配置示例。

<<3.操作处理>>

接下来，将参照图6和图7来描述根据本实施方式的信息处理装置1的操作处理。图6是示出根据本实施方式的阅读调整操作处理的流程图。

如图6中所示，信息处理装置1的确定部10c首先确定是否是可读定时(步骤s103)。即，确定部10c根据用户状况和周围状况的识别结果确定当前是否是用户能够接收音频信息呈现的状态。

接下来，在确定当前是可读定时的情况下(步骤s106/是)，呈现信息获取部10f获取阅读信息(步骤s109)。阅读信息是诸如自动准备的推送通知信息等的信息。因此，呈现信息获取部10f搜索当前时刻要呈现给用户的信息。

然后，在存在阅读信息的情况下(步骤s112/是)，估计部10d估计可读时间(步骤s115)。将参照图7详细描述针对可读时间的估计处理。

接下来，调整部10e调整阅读内容(即，生成阅读内容)，使得在估计的可读时间内完成对呈现信息的阅读(步骤s118)。

然后，信息处理装置1使用声音合成部10g将调整后的内容转换成语音，并且从扬声器15阅读信息(音频呈现)(步骤s121)。

接下来，将参照图7描述上述步骤s115中的针对可读时间的估计处理。

图7是示出根据本实施方式的可读时间估计操作处理的流程图。如图7中所示，信息处理装置1的估计部10d首先获取在当前位置的所有用户的过去历史(步骤s130)。例如，所有用户的过去历史在服务器上。估计部10d从服务器请求当前位置处的所有用户的过去历史以及由位置测量部16测量的当前位置信息。

接下来，在累积了预定量的所有用户的过去历史的情况下(步骤s133/是)，基于所有用户的过去历史来估计可读时间(步骤s136)。

同时，在未累积预定量的所有用户的过去历史的情况下(步骤s133/否)，基于用户他自己或她自己的过去历史来估计可读时间(步骤s139)。

然后，估计部10d确定是否可以根据目标过去历史计算规律性(步骤s142)。规律性是例如道路交叉路口和交通灯的交通基础设施的有规律的变化。在用户状况和周围状况依赖于周围的交通基础设施的情况下，考虑这些的规律性使得可以估计更可靠的可读时间。

接下来，在可以计算规律性的情况下(步骤s142/是)，估计部10d计算规律性并且基于计算出的规律性更新可读时间的估计值(步骤s145)。

上面描述了根据本实施方式的操作处理。

<<4.修改例>>

<<4-1.第一修改例>>

接下来，将参照图8至图9描述本实施方式的第一修改例。在本修改例中，根据在用户在接收到信息之后变得能够接收下一信息之前的间隔(图3中所示的“阅读间隔”)改变用于阅读下一信息的方法。具体地，根据阅读间隔在下一次信息呈现时示出上次内容或与上次内容的相关性，从而可以进行更舒适的信息呈现。

(配置)

图8是示出根据本修改例的信息处理装置1-1的配置的示例的框图。如图8中所示，信息处理装置1-1包括控制部10-1、通信部11、麦克风12、摄像装置13、9轴传感器14、扬声器15、位置测量部16、存储部17和生物特征传感器18。

如图8中所示，控制部10-1用作用户状况识别部10a、周围状况识别部10b、确定部10c、估计部10d、调整部10e、呈现信息获取部10f、声音合成部10g、关联程度计算部10h、遗忘程度计算部10i和内容改变部10j。

具有与参照图2描述的部件的附图标记相同的附图标记的部件执行类似的处理，因而此处将不再对其进行描述。

关联程度计算部10h具有计算上次进行信息呈现的内容与本次进行信息呈现的内容之间的关联程度的功能。作为关联程度，计算例如信息是否涉及共同事项(例如，新闻涉及同一事件)、信息是否是相同类型(例如，诸如新闻、警告和通知的信息的类型，程序中同一角(corner)的信息等)。在关联程度高的情况下，通过根据下面描述的遗忘程度添加介绍消息以回忆上次信息来进行信息呈现。在关联程度低的情况下，不需要回忆上次信息。因此，不进行关于上次信息的信息呈现。

遗忘程度计算部10i预测用户忘记上次进行信息呈现的内容的程度并且计算其作为遗忘程度。例如，遗忘程度计算部10i可以根据阅读间隔的长度或从上次阅读结束至此次阅读开始的时间的长度来计算遗忘程度。另外，遗忘程度计算部10i还可以考虑用户在从上次阅读结束至此次阅读开始的时间内采取的动作(与其他人交谈、看电视、锻炼、工作、休息、获取其他信息等)，并且计算遗忘程度。例如，如下面的式1所示，遗忘程度(f)可以基本与距上次信息呈现的时间t成比例地增加。然而，在某些情况下，在该时间期间的用户动作增加了遗忘程度。

[数学式1]

f＝αt+σiβiai…式1

在上面的式1中，α表示与间隔有关的系数。βi表示与每个用户动作有关的系数。另外，t表示距上次信息呈现的间隔的长度(时间)。ai表示间隔t中的用户动作。

内容改变部10j根据计算出的遗忘程度改变要呈现给用户的信息的内容。例如，内容改变部10j根据遗忘程度的幅值将介绍消息添加至本次要呈现给用户的信息的开头。介绍消息提到与上次呈现信息的关系或上次呈现信息的内容。更具体地，在遗忘程度小于第一阈值的情况下，内容改变部10j仅做出如下内容改变：进行介绍性言论“这是延续”。另外，在遗忘程度大于第一阈值并且小于第二阈值(此处，假设第一阈值小于第二阈值)的情况下，内容改变部10j做出如下内容改变：在开头通过说“我将继续○○角。我之前报道过xxx”来说明上次呈现信息的关键词。此外，在遗忘程度大于第二阈值的情况下，内容改变部10j做出如下内容改变：在开头通过说“这是○○角。我上次‘.....’”来使用诸如例如一个句子的简单概述传达上次呈现的信息的内容。

(操作处理)

接下来，将参照图9来描述根据本修改例的操作处理。图9是示出根据本修改例的阅读调整操作处理的流程图。

如图9中所示，信息处理装置1-1的确定部10c首先确定是否是可读定时(步骤s203)。

接下来，在确定当前是可读定时的情况下(步骤s206/是)，呈现信息获取部10f获取阅读信息(步骤s209)，并且确定阅读信息是否存在(步骤s212)。步骤s203至s212中所示的处理类似于参照图6描述的步骤s103至s112中所示的处理。

接下来，在阅读信息存在的情况下(步骤s212/是)，关联程度计算部10h计算本次呈现的信息与上次呈现的信息之间的内容关联程度(步骤s215)。

接下来，在内容关联程度高于预设预定值的情况下(步骤s218/是)，遗忘程度计算部10i计算遗忘程度(步骤s221)。

然后，内容改变部10j根据计算出的遗忘程度改变呈现信息的内容(步骤s224)。

同时，在内容关联程度低于预设预定值的情况下(步骤s218/否)，不改变呈现信息的内容。

接下来，估计部10d估计可读时间(步骤s227)。针对可读时间的估计处理类似于参照图7描述的处理，并且此处将不再详细描述。注意，执行针对可读时间的估计处理的定时不限于图9中所示的处理顺序，而是可以在内容关联程度的计算(上面的步骤s215)之前或者与内容关联程度的计算并行地到来。

接下来，调整部10e调整阅读内容使得在估计的可读时间内完成对呈现信息的阅读(步骤s230)。

然后，信息处理装置1使用声音合成部10g将调整后的内容转换成语音，并且从扬声器15阅读信息(音频呈现)(步骤s233)。

<4-2.第二修改例>

接下来，将参照图10至图11描述本实施方式的第二修改例。图10是示出根据本修改例的系统配置的示例的图。

如图10中所示，本实施方式可以包括客户端-服务器类型系统。即，信息处理装置1(1a和1b)经由网络3连接至服务器4作为系统配置。

信息处理装置1a和1b两者均是根据本实施方式的信息处理装置1的示例。信息处理装置1a例如是由用户使用的终端，并且信息处理装置1b是由另一用户使用的终端。信息处理装置1b例如由智能电话实现、以无线或有线方式连接至耳机5，并且可以从耳机5呈现音频信息。信息处理装置1a和1b以无线或有线方式连接至网络3，并且可以向云上的服务器4发送数据以及从云上的服务器4接收数据。注意，图10中所示的示例示出了两个信息处理装置1。然而，本实施方式不限于此。由大量用户使用的大量信息处理装置1可以经由网络3连接至服务器4。

服务器4包括所有用户的动作历史数据库(db)42，累积从信息处理装置1a或1b发送的动作信息，并且根据需要将动作信息发送至外部装置。将参照图11描述服务器4的这种配置。

图11是示出根据本实施方式的服务器4的配置的示例的框图。如图11中所示，服务器4包括控制部40、通信部41和所有用户的动作历史db42。控制部40可以用作估计部40a、调整部40b和呈现信息获取部40c。每个部件的功能类似于信息处理装置1的相同部件的功能。

注意，通信部41可以经由网络3向外部装置发送数据以及从外部装置接收数据。此外，所有用户的动作历史db42累积经由通信部41从信息处理装置1a或1b等接收到的用户的动作历史。

服务器4可以例如响应于来自信息处理装置1a的请求从所有用户的动作历史db42提取预定的动作历史，并且将预定的动作历史返回。

另外，例如，响应于来自信息处理装置1a的请求，服务器4可以使用估计部40a来根据在某一状况发生的情况下的所有用户的在过去类似的状况下的可读时间的平均值估计可读时间，并且将该可读时间返回。

另外，例如，响应于来自信息处理装置1a的请求，服务器4可以使用呈现信息获取部40c来获取针对用户的呈现信息，并且可以返回被调整使得在由估计部40a估计的可读时间内完成阅读的数据。

另外，服务器4可以设置有与声音合成部10g以及图8中所示的关联程度计算部10h、遗忘程度计算部10i和内容改变部10j对应的部件。

<<5.总结>>

如上所述，根据本公开的实施方式的信息处理装置1估计能够接收信息呈现的时间(即，可读时间)，并且控制音频信息量使得在该时间内完成对音频信息的收听，从而可以提高音频信息呈现的便利性。

上面已经参照附图描述了本公开的(一个或多个)优选实施方式，然而本公开不限于以上示例。本领域技术人员可以在所附权利要求的范围内发现各种改变和修改，并且应当理解的是，这些改变和修改将自然落入本公开的技术范围内。

例如，还可以创建用于使得内置在上述信息处理装置1中的硬件、例如cpu、rom和ram执行信息处理装置1的功能的计算机程序。另外，还提供了其中存储有计算机程序的计算机可读存储介质。

此外，本说明书中描述的效果仅是说明性或示例性效果，并不是限制性的。即，与上述效果一起或替代上述效果，根据本公开的技术可以实现本领域技术人员根据本说明书的描述而清楚的其他效果。

另外，本技术还可以被如下配置。

(1)一种信息处理装置，包括：

估计部，其被配置成在确定用户能够接收声音信息呈现的状态的情况下，估计能够接收所述信息呈现的状态的持续时间；以及

调整部，其被配置成根据所估计的持续时间调整要呈现给所述用户的信息量。

(2)根据(1)所述的信息处理装置，其中，

基于所述用户的状况或周围状况中的至少任何一个来确定是否是能够接收所述信息呈现的状态。

(3)根据(2)所述的信息处理装置，其中，

所述用户的状况包括所述用户的动作，并且

根据所述用户的动作识别结果来确定是否是所述用户能够接收所述信息呈现的状态。

(4)根据(2)或(3)所述的信息处理装置，其中，

所述用户的状况包括所述用户的集中程度，并且

根据所述集中程度的计算结果来确定是否是所述用户能够接收所述信息呈现的状态。

(5)根据(2)至(4)中任一项所述的信息处理装置，其中，

所述用户的状况包括所述用户周围的危险程度，并且

根据所述危险程度的计算结果来确定是否是所述用户能够接收所述信息呈现的状态。

(6)根据(2)至(5)中任一项所述的信息处理装置，其中，

所述调整部将要呈现给所述用户的信息调整到使得在所述持续时间内完成音频输出的信息量。

(7)根据(6)所述的信息处理装置，其中，

所述调整部通过增加或减少要呈现给所述用户的信息的数量来进行调整。

(8)根据(6)或(7)所述的信息处理装置，其中，

所述调整部通过改变要呈现给所述用户的信息的粒度级来进行调整。

(9)根据(6)至(8)中任一项所述的信息处理装置，其中，

所述调整部通过改变要呈现给所述用户的信息的阅读速度来进行调整。

(10)根据(1)至(9)中任一项所述的信息处理装置，其中，

所述估计部基于所述用户的过去的动作历史来估计能够接收所述信息呈现的状态的所述持续时间。

(11)根据(1)至(9)中任一项所述的信息处理装置，其中，

所述估计部基于所有用户的过去的动作历史来估计能够接收所述信息呈现的状态的所述持续时间。

(12)根据(1)至(9)中任一项所述的信息处理装置，其中，

在与所述用户的当前位置相关联的所有用户的过去的动作历史达到预定量的情况下，所述估计部使用所述所有用户的动作历史来估计所述持续时间，并且在所述所有用户的过去的动作历史低于所述预定量的情况下，所述估计部使用所述用户的动作历史来估计所述持续时间。

(13)根据(1)至(9)中任一项所述的信息处理装置，其中，

所述估计部基于所有用户的过去的动作历史来提取周围交通基础设施的规律性，并且估计所述持续时间。

(14)根据(1)至(13)中任一项所述的信息处理装置，其中，

所述估计部基于从交通基础设施或机动车获取的控制信息来估计所述持续时间。

(15)根据(1)至(14)中任一项所述的信息处理装置，还包括：

计算部，其被配置成计算所述用户的遗忘程度；以及

改变部，其被配置成根据所计算的遗忘程度来改变要呈现给所述用户的信息。

(16)根据(15)所述的信息处理装置，其中，

所述改变部将介绍消息添加至呈现信息的阅读的开头，所述介绍消息是基于上次呈现的信息的。

(17)根据(15)或(16)所述的信息处理装置，其中，

所述计算部基于自上次呈现的时间起经过的时间和所述时间期间的用户动作中的至少任何一个来计算所述遗忘程度。

(18)根据(1)至(17)中任一项所述的信息处理装置，还包括：

获取部，其被配置成获取关于所述用户的状况或所述用户的周围状况的实时感测数据；以及

输出部，其被配置成输出针对呈现信息的阅读语音，所述呈现信息被调整成使得在所述用户能够接收所述信息呈现的状态的持续时间内完成阅读。

(19)一种信息处理方法，包括由处理器进行以下操作：

在确定用户能够接收声音信息呈现的状态的情况下，估计能够接收所述信息呈现的状态的持续时间；以及

根据所估计的持续时间调整要呈现给所述用户的信息量。

(20)一种用于使得计算机用作以下的程序：

估计部，其被配置成在确定用户能够接收声音信息呈现的状态的情况下，估计能够接收所述信息呈现的状态的持续时间；以及

调整部，其被配置成根据所估计的持续时间调整要呈现给所述用户的信息量。

附图标记列表

1，1a，1b信息处理装置

10，10-1控制部

10a用户状况识别部

10b周围状况识别部

10c确定部

10d估计部

10e调整部

10f呈现信息获取部

10g声音合成部

10h关联程度计算部

10i遗忘程度计算部

10j内容改变部

11通信部

12麦克风

13摄像装置

149轴传感器

15扬声器

16位置测量部

17存储部

18生物特征传感器

3网络

4服务器

40控制部

40a估计部

40b调整部

40c呈现信息获取部

41通信部

42所有用户的动作历史db

5耳机

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：涩谷直树;村田诚;加藤允文;吉井健吾
技术所有人：索尼公司
我是此专利的发明人

上一篇：一种生鱼膨化饲料其制备方法与流程
上一篇：用于液体物质，特别是尿素的造粒机的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。