一种推荐学习课程的方法和终端的制作方法

文档序号:6502618阅读:237来源:国知局
一种推荐学习课程的方法和终端的制作方法
【专利摘要】本发明实施例提供一种推荐学习课程的方法和终端,方法应用于终端,包括:获取文本图像对应的电子图像,对电子图像进行光学字符识别得到文本数据,向课程库所在的服务器中请求将所述文本数据与课程库中的课程数据进行匹配;得到服务器返回的推荐课程推荐所述推荐课程。采用光学字符识别技术对获得的图像进行识别得到文本数据,避免了由于用户描述不够准确所可能造成的误解和时间浪费,将文本数据与课程库中的课程数据进行匹配,实现了仅依赖图像就能寻找到与其相关的课程,智能化向用户推荐其无法精确描述的知识和课程。
【专利说明】一种推荐学习课程的方法和终端

【技术领域】
[0001] 本发明涉及数据业务技术,特别是指一种推荐学习课程的方法和终端。

【背景技术】
[0002] 光学字符识别(OCR,Optical Character Recognition)是文字自动输入的一种方 法。目前OCR技术已经迁移到了终端中,通过终端的摄像头对文本和图片进行拍摄,将识别 后的文本信息应用于特定的应用。
[0003] 文本信息检索是针对文本的检索技术,相对视频音频检索而言发展较快,其他模 态的检索技术往往要仰赖文本信息检索的支持。虽然网络搜索引擎已不局限于文本信息 检索,但文本信息检索仍然是大部分网络搜索引擎的基础。文本信息检索主要分为三个部 分:信息内容分析与编码,产生信息记录及检索标识,组织存储,将全部记录按文件、数据库 等形式组成有序的信息集合,用户提问处理和检索输出。关键部分是信息提问与信息集合 的匹配和选择,即对给定提问与集合中的记录进行相似性比较,根据一定的匹配标准选出 有关信息。
[0004] 拍照翻译,基于OCR技术,通过终端的摄像头对文字进行拍照,选定不认识的单词 或句子,通过OCR技术转化成可识别的文本,并交给后台进行翻译,将翻译结果呈现在终端 屏幕上。
[0005] 视像搜索,通过OCR技术获得图片,对拍摄的图片进行处理识别,然后将识别出来 的信息交给搜索引擎,将搜索结果返回给用户。
[0006] 现有技术存在如下问题:无论是终端执行的拍照翻译还是视像搜索,都是各自在 某一个方面为用户提供了识别服务,并没有将多种搜索技术结合在一起,为用户提供更深 层次的服务。


【发明内容】

[0007] 本发明要解决的技术问题是提供一种推荐学习课程的方法和终端,通过对用户拍 摄到的一些与特定门类的知识有关联的图片进行处理,就能够获取用户所需要的推荐课 程。
[0008] 为解决上述技术问题,本发明的实施例提供一种推荐课程的方法,应用于终端,方 法包括:获取文本图像对应的电子图像,对电子图像进行光学字符识别得到文本数据,向课 程库所在的服务器中请求将所述文本数据与课程库中的课程数据进行匹配;得到服务器返 回的推荐课程推荐所述推荐课程。
[0009] 所述的方法中,获取文本图像对应的电子图像,具体包括:扫描文本图像,得到扫 描后生成的电子图像;或者,拍摄文本图像,得到拍摄后生成的电子图像。
[0010] 所述的方法中,对电子图像进行光学字符识别得到文本数据,之前还包括:采用区 域标记、边缘检测和霍夫曼变换对初始电子图像进行预处理,得到第二电子图像;以及采 用开源计算机视觉库对第二电子图像进行处理,得到进行光学字符识别所需的所述电子图 像。 toon] 所述的方法中,对电子图像进行光学字符识别得到文本数据,具体包括:根据终端 内嵌的光学字符识别引擎地址,将电子图像以HTTP请求传送给光学字符识别引擎,HTTP 请求中携带完整的电子图像,接收光学字符识别引擎对电子图像进行处理后反馈的文本数 据。
[0012] 所述的方法中,接收光学字符识别引擎对电子图像进行处理后反馈的文本数据, 具体包括:接收由光学字符识别引擎从电子图像中的内容中分析出文字形态特征,根据文 字形态特征判断出对应的标准编码,根据所述标准编码得到对应的字符所形成的文本数 据。
[0013] 所述的方法中,向课程库所在的服务器请求将所述文本数据与课程库中的课程数 据进行匹配,得到推荐课程,具体包括:采用HTTP请求携带文本数据,根据终端存放的移动 课程推荐服务器地址将HTTP请求发送给移动课程推荐服务器;接收移动课程推荐服务器 采用最大匹配法和反向最大匹配法提取关键字后,根据事先建立好的索引查找匹配到的推 荐课程。
[0014] 一种推荐课程的终端,包括:摄像单元,用于获取文本图像对应的电子图像,光学 字符识别单元,用于对电子图像进行光学字符识别得到文本数据,匹配请求单元,用于向课 程库所在的服务器中请求将所述文本数据与课程库中的课程数据进行匹配;推荐单元,用 于得到服务器返回的推荐课程,并推荐所述推荐课程。
[0015] 所述的终端中,还包括:预处理单元,用于在对电子图像进行光学字符识别得到文 本数据之前,采用区域标记、边缘检测和霍夫曼变换对初始电子图像进行预处理,得到第二 电子图像;以及采用开源计算机视觉库对第二电子图像进行处理,得到进行光学字符识别 所需的所述电子图像。
[0016] 所述的终端中,光学字符识别单元包括:光学字符识别引擎模块,用于根据终端内 嵌的光学字符识别引擎地址,将电子图像以HTTP请求传送给光学字符识别引擎,HTTP请求 中携带完整的电子图像,接收光学字符识别引擎对电子图像进行处理后反馈的文本数据。
[0017] 所述的终端中,匹配请求单元包括:网络协议模块,用于采用HTTP请求携带文本 数据,根据终端存放的移动课程推荐服务器地址将HTTP请求发送给移动课程推荐服务器; 接收模块,用于接收移动课程推荐服务器采用最大匹配法和反向最大匹配法提取关键字 后,根据事先建立好的索引查找匹配到的推荐课程。
[0018] 本发明的上述技术方案的有益效果如下:采用光学字符识别技术对获得的图像进 行识别得到文本数据,避免了由于用户描述不够准确所可能造成的误解和时间浪费,将文 本数据与课程库中的课程数据进行匹配,实现了仅依赖图像就能寻找到与其相关的课程, 智能化向用户推荐其无法精确描述的知识和课程。

【专利附图】

【附图说明】
[0019] 图1表示本发明实施例一种推荐学习课程的方法的流程示意图;
[0020] 图2表示终端、OCR引擎和移动课程推荐服务器的结构示意图。

【具体实施方式】
[0021] 为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具 体实施例进行详细描述。
[0022] 终端拍摄到文本信息,对文本信息进行识别,将识别出的文本与移动学习平台上 课程的关键字进行匹配,并返回跟识别出的文本相关的课程。
[0023] 本发明实施例提供一种推荐课程的方法,如图1所示,应用于终端,方法包括:
[0024] 步骤101,获取文本图像对应的电子图像,
[0025] 步骤102,对电子图像进行光学字符识别得到文本数据,
[0026] 步骤103,将所述文本数据与课程库中的课程数据进行匹配,得到推荐课程;
[0027] 步骤104,推荐所述推荐课程。
[0028] 应用所提供的技术,采用光学字符识别技术对获得的图像进行识别得到文本数 据,避免了由于用户描述不够准确所可能造成的误解和时间浪费,将文本数据与课程库中 的课程数据进行匹配,实现了仅依赖图像就能寻找到与其相关的课程,智能化向用户推荐 其无法精确描述的知识和课程。
[0029] 在一个优选实施例中,获取文本图像对应的电子图像,具体包括:
[0030] 扫描文本图像,得到扫描后生成的电子图像;
[0031] 或者,拍摄文本图像,得到拍摄后生成的电子图像。
[0032] 在一个优选实施例中,对电子图像进行光学字符识别得到文本数据,之前还包 括:
[0033] 采用区域标记、边缘检测和霍夫曼变换对初始电子图像进行预处理,得到第二电 子图像;
[0034] 以及采用开源计算机视觉库对第二电子图像进行处理,得到进行光学字符识别所 需的所述电子图像。
[0035] 在一个优选实施例中,对电子图像进行光学字符识别得到文本数据,具体包括:
[0036] 根据终端内嵌的光学字符识别引擎(OCR引擎)地址,将电子图像以HTTP请求传 送给OCR引擎,HTTP请求中携带完整的电子图像,
[0037] 接收OCR引擎对电子图像进行处理后反馈的文本数据。
[0038] 在一个优选实施例中,接收OCR引擎对电子图像进行处理后反馈的文本数据,具 体包括:
[0039] 接收由OCR引擎从电子图像中的内容中分析出文字形态特征,根据文字形态特征 判断出对应的标准编码,根据所述标准编码得到对应的字符所形成的文本数据。
[0040] 采用扫描和摄像等光学输入方式获取文本图像上的文字图像信息,由终端配合 OCR引擎利用各种识别算法分析出文字形态特征,判断出汉字的标准编码,得到标准编码对 应的字符所形成的文本数据。
[0041] 在一个优选实施例中,向课程库所在的服务器请求将所述文本数据与课程库中的 课程数据进行匹配,得到推荐课程,具体包括:
[0042] 采用HTTP请求携带文本数据,根据终端存放的移动课程推荐服务器地址将HTTP 请求发送给移动课程推荐服务器;
[0043] 接收移动课程推荐服务器采用最大匹配法和反向最大匹配法提取关键字后,根据 事先建立好的索引查找匹配到的推荐课程。
[0044] 在一个应用场景中,终端、光学字符识别引擎(OCR引擎)和移动课程推荐服务器 (又称移动课程推荐平台)三者的架构如图2所示,工作流程包括:
[0045] 步骤201,终端接收用户选择的拍照查询命令,调用照相机/扫描仪接口进行拍 摄。
[0046] 步骤202,终端采用图像处理算法对拍摄到的电子图像进行预处理,包括区域标 记、边缘检测和霍夫曼变换等。
[0047] 米用开源计算机视觉库(Open CV,Open Source Computer Vision Library)进行 图像处理,得到电子图像。
[0048] 步骤203,终端根据内嵌的OCR引擎地址,采用HTTP请求将电子图像传送给OCR弓| 擎,HTTP请求中携带完整图片信息。
[0049] OCR引擎接收到HTTP请求,对电子图像进行处理得到文本数据,反馈文本数据给 终端。
[0050] 步骤204,终端采用HTTP请求携带文本数据,根据存放的移动课程推荐服务器地 址将HTTP请求发送给移动课程推荐服务器。
[0051] 步骤205,移动课程推荐服务器接收到终端发送的HTTP请求,读取HTTP请求中的 文本数据,对文本数据提取关键字,在移动课程推荐服务器上进行文本的匹配。
[0052] 文本匹配是搜索算法,具体可以采用最大匹配法和反向最大匹配法提取关键字, 然后根据事先建立的索引进行查找匹配,并根据匹配程度为查找结果排序,匹配程度根据 实际情况自行定义,包括:
[0053] 将移动课程推荐服务器里面的课程进行关键字标注,依据关键字采用倒排方式建 立索引,其中,采用课程名称的关键词作为索引,课程订购详情页作为索引目标,包括:
[0054] 课程名称的关键字采用最大匹配法和反向最大匹配法取得,例如:《大学英语六级 词汇掌中宝》,正相匹配得到的最大匹配结果为"大学I英语I六级I词汇I掌中I宝",反 向匹配得到最大匹配结果为"大学I英语I六级I词汇I掌中宝。
[0055] 将关键字存入倒排表,关键字储存方式为"关键字(所在课程订购详情页编 号,出现次数,出现位置)",例如,英语(#3307, 2, 5, 43) (#4615, 5, 0, 19, 34, 70, 143) (#2519, 1, 267) (#6742, 3, 19, 322, 526)......,
[0056] 当要检索"英语"方面的课程时,直接取出倒排表可得知编号3307、4615、2519、 6742的文章都是包含关键词-英语,且能知道包含了多少次,以及在各个课程订购详情页 中的具体出现位置。如此可以免去在整个系统的所有课程题目和介绍里去逐个查找的代 价,从而可以轻松快捷的得到推荐课程。
[0057] 步骤206,移动课程推荐服务器将排序后的推荐课程发送给终端,由终端显示推荐 课程。
[0058] 为寻找与文本图像相关的课程,终端拍摄文本图像,经过OCR引擎处理得到文本 数据,将文本数据与课程库中的数据进行文本匹配,利用事先构建的课程库索引得到最终 的推荐课程,由终端显示推荐课程供用户进行挑选。
[0059] 本发明实施例提供一种推荐课程的终端,包括:
[0060] 摄像单元,用于获取文本图像对应的电子图像,
[0061] 光学字符识别单元,用于对电子图像进行光学字符识别得到文本数据,
[0062] 匹配请求单元,用于向课程库所在的服务器中请求将所述文本数据与课程库中的 课程数据进行匹配;
[0063] 推荐单元,用于得到服务器返回的推荐课程,并推荐所述推荐课程。
[0064] 在一个优选实施例中,还包括:
[0065] 预处理单元,用于在对电子图像进行光学字符识别得到文本数据之前,
[0066] 采用区域标记、边缘检测和霍夫曼变换对初始电子图像进行预处理,得到第二电 子图像;
[0067] 以及采用开源计算机视觉库对第二电子图像进行处理,得到进行光学字符识别所 需的所述电子图像。
[0068] 在一个优选实施例中,光学字符识别单元包括:
[0069] OCR引擎模块,用于根据终端内嵌的OCR引擎地址,将电子图像以HTTP请求传送给 OCR引擎,HTTP请求中携带完整的电子图像,
[0070] 接收OCR引擎对电子图像进行处理得到的文本数据。
[0071] 在一个优选实施例中,匹配请求单元包括:
[0072] 网络协议模块,用于采用HTTP请求携带文本数据,根据终端存放的移动课程推荐 服务器地址将HTTP请求发送给移动课程推荐服务器;
[0073] 接收模块,用于接收移动课程推荐服务器采用最大匹配法和反向最大匹配法提取 关键字后,根据事先建立好的索引查找匹配到的推荐课程。
[0074] 采用本方案之后的优势是:用户在以往需要通过手动输入要学习的对象才能查找 到课程,并且用户更多情况下会对一个知识感到模糊,不知道该寻找什么样的课程进行学 习,而本申请只需用户将不清楚的知识进行手机拍照,就可以自动给用户推荐相关课程,通 过手机平台,实现移动学习。
[0075] 以上所述是本发明的优选实施方式,应当指出,对于本【技术领域】的普通技术人员 来说,在不脱离本发明所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也 应视为本发明的保护范围。
【权利要求】
1. 一种推荐课程的方法,其特征在于,应用于终端,方法包括: 获取文本图像对应的电子图像, 对电子图像进行光学字符识别得到文本数据, 向课程库所在的服务器中请求将所述文本数据与课程库中的课程数据进行匹配; 得到服务器返回的推荐课程推荐所述推荐课程。
2. 根据权利要求1所述的方法,其特征在于,获取文本图像对应的电子图像,具体包 括: 扫描文本图像,得到扫描后生成的电子图像; 或者,拍摄文本图像,得到拍摄后生成的电子图像。
3. 根据权利要求1所述的方法,其特征在于,对电子图像进行光学字符识别得到文本 数据,之前还包括: 采用区域标记、边缘检测和霍夫曼变换对初始电子图像进行预处理,得到第二电子图 像; 以及采用开源计算机视觉库对第二电子图像进行处理,得到进行光学字符识别所需的 所述电子图像。
4. 根据权利要求1所述的方法,其特征在于,对电子图像进行光学字符识别得到文本 数据,具体包括: 根据终端内嵌的光学字符识别引擎地址,将电子图像以HTTP请求传送给光学字符识 别引擎,HTTP请求中携带完整的电子图像, 接收光学字符识别引擎对电子图像进行处理后反馈的文本数据。
5. 根据权利要求4所述的方法,其特征在于,接收光学字符识别引擎对电子图像进行 处理后反馈的文本数据,具体包括: 接收由光学字符识别引擎从电子图像中的内容中分析出文字形态特征, 根据文字形态特征判断出对应的标准编码, 根据所述标准编码得到对应的字符所形成的文本数据。
6. 根据权利要求1所述的方法,其特征在于,向课程库所在的服务器请求将所述文本 数据与课程库中的课程数据进行匹配,得到推荐课程,具体包括: 采用HTTP请求携带文本数据,根据终端存放的移动课程推荐服务器地址将HTTP请求 发送给移动课程推荐服务器; 接收移动课程推荐服务器采用最大匹配法和反向最大匹配法提取关键字后,根据事先 建立好的索引查找匹配到的推荐课程。
7. -种推荐课程的终端,其特征在于,包括: 摄像单元,用于获取文本图像对应的电子图像, 光学字符识别单元,用于对电子图像进行光学字符识别得到文本数据, 匹配请求单元,用于向课程库所在的服务器中请求将所述文本数据与课程库中的课程 数据进行匹配; 推荐单元,用于得到服务器返回的推荐课程,并推荐所述推荐课程。
8. 根据权利要求7所述的终端,其特征在于,还包括: 预处理单元,用于在对电子图像进行光学字符识别得到文本数据之前, 采用区域标记、边缘检测和霍夫曼变换对初始电子图像进行预处理,得到第二电子图 像; 以及采用开源计算机视觉库对第二电子图像进行处理,得到进行光学字符识别所需的 所述电子图像。
9. 根据权利要求7所述的终端,其特征在于,光学字符识别单元包括: 光学字符识别引擎模块,用于根据终端内嵌的光学字符识别引擎地址,将电子图像以 HTTP请求传送给光学字符识别引擎,HTTP请求中携带完整的电子图像, 接收光学字符识别引擎对电子图像进行处理后反馈的文本数据。
10. 根据权利要求7所述的终端,其特征在于,匹配请求单元包括: 网络协议模块,用于采用HTTP请求携带文本数据,根据终端存放的移动课程推荐服务 器地址将HTTP请求发送给移动课程推荐服务器; 接收模块,用于接收移动课程推荐服务器采用最大匹配法和反向最大匹配法提取关键 字后,根据事先建立好的索引查找匹配到的推荐课程。
【文档编号】G06F17/30GK104142955SQ201310170671
【公开日】2014年11月12日 申请日期:2013年5月8日 优先权日:2013年5月8日
【发明者】戴和忠, 邱一丰, 蒋力, 方磊, 高磊 申请人:中国移动通信集团浙江有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1