一种基于超级画板的信息增值方法及装置的制造方法_2

文档序号:9375829阅读:来源:国知局
on_name,取出 contentArray中第二行内容作为函数的作用function_effect。
[0030] S15 :如果第三行是以"参数说明"出现在该行的行首,则遍历function中剩余每 行内容,如果当前行的行首不是"例",则将当前行加入到参数说明数组param_l i st中,如果 当前行的行首是"例",则将从这行开始,一直到结束contentArray中所有行内容,加入到 例子数组example_list中;否则执行步骤S16。
[0031] S16 :第三行是以"例"出现在行首,则将当前行到contentArray数组中末尾的所 有行内容,加入到例子数组example_list中。
[0032] S17:拼接param_list中的所有内容得到函数参数说明function_param,拼接 example_list中所有内容得到函数例子function_example,再将函数名function_name, 函数作用 function_effect,函数参数说明 function_param,函数例子:function_example 拼接在一起得到一个函数完整的内容function,并将function加入到函数数组function_ list中,转步骤S12。
[0033] S18 :图形函数文件全部处理结束,遍历函数数组function_list中所有函数内 容,写入文件 graphical_function_out. txt 中,退出。
[0034] S2:对超级画板的学生作品进行自动化点击,获取学生作品的网页文件,页面截 图,自动点击视频。
[0035] 具体而言S2又细分为以下步骤,下面做进一步阐述:
[0036] S21:配置超级画板的按钮位置信息,将超级画板学生作品的当前页面保存为网页 文件
[0037] S22:根据学生作品对应的网页文件提取学生作品中所有的按钮位置信息
[0038] S23:用AutoScriptWriter获取实际点击学生作品的按钮位置,并与从相对应作 品的网页文件提取的按钮位置做比较,计算出按钮点击的偏移值。
[0039] S24:配置录制视频所需的Snagit软件按钮位置信息
[0040] S25 :根据对步骤S24中获得的录制视频所需的按钮位置信息,对每个学生作品的 自动化操作进行视频的录制,在每次点击按钮的实际按钮坐标一定时间后,对当前作品页 面进行截图。
[0041] 上述实际按钮坐标是由按钮位置信息文件中的坐标加上步骤S23中计算出的按 钮点击偏移值。
[0042] S3 :将超级画板和学生作品的数据信息存储至数据库中。
[0043] 具体而言,步骤S3又可以细分为以下步骤,下面做进一步阐述
[0044] S31:读取 graphical_function_out. txt 文件和 sandard_function. txt 文件中的 函数信息,将函数信息存储至数据库的函数表function中
[0045] S32:遍历学生作品目录,如果当前学生作品没有遍历结束,则执行步骤S33 ;否则 执行步骤S37。
[0046] S33:读取当前学生作品的网页文件,从中提取出函数信息和文本信息。将文本信 息作为学生作品的介绍,将函数信息和文本信息作为整个学生作品的内容。
[0047] 提取出网页文件中的超级画板函数信息,文本信息,写入到文件content, txt中。
[0048] S34:对步骤S33中提取出的函数信息和文本信息,先统计词频,再提取关键词。读 取name, txt文件中的作品名。
[0049] S35:对学生作品的视频文件,提取出视频的关键帧以及关键帧在视频中对应的时 间点,计算出视频的总时长。
[0050] S36:将上述步骤得到的,作品名称,作品介绍,作品内容,关键词,词频,学生作品 页面的截图,视频总时长,视频关键帧,视频关键帧时间点等信息存储至数据库中。
[0051] S37:所有学生作品的数据信息全部处理完毕,退出
[0052] S4:根据步骤S3中生成的每个学生作品对应的content, txt文件,进行分词和统 计词频处理,生成正排索引文件index, txt。
[0053] 具体而言,步骤S4又可以细分为以下步骤,下面做进一步阐述:
[0054] S41:遍历学生作品目录,如果当前学生作品没有被处理,则执行步骤S42 ;否则, 执行步骤S48。
[0055] S42:对当前学生作品的content, txt文件,使用分词器NLPIR对content, txt进 行分词处理,得到分词后的文件split, txt
[0056] S43:读取split, txt文件内容,如果文件没有读取完毕,则执行步骤S44 ;否则,执 行步骤S47。
[0057] S44:设置关键词到关键词出现位置数组的映射为wordToCount,对当前读取的一 行内容以空格作为切分,对于切分后的一行内容,每次读取一个关键词。如果该关键词没有 出现在映射wordToCount中,就在wordToCount中加入该关键词的映射,计算该关键词出现 的位置并将该位置加入到该关键词出现的位置数组中;否则,执行步骤S45。
[0058] S45 :该关键词已经出现过,就更新以该关键词为键的关键字位置数组,在关键词 位置数组中追加该关键字目前位置。
[0059] S46:继续读取下一行内容,并转步骤S43
[0060] S47:当前学生作品的content, txt文件全部读取结束,计算出split, txt文件中 该学生作品总关键词个数iTotalWords。遍历wordToCount映射,对每个关键词及其信息按 照如下格式组织成成正排索引:
[0061] 学生作品名称#学生作品文件名#总单词个数#关键词#出现次数#出现位置
[0062] 将该学生作品的所有正排索引信息写入到文件index, txt中,转步骤S41。
[0063] S48:所有学生作品的全部被处理过,退出。
[0064] S5:对步骤S4中得到每个学生作品的正排索引文件index, txt,采用哈希算法和 拉链法来建立倒排索引。
[0065] 具体而言,步骤S5又可以细分为以下步骤,下面做进一步阐述
[0066] S51:初始化哈希表和加密表,建立关键词节点链表数组keyNodeArray
[0067] S52:遍历正排索引文件集合,如果当前正排索引文件没有被处理,则执行步骤 552 ;否则,执行步骤S58。
[0068] S53:读取当前学生作品的正排索引文件,如果文件没有读取完毕,则执行步骤 553 ;否则,执行步骤S57。
[0069] S54:读取当前行内容,对内容进行切分得到:作品名称,作品文档名,总单词个 数,关键词名,关键词出现次数,关键词位置。并将上述信息封装为DocNode结构体。
[0070] 所述文档节点DocNode是:
[0071] 数据形式为:作品名称,作品文档名,作品文档总单词个数,关键词在
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1