一种基于超级画板的信息增值方法及装置的制造方法_2

文档序号：9375829阅读：来源：国知局

on_name，取出 contentArray中第二行内容作为函数的作用function_effect。
[0030] S15 :如果第三行是以"参数说明"出现在该行的行首，则遍历function中剩余每行内容，如果当前行的行首不是"例"，则将当前行加入到参数说明数组param_l i st中，如果当前行的行首是"例"，则将从这行开始，一直到结束contentArray中所有行内容，加入到例子数组example_list中；否则执行步骤S16。
[0031] S16 :第三行是以"例"出现在行首，则将当前行到contentArray数组中末尾的所有行内容，加入到例子数组example_list中。
[0032] S17:拼接param_list中的所有内容得到函数参数说明function_param，拼接 example_list中所有内容得到函数例子function_example，再将函数名function_name，函数作用 function_effect,函数参数说明 function_param,函数例子：function_example 拼接在一起得到一个函数完整的内容function，并将function加入到函数数组function_ list中，转步骤S12。
[0033] S18 :图形函数文件全部处理结束，遍历函数数组function_list中所有函数内容，写入文件 graphical_function_out. txt 中，退出。
[0034] S2:对超级画板的学生作品进行自动化点击，获取学生作品的网页文件，页面截图，自动点击视频。
[0035] 具体而言S2又细分为以下步骤，下面做进一步阐述：
[0036] S21:配置超级画板的按钮位置信息，将超级画板学生作品的当前页面保存为网页文件
[0037] S22:根据学生作品对应的网页文件提取学生作品中所有的按钮位置信息
[0038] S23:用AutoScriptWriter获取实际点击学生作品的按钮位置，并与从相对应作品的网页文件提取的按钮位置做比较，计算出按钮点击的偏移值。
[0039] S24:配置录制视频所需的Snagit软件按钮位置信息
[0040] S25 :根据对步骤S24中获得的录制视频所需的按钮位置信息，对每个学生作品的自动化操作进行视频的录制，在每次点击按钮的实际按钮坐标一定时间后，对当前作品页面进行截图。
[0041] 上述实际按钮坐标是由按钮位置信息文件中的坐标加上步骤S23中计算出的按钮点击偏移值。
[0042] S3 :将超级画板和学生作品的数据信息存储至数据库中。
[0043] 具体而言，步骤S3又可以细分为以下步骤，下面做进一步阐述
[0044] S31:读取 graphical_function_out. txt 文件和 sandard_function. txt 文件中的函数信息，将函数信息存储至数据库的函数表function中
[0045] S32:遍历学生作品目录，如果当前学生作品没有遍历结束，则执行步骤S33 ;否则执行步骤S37。
[0046] S33:读取当前学生作品的网页文件，从中提取出函数信息和文本信息。将文本信息作为学生作品的介绍，将函数信息和文本信息作为整个学生作品的内容。
[0047] 提取出网页文件中的超级画板函数信息，文本信息，写入到文件content, txt中。
[0048] S34:对步骤S33中提取出的函数信息和文本信息，先统计词频，再提取关键词。读取name, txt文件中的作品名。
[0049] S35:对学生作品的视频文件，提取出视频的关键帧以及关键帧在视频中对应的时间点，计算出视频的总时长。
[0050] S36:将上述步骤得到的，作品名称，作品介绍，作品内容，关键词，词频，学生作品页面的截图，视频总时长，视频关键帧，视频关键帧时间点等信息存储至数据库中。
[0051] S37:所有学生作品的数据信息全部处理完毕，退出
[0052] S4:根据步骤S3中生成的每个学生作品对应的content, txt文件，进行分词和统计词频处理，生成正排索引文件index, txt。
[0053] 具体而言，步骤S4又可以细分为以下步骤，下面做进一步阐述：
[0054] S41:遍历学生作品目录，如果当前学生作品没有被处理，则执行步骤S42 ;否则，执行步骤S48。
[0055] S42:对当前学生作品的content, txt文件，使用分词器NLPIR对content, txt进行分词处理，得到分词后的文件split, txt
[0056] S43:读取split, txt文件内容，如果文件没有读取完毕，则执行步骤S44 ;否则，执行步骤S47。
[0057] S44:设置关键词到关键词出现位置数组的映射为wordToCount，对当前读取的一行内容以空格作为切分，对于切分后的一行内容，每次读取一个关键词。如果该关键词没有出现在映射wordToCount中，就在wordToCount中加入该关键词的映射，计算该关键词出现的位置并将该位置加入到该关键词出现的位置数组中；否则，执行步骤S45。
[0058] S45 :该关键词已经出现过，就更新以该关键词为键的关键字位置数组，在关键词位置数组中追加该关键字目前位置。
[0059] S46:继续读取下一行内容，并转步骤S43
[0060] S47:当前学生作品的content, txt文件全部读取结束，计算出split, txt文件中该学生作品总关键词个数iTotalWords。遍历wordToCount映射，对每个关键词及其信息按照如下格式组织成成正排索引：
[0061] 学生作品名称#学生作品文件名#总单词个数#关键词#出现次数#出现位置
[0062] 将该学生作品的所有正排索引信息写入到文件index, txt中，转步骤S41。
[0063] S48:所有学生作品的全部被处理过，退出。
[0064] S5:对步骤S4中得到每个学生作品的正排索引文件index, txt，采用哈希算法和拉链法来建立倒排索引。
[0065] 具体而言，步骤S5又可以细分为以下步骤，下面做进一步阐述
[0066] S51:初始化哈希表和加密表，建立关键词节点链表数组keyNodeArray
[0067] S52:遍历正排索引文件集合，如果当前正排索引文件没有被处理，则执行步骤 552 ;否则，执行步骤S58。
[0068] S53:读取当前学生作品的正排索引文件，如果文件没有读取完毕，则执行步骤 553 ;否则，执行步骤S57。
[0069] S54:读取当前行内容，对内容进行切分得到：作品名称，作品文档名，总单词个数，关键词名，关键词出现次数，关键词位置。并将上述信息封装为DocNode结构体。
[0070] 所述文档节点DocNode是：
[0071] 数据形式为：作品名称，作品文档名，作品文档总单词个数，关键词在

完整全部详细技术资料下载

当前第2页1 2 3 4