基因芯片数据搜索引擎的制作方法

文档序号:6441556阅读:288来源:国知局
专利名称:基因芯片数据搜索引擎的制作方法
技术领域
本发明涉及一种基因芯片数据搜索引擎,尤其是能整合公开基因芯片数据库数据的搜索 引擎。
背景技术
目前,公知的基因芯片数据搜索引擎是附属于不同的基因芯片数据库的。各个不同的基 因芯片数据库都有着自己的搜索引擎。各个基因芯片数据搜索引擎只能搜索单个数据库的条 目,不能搜索其他数据库的条目,给用户造成不便。发明'内容为了克服现有的基因芯片数据搜索引擎不能搜索其他数据库的不足,本发明提供一种基 因芯片数据搜索引擎,该基因芯片数据搜索引擎能整合不同的公丌基因芯片数据库的数据。本发明解决其技术问题所采用的技术方案是建立统一的搜索界面,以物种名称、基因 名称、试验者、试验介绍、试验采用的平台为关键词索引,建立不同的基因芯片数据库间的 统一的搜索方式。本基因芯片数据搜索引擎通过预先访问被搜索的基因芯片数据库,为不同 的基因芯片数据以上述的关键词建立索引。当用户使用本搜索引擎时,需输入上述的关键词 中的一项或多项,引擎会将所有数据库中的符合上述关键词的数据条目显示给用户。本发明的有益效果是,整合不同的公开基因芯片数据库的数据,通过统一的界面和关键 词访问数据库中的条目。
具体实施方式
在实施例子1中,用户通过输入基因芯片试验的物种名,基因名,以及试验条件,可得 到所有数据库中符合搜索关键词的基因芯片的实验数据。 具体为7. 预先访问网络il的各个基因芯片数据库,建立数据索引,用户通过输入关键字搜索数据库 中的数据。8. 采集通用数据库中的基因芯片平台的数据,建立各基因芯片平台的基因序列的各种通用名的列表.9. 搜索网上已有的xls, txt文件,检查其中第一行或第一列是否和已有基因芯片平台的基因序列匹配.如果匹配,则作为基因芯片数据.10. 对匹配的xls, txt文件,检索所有和此文件相关的网页,从这些网页中提取基因芯片的数据。11. 采集基因芯片平台数据的来源网页、平台编号、技术类型、试验生物种类、制造商信 息、平台的基因序列。12. 根据4所述的基因芯片数据搜索引擎的基因芯片数据,采集基因芯片数据的来源网 页、芯片数据编号、平台类型、实验目的、实验方法,实验者信息。结果各个基因芯片的实验数据以从上至下的方式排列。各个数据都有超连接指向数据来源数据库中的有关该数据的内容。
权利要求
1. 一种基因芯片数据搜索引擎,通过确定的关键字搜索基因芯片数据库中的数据,其特征是预先访问网络上的各个基因芯片数据库,建立数据索引,用户通过输入关键字搜索数据库中的数据。
2. 根据权利要求1所述的基因芯片数据搜索引擎,其特征是采集通用数据库中的基因芯片 平台的数据,建立各基因芯片平台的基因序列的各种通用名的列表.
3. 根据权利要求1所述的基因芯片数据搜索引擎,其特征是搜索网上已有的xls,txt文件,检查其中第一行或第一列是否和已有基因芯片平台的基因序列匹配.如果匹配,则作为基因 芯片数据.
4. 根据权利要求1所述的基因芯片数据搜索引擎,其特征是对匹配的xls,txt文件,检索 所有和此文件相关的网页,从这些网页中提取基因芯片的数据。
5. 根据权利要求2所述的基因芯片数据搜索引擎的平台数据采集,其特征是采集基因芯片 平台数据的来源网页、平台编号、技术类型、试验生物种类、制造商信息、平台的基因序 列。
6. 根据权利要求4所述的基因芯片数据搜索引擎的基因芯片数据采集,其特征是采集基因 芯片数据的来源网页、芯片数据编号、平台类型、实验目的、实验方法,实验者信息。
全文摘要
一种整合公开基因芯片数据库数据的搜索引擎。通过各个不同的基因芯片数据库中的同义的关键词整合不同的数据库的内容。搜索引擎预先访问来源基因芯片数据库建立索引。用户通过统一的搜索界面搜索不同的基因芯片数据库的内容。
文档编号G06F17/30GK101266601SQ200710038048
公开日2008年9月17日 申请日期2007年3月14日 优先权日2007年3月14日
发明者沈诗昊 申请人:沈诗昊
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1