一种建筑工程多模态双语平行语料库的构建方法与流程

文档序号:18257984发布日期:2019-07-24 10:26阅读:来源:国知局
技术总结
本发明属于数据处理技术领域,具体涉及一种建筑工程多模态双语平行语料库的构建方法;语料筛选、语料提取、校对、语料切分、对齐、去噪、得到平行语料库、语料库更新和扩容六个步骤;为建筑词汇提供了丰富的对比样本,检索出的词汇或句法的含义都是与建筑相关的,排除了一些无用的含义;为使用者提供数量巨大的双语对译样本,切分精细,精准度高,检索出的词汇或句法含义都是建筑相关的,排除了一些无用的含义,为使用者提供了数量巨大的建筑类双语对译样本。

技术研发人员:张晓红;王薇;张聪颖;丁玫;高金岭;鲍玉平
受保护的技术使用者:山东建筑大学
技术研发日:2019.04.22
技术公布日:2019.07.23

当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1