技术特征:
技术总结
本发明公开了基于人工智能的资源组合优化方法、装置及存储介质,其中方法包括:训练得到基于强化学习思想的策略模型;当需要生成资源组合时,分别获取各候选资源的资源评分;根据各候选资源的资源评分以及所述策略模型,从各候选资源中选出M个候选资源组成所述资源组合,M为大于一的正整数。应用本发明所述方案,能够提升资源组合的收益等。
技术研发人员:吴泽衡;王凡;方晓敏;何径舟;周古月;温佩怡
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2017.03.29
技术公布日:2017.09.15