一种用于麻将的智能决策模型及方法与流程

文档序号：17009789发布日期：2019-03-02 02:11阅读：1281来源：国知局

本发明属于麻将智能决策技术领域，具体涉及一种用于麻将的智能决策模型及方法。

背景技术：

麻将牌的特征提取是依据麻将手牌和副露等信息，对麻将牌的有用信息进行提取，用于后期的麻将智能决策模型使用，特征提取的好坏将直接影响麻将智能决策的性能，所以提取的方法至关重要。

在国内，对于智能麻将鲜有人研究，一般都只停留在表面的规则匹配，例如某些游戏中的推荐出牌，它们都只是针对麻将玩法的一些简单规则匹配，然后给出一个较合适的决策，该方法单一且用到决策时精度不高。在国外，日本东京大学naokimizukamiandyoshimasatsuruoka团队在2006～2016年，基于日本麻将规则，成功开发了日麻ai“爆打”，应用在日本天凤麻将平台。该团队使用的是传统的机器学习算法，其特征提取的方式，大量基于人类对于麻将规则的认知进行特征提取，这种特征提取方法复杂且高度依赖牌手经验，仅单人麻将ai特征数就高达96000多种，如表一所示，经过分析，该方法是对手牌的所有组合情况进行遍历查找，例如最后连续n种牌持有个数的组合(n＝2～6)，仅该项就有34854种，提取的特征数量巨大，有用特征极其稀疏，该方法应用到机器学习中时工作量大，而且难以移植到其他麻将玩法中。

技术实现要素：

本发明的目的在于提供一种用于麻将的智能决策模型及方法，以解决上述背景技术中提出的国内麻将智能决策精度不高，而日本开发的特征提取方式过于复杂，有用特征稀疏，通用性差，难于移植的问题。

为实现上述目的，本发明提供如下技术方案：一种用于麻将的智能决策模型，包括有特征提取模块，所述特征提取模块包括有向听数、各种手牌计数、搭子计数、暗顺子计数、副露数、副露中顺子、宝牌、刻子、杠及烂牌的特征数。

优选的，提取向听数、各种手牌计数、搭子计数、暗顺子计数、副露数、副露中顺子、宝牌、刻子、杠及烂牌的特征数均来源于上饶麻将。

优选的，所述向听数选取胡牌牌型的数量，其特征数为四个。

优选的，所述各种手牌计数包括有万、条、筒各九种，再加上风牌和箭牌七种，统计它们的数量共计三十四个特征；

再统计万、条、筒、风牌和箭牌的总个数，共五个特征；

所述各种手牌计数的总特征量为三十九个。

优选的，所述搭子计数包括有相邻两张牌的计数、间隔一张牌的两张牌计数；

所述相邻两张牌的计数为二十四种，所述间隔一张牌的两张牌计数为二十一种，统计搭子计数的特征数为四十五个。

优选的，暗顺子为自己手牌中已经有的顺子，所述暗顺子计数的特征数为二十一个；

副露数的特征数为一个；

副露中顺子的特征数为二十一个。

优选的，宝牌包括有宝牌种类、宝牌数量、飞宝数量、本手是否飞宝，宝牌的特征数为四个。

优选的，刻子的特征数为三十四个；

杠牌的特征数为三十四个。

优选的，烂牌为间隔大于等于两张的牌，其特征数为九十三个。

一种麻将智能决策的方法，采用所述的智能决策模型，包括如下步骤：

步骤1：输入手牌和宝牌的信息至智能决策模型；

步骤2：智能决策模型判断手牌和宝牌的信息是否合理，若是，进行步骤3；否则，返回步骤1；

步骤3：智能决策模型判断是否是自己的回合，若是，进行步骤4；否则，进行步骤10；

步骤4：输入摸到的牌面信息至智能决策模型；

步骤5：智能决策模型进行决策；

步骤6：判断智能决策模型决策出的牌是否在手牌中，若是，进行步骤7；否则，跳至步骤9；

步骤7：打出智能决策模型决策出的牌，并进行步骤8；

步骤8：智能决策模型判断是否胡牌或流局，若是，跳至步骤13；否则，返回步骤5；

步骤9：进行手牌合理化处理，对智能决策模型的决策进行合理化验证，并进行步骤8；

步骤10：智能决策模型进行吃碰杠决策，再进行步骤11；

步骤11：牌手决定是否执行吃碰杠的操作，若是，进行步骤12；否则，跳至步骤3；

步骤12：更新手牌后，返回至步骤3；

步骤13：结束。

有益效果：

(1)对于简单规则匹配的特征提取方法，本发明智能决策模型提出的特征提取方法所得到的特征数更加全面具体，应用在后期的模型上精度更高；且相对日本东京大学提出的特征提取方法，本发明普适性更好，更加通用，且便于移植，商用性更高。

(2)本发明的一种用于麻将的智能决策模型，是对麻将游戏规则的高度抽象，综合决策模型特征数仅296个，提取的特征基本是对手牌重要信息有无进行判断，例如大多数麻将都有的平胡中面子和搭子信息，烂牌信息等，特征数少且精。如应用在上饶麻将中，只需加入其特殊玩法的4个特征数。如果将其迁移到其他麻将玩法中时，修改极少数的特征就可以很好的适应新的数据集。

(3)本发明智能决策模型的特征提取方法流程简单高效，对牌手经验的依赖性不高。日本东京大学的特征提取方法高度依赖牌手的经验，对数据集的要求特别高，且特征提取过程中，需要手动标记部分数据，提取过程复杂且工作量巨大，本特征提取方案可以很方便的应用到大数据集上，在收集原始牌局数据后，用编写好特征提取的程序就可以方便快捷的提取需要的特征，在普通配置的台式机上，对几十万牌局处理只需要数小时就可以完成全部的提取工作。

(4)本发明智能决策模型的特征提取方法包含时序信息，例如弃牌表、宝牌和副露信息的提取等，可以最大化还原牌局信息，提取的特征应用到机器深度学习模型时，更好地模拟人的打牌行为，使得模型学到的信息更多、更全面。而日本东京大学提出的特征提取方法，仅仅只是对手牌信息的特征提取，并且提取的特征相当于对手牌信息排列组合有无的判断，这种提取方法不灵活，看似特征很多，其实包含了大量无用的冗余信息，应用到模型中效果也不是很好。

附图说明

图1为本发明麻将智能决策方法的流程图。

图2为本发明麻将智能决策ai训练示意图。

图3为本发明麻将智能决策ai测试示意图。

具体实施方式

表一日麻ai单人麻将特征数

表二本发明麻将ai智能决策模型特征数

下面结合附图和表格进一步说明本发明的实施例。

如图1-3所示，一种用于麻将的智能决策模型，包括有特征提取模块，所述特征提取模块包括有向听数、各种手牌计数、搭子计数、暗顺子计数、副露数、副露中顺子、宝牌、刻子、杠及烂牌的特征数。

提取向听数、各种手牌计数、搭子计数、暗顺子计数、副露数、副露中顺子、宝牌、刻子、杠及烂牌的特征数均来源于上饶麻将。

所述向听数选取胡牌牌型(平胡、七对、十三烂、九幺)的数量，其特征数为四个。

所述各种手牌计数包括有万、条、筒各九种，再加上风牌和箭牌七种，统计它们的数量共计三十四个特征；

再统计万、条、筒、风牌和箭牌的总个数，共五个特征；

所述各种手牌计数的总特征量为三十九个。

所述搭子计数包括有相邻两张牌的计数、间隔一张牌的两张牌计数；

所述相邻两张牌的计数为二十四种，所述间隔一张牌的两张牌计数为二十一种，统计搭子计数的特征数为四十五个。

暗顺子为自己手牌中已经有的顺子，所述暗顺子计数的特征数为二十一个；

副露数的特征数为一个；

副露中顺子的特征数为二十一个。

宝牌包括有宝牌种类、宝牌数量、飞宝数量、本手是否飞宝，宝牌的特征数为四个。

刻子的特征数为三十四个；

杠牌的特征数为三十四个。

烂牌为间隔大于等于两张的牌，其特征数为九十三个。

一种麻将智能决策的方法，采用所述的智能决策模型，包括如下步骤：

步骤1：输入手牌和宝牌的信息至智能决策模型；

步骤2：智能决策模型判断手牌和宝牌的信息是否合理，若是，进行步骤3；否则，返回步骤1；

步骤3：智能决策模型判断是否是自己的回合，若是，进行步骤4；否则，进行步骤10；

步骤4：输入摸到的牌面信息至智能决策模型；

步骤5：智能决策模型进行决策；

步骤6：判断智能决策模型决策出的牌是否在手牌中，若是，进行步骤7；否则，跳至步骤9；

步骤7：打出智能决策模型决策出的牌，并进行步骤8；

步骤8：智能决策模型判断是否胡牌或流局，若是，跳至步骤13；否则，返回步骤5；

步骤9：进行手牌合理化处理，对智能决策模型的决策进行合理化验证，并进行步骤8；

步骤10：智能决策模型进行吃碰杠决策，再进行步骤11；

步骤11：牌手决定是否执行吃碰杠的操作，若是，进行步骤12；否则，跳至步骤3；

步骤12：更新手牌后，返回至步骤3；

步骤13：结束。

对于简单规则匹配的特征提取方法，本发明智能决策模型提出的特征提取方法所得到的特征数更加全面具体，应用在后期的模型上精度更高；且相对日本东京大学提出的特征提取方法，本发明普适性更好，更加通用，且便于移植，商用性更高。

本发明智能决策模型的特征提取方法适应性好，特征表的可重用性高。相比日本东京大学提出的日麻特征提取方法，相当于对日麻手牌信息排列组合进行有无判断，且高度依赖打牌规则。例如表一中各色一九牌的有无，这个特征量就高达2^9＝512种，日麻对一九牌非常敏感，许多番型都与一九牌有关，而其他麻将不一定会看这中这种特征，在迁移到其他麻将时，这种特征可能就会被剔除，所以日本东京大学提出的这种特征提取方法存在很多局限性。而本发明是对麻将游戏规则的高度抽象，综合决策模型特征数仅296个，提取的特征基本是对手牌重要信息有无进行判断，例如大多数麻将都有的平胡中面子和搭子信息，烂牌信息等，特征数少且精。如应用在上饶麻将中，只需加入其特殊玩法的4个特征数。如果将其迁移到其他麻将玩法中时，修改极少数的特征就可以很好的适应新的数据集。

本发明智能决策模型的特征提取方法流程简单高效，对牌手经验的依赖性不高。日本东京大学的特征提取方法高度依赖牌手的经验，对数据集的要求特别高，且特征提取过程中，需要手动标记部分数据，提取过程复杂且工作量巨大，本特征提取方案可以很方便的应用到大数据集上，在收集原始牌局数据后，用编写好特征提取的程序就可以方便快捷的提取需要的特征，在普通配置的台式机上，对几十万牌局处理只需要数小时就可以完成全部的提取工作。

本发明智能决策模型的特征提取方法包含时序信息，例如弃牌表、宝牌和副露信息的提取等，可以最大化还原牌局信息，提取的特征应用到机器深度学习模型时，更好地模拟人的打牌行为，使得模型学到的信息更多、更全面。而日本东京大学提出的特征提取方法，仅仅只是对手牌信息的特征提取，并且提取的特征相当于对手牌信息排列组合有无的判断，这种提取方法不灵活，看似特征很多，其实包含了大量无用的冗余信息，应用到模型中效果也不是很好。

以上对本发明的具体实施例进行了详细描述，但其只是作为范例，本发明并不限制于以上描述具体实施例。对于本领域技术人员而言，任何对本发明进行的等同修改和替代也都在本发明的范畴之中。因此，在不脱离本发明的精神和范围下所作的均等变换和修改，都涵盖在本发明范围内。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：李一华;李一飞;闫天伟;任航;黄伟;徐子晨;王命延
技术所有人：中至数据集团股份有限公司
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。