DeeCamp人工智能训练营由教育部、创新工场、北京大学联合主办,今年有超过1万人次报名,最终600名学生入选。4周的时间内,学员接受了顶级 AI 大牛导师的「学术+产业」课程培训,共计完成了 50 个 AI 实践课题。
“挑战快手小游戏AI”获最佳团队奖
4周时间,学员们完成了由 22 家企业发起的 50 个 AI 相关课题,接受了总计 115 位来自企业的技术负责人和工程师的课题辅导。实践课题全部基于真实世界场景精心设计,力求贴近产业一线需求、提高学生动手能力。其中4个课题为快手发起,包括挑战快手小游戏AI、端上AI助你走进名画、多模态AI音乐生成、质量感知的媒体传输优化。结营仪式当天,“挑战快手小游戏AI”获得最佳团队奖,“端上AI助你走进名画”获得最佳技术奖。
斗地主要解决的是不完美信息下博弈问题,是要在无法看见其他玩家手牌的前提下,对游戏中的14种合法牌型、13551种合法出牌、10的30次方的状态空间和10的85次方的游戏树进行全面考虑,整体难度较高。从技术角度看,该项目将游戏领域内的领先核心算法应用到斗地主中;其次,结合RankSVM思路,设计了新的斗地主监督学习模型;小组还设计了多个强化学习模型,使用强化学习进行多模型融合。
项目团队没有一味追求胜率,通过调试做到一个和人类玩家相似的胜率结果,更加拟人化。当人类与人类对战时,人类作为地主的胜率为52.4%、作为农民的胜率为47.8%;而该项目小组研发的AI在与人类进行对战时,AI作为地主的胜率为58.6%、作为农民的胜率为41%。
快手导师:学员们的探索性方法带来惊喜
快手游戏联合实验室提供了此次“挑战快手小游戏AI”的课题,并指导学员完成此次实践课题。该课题给学员提供了一个设计游戏AI从0到1的完整历程,学员能体验到跟自己设计的AI共同成长的默契。快手游戏联合实验室,致力于利用人工智能技术全面赋能游戏,使用户获得更佳的游戏体验,同时进行前沿的人工智能技术研究及应用。
“不完美信息博弈是非常有挑战的AI难题,学员们产出的探索性结果和方法也给我们带来了惊喜,我们会加大投入探索不完美信息博弈的游戏”。 快手游戏联合实验室刘霁介绍说,不完美信息博弈是非常挑战的AI难题,斗地主AI的难题在于它是一个3人游戏;两人组队合作跟另外一个人博弈,如何组队,以及队内信息又是不共享的,这使得斗地主的博弈问题更加复杂;既需要算法的精巧设计,又需要高效得利用算力。
快手导师迅速帮助学员们抓住课题重点,从叫牌阶段策略,出牌过程策略,预测对方牌型等侧重点进行指导。利用游戏AI的经验,初步提供了不同的AI模型在游戏中的基本能力和实现效果,强调了非全信息下的博弈难度,便于学员们进行理解和选择,学员在2天的时间内快速确定了最终的开发框架。
因为斗地主是不完美信息博弈没有成功的经验可以借鉴,快手导师指导团队制定一个套多模型融合的策略,把基于规则的AI,基于强化学习的AI,基于蒙特卡洛搜索的AI(Alphago的思路),基于CFR的AI(德州扑克的思路),以及基于模仿学习的AI通过一个整体的强化学习AI融合一起。时间紧任务又有挑战的情况下,快手导师提供了对每一种AI设计方案方向性的指导并且参与细节的讨论,最终学员圆满完成课题。
快手游戏联合实验室于明泽介绍说,这次的课题在学术上存在挑战,有助于推动产学研结合。快手游戏联合实验室提供了丰富的AI应用场景,比如验证游戏核心玩法、文字音频图形的AI处理、数据分析、个性化决策、自动推荐等。游戏环境是全数字环境,便于训练数据的采集,利于技术的落地。此外,游戏本身是强商业化的方向,更容易创造出兼具学术意义和商业价值的产品。
来源:中华网
(责任编辑:雪霁)
上一篇:唱吧麦颂助力夜经济发展 全国多城联动打造夜生活新地标
【免责声明:本网有部分文章是通讯员转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便我们及时对相关文章进行删除或其他方式处理 。对于不当转载或引用本网站内容而引起的民事纷争、行政处理或其他损失,本网站不承担责任。谢谢监督!】