深度学习与围棋开放代码
2023-04-16 22:06:09 168.15MB 深度学习 围棋 alphago
1
目前解释得比较清晰的一篇文章,对深度学习,卷积神经网络原理有帮助
1
最近DeepMind团队(google旗下)的AlphaGo(一个围棋的AI)以4:1战胜顶尖人类职业棋手李世石。她到底是怎么下棋的? AlphaGo在面对当前棋局时,她会模拟(推演棋局)N次,选取“
2022-09-22 09:02:00 615KB 技术
1
最初的版本P_human、蒙特卡洛树搜索、P_human和蒙特卡洛树搜索结合、左右互搏,增强学习、价值网络、深度神经网络+蒙特卡洛搜索树+价值网络
2022-09-21 21:05:12 22KB AlphaGo P_human 价值网络 深度神经网络
1
关于谷歌alphago围棋AI引擎的原理解析。一个pdf文件。
2022-08-11 16:46:57 7.65MB Alphago,AI
1
资源为tensorflow-zh源码和AlphaGo围棋程序源代码,供大家学习参考。感兴趣的朋友可以下载。
2022-08-11 15:22:23 29.65MB AlphaGo 人工智能 引擎 智慧
1
alphago与人工智能.ppt该文档详细且完整,值得借鉴下载使用,欢迎下载使用,有问题可以第一时间联系作者~
2022-07-01 13:03:47 5.7MB 文档资料
经典的2018年的Alphago Zero自我对弈50盘,格式为sgf,需要下载MultiGo之类的棋谱查看软件打开
2022-04-25 14:57:01 81KB Alphago Alphago Zero 围棋
1
随着DeepMind公司开发的AlphaGo升级版master战胜围棋世界冠军,其背后应用的强化学习思想受到了广泛关注,也吸引了我想一探究竟为什么强化学习的威力这么大。早在2015年,DeepMind就在youtube上发布了围棋程序master的主要作者David Silver主讲的一套强化学习视频公开课,较为系统、全面地介绍了强化学习的各种思想、实现算法。其一套公开课一共分为十讲,每讲平均为100分钟。其中既包括扎实的理论推导,也有很多有趣的小例子帮助理解,对于理解强化学习来说是一套非常好的教程。我在跟随这套教程学习的过程中一边听讲、一边笔记,最后编写代码实践,终于算是对强化学习的概念终于有了初步的认识,算是入门了吧。为了巩固加深自己的理解,同时也能为后来的学习者提供一些较为系统的中文学习资料,我萌生了把整个公开课系统整理出来的想法。
2022-04-16 14:07:47 2.4MB 算法 学习 深度学习 强化学习
1
Google的deepmind团队发表在nature上有关alphago的论文,包含原有的英文版,我翻译的中文版,以及一个20分钟对alphago工作原理的讲述。
2022-03-01 08:28:24 31.32MB deepmind alphago
1