电影《头号玩家》里面,写出伟大游戏“绿洲”的作者,有一句很浪漫的台词:“谢谢你来玩我的游戏。”
在人工智能领域,强化学习无疑就是那个难度最高的游戏之一!强化学习在应用落地和理论之间存在巨大的偏差,所以学习难度非常大。
百度飞桨的《深度学习7日打卡营—世界冠军带你从零实践强化学习》,由百度NeurIPS全球顶会冠军团队亲自授课,已经带领了三千多位同学走进强化学习领域的奇妙世界!
正如科科老师引用的那句心理学名言:“每个人都是过去经验的总和,过去的经验,造就现在的你。”
学习期间,很多同学记录下自己的学习经验,从对强化学习一知半解,到独立做出了属于自己的项目,实现了个人能力质的飞跃!
一起来看看同学们的项目成就和学习心得吧!
学员项目成果大赏
经过一周时间的直播学习,配合5次实战打卡,同学们对强化学习从理论到实践,有了一个系统的认知,课程末尾更是利用了学到的知识,发散奇思妙想,复现了基于PARL的各种有趣的强化学习项目。
强化学习之自动炒股
——刘炫
“牛市”来了!
量化交易的风也很大,现在,刘炫同学的项目就是尝试利用强化学习来进行自动炒股。感觉超厉害der~
该项目使用股票StockTradingEnv环境,项目的环境、效果、说明、代码都很完整。同时,项目训练过程非常详细,这位同学还非常细心的进行了bug分析。
项目地址:
https://gitee.com/Arrowarcher/paddlex_gui/tree/fb/reinforcement_learning/stock/stock4
Parl优化八木天线设计参数
——倪侃
本项目利用百度强化学习框架对UHF段八木天线进行了参数优化,并利用HFSS有限元仿真软件对天线模型进行了仿真对比。
八木天线本身可解析计算,本项目工作主要是探索了强化学习用于天线计算中的新方法,可迁移到其他更复杂的天线设计中。经强化学习优化后,5个天线参数从初始乱序状态变为接近理论计算的状态,天线方向性从0.98上升到14.29。
最终项目呈现效果不错,完整的项目过程,该同学还自己封装环境,咱们班同学真的卧虎藏龙呀!
项目地址:
https://github.com/nikankind/YagiAntennaOpt-using-Parl
从跌倒到奔跑的机器忍者
——金韵
就像现在你看到二足机器人最后跑步跑得那么溜,但它也是经过千百次的训练和学习才走到今天,学习的过程是非常辛苦的。
训练时,让它在服务器的角落里独自锻炼,现在把中间模型一个个拿出来看,还是能体会学习的过程真的很艰辛!
为了生存,不断跌倒不断爬起;
有时小心翼翼向前探步;
还是可能向后仰倒;
有时小心谨慎地蹲着找到了苟安的平衡;
有时扎起稳健马步虽无法取得前进的成绩至少不至于跌倒;
有时只用强健一腿前进,拖着另一腿仅作平衡,不小心碰到地上一个疙瘩,轰然倒下!
看着有点心酸,仔细想想,和真实的人生百态确有几份相似!跌倒了也要爬起来,一定会跑起来,阳光总在风雨下!
项目地址:
https://aistudio.baidu.com/aistudio/projectdetail/599238
学员心路历程分享
知识积累和自我认知的见证
——黄子豪
除了鼓励,在这里,也有批评与建议、反省,这些才是让人真正成长的核心。
黄子豪同学入门强化学习不久,就已经从强化学习基本概念两部分三要素到Q-learning和Sarsa,再到DQN,再到亲手实践一个大项目,他的进步有目共睹。
获得了这些成绩的同时,他仍在反思,在打卡营中,他调参和运行代码半个小时就结束了,能拖就拖,以至于有两次作业没有取得良好的成绩。
最后他说,“结束那场自我陶醉式的自省,回到原点,重新开始,一切晚了却又不晚。”
这样真诚的自我剖析,相信经过这段时间,子豪同学一定会取得更大的成就!
炼丹路上不可多得的指点迷津
——王洪江
王同学是百度的老朋友了,继参加2020年百度人工智能第十期深度学习培训结束之后,他就一直盼望着能有新一期的学习机会。
这不就来了嘛!在报名之后,他就开始了自己的炼丹之路!
王同学对强化学习了解不深,学习之前,他一直很担心,毕竟强化学习都能打败世界围棋冠军,这得有多复杂才行?
七天的学习之后,王同学开始想更深入去了解和学习强化学习了。他说,“这都是百度飞桨深度学习学院各位老师的功劳,特别是科科老师,真是没想到,这么年轻的科科老师,居然能把在线课程讲得那么清晰易懂,实在是太厉害了。希望以后还能再听到她的更高阶层的讲课内容!”
在5星项目中成长
——吉祥
如意_鸡蛋同学从百度深度学习集训营开始,一直在不停的学习,用他的话说,“着了魔一样没日没夜的搞了一个多月了”。虽然很累,但是他的很多项目也都被选入精品项目。
这位同学这次在项目,直接挑战5星环境,相当有勇气!该项目的环境为智能交通灯。他做了两个1星环境和1个2星环境,现在把5星环境搭建起来了。
取得这么多成绩的他说,“希望所有同学们都能通过在百度AIStudio的课程中都有所收获,为发展paddle贡献出自己的一份力量,让我们paddle框架发扬光大!!”
留学生暑期的成就感
—— 唐佳睿
由于新冠疫情,唐佳睿是一名滞留在美国的留学生。暑假已经开始半个月,无所事事很多天后,朋友给他推荐了百度的强化学习7日训练营课程。
唐同学过去一年主修的是机器学习,对于强化学习知之甚少,儿这门课旨在帮助初学者快速入门,正好满足了他的需求。
从第一天的懵懵懂懂,内容相对简单基础,到第四天学习难度开始上升,唐佳睿同学的成长也在一点点的积累。尤其是大作业“飞行器悬浮控制任务”非常有意思,也有一定难度。
他说:“看着自己的飞行器一点一点调整着平衡飞起来很有成就感。”
PARL官方环境展示图
7天的学习历程很短,也很充实。每个人学习目的都不同,但我们看到了大家在幽深无人处默默努力、学习,重新出发。这一路是如此的不易,要花费巨大的精力,学习的过程是不足外人道的艰辛,正是如此,结出的果实才如此的甜美。
最后,应大家的呼声,我们已经将强化学习课程精华版同步到B站平台中,欢迎弹幕吐槽、一键三连~
扫码加入课程,即可观看完整课节内容,动手实践案例和代码,遇到作业问题还可以到讨论区寻找答案~
同学们,“道阻且长,我心飞翔”,我们继续努力!