数学与应用数学专业
该课题主要解决的是强化学习中,策略之间的耦合性以及如何高效的利用经验数据。探索与利用是强化学习中比较经典的问题,我们通过对经验的分类去优化训练的过程,在测试中效果比较明显。
本项目基于 YOLOv11 架构在 RK3588 开发板构建了一个用于目标检测的融合模型,模型集成了 vHeat 和 MegaSaM 的核心模块,并实现了实时推理。
四川省一等奖 | 2024年10月
本人专业为数学与应用数学,大一及大二上主要在做一些数学方面的学习,大二下开始尝试计算机方面科研,目前有一定成果还在写作。期间有过一些网络结构方面的尝试,用frp进行隧道连接,并进行串流服务。个人比较喜欢折腾一些东西,代码能力尚可,此前对于RL的一些研究有一定的科研能力,同时RL也在广泛用于NLP的模型中,例如GRPO的模型主要使用RL的方法进行训练,并取得很好的效果。