好项目分享
来看看又收集到什么有趣的项目!不定期更新!
来看看又收集到什么有趣的项目!不定期更新!
Go ONNX模型加载教程 环境准备 安装Go环境(建议version < 1.20, 发现1.20运行有问题, 本实例使用v1.17.13) 安装必要的依赖包: go get github.com/owulveryck/onnx-go go get gorgonia.org/gorgonia 项目结构 proje...
前话 前文提到了ray.rllib来做分布式训练. 但对整个代码的改造会很复杂, 如果只需要简单的进行分布式多机多卡训练,还可以使用pytorch自带的DDP DDP分布式同步原理 在反向传播后,通过高效的AllReduce操作同步所有GPU的梯度均值,确保各GPU使用相同的梯度更新本地模型参数,从而实现分布式训练的参数一致性. 以下为DDP训练的数据拆分示意图: 代码修改关键点...
强化学习是机器学习中一个令人兴奋的领域,它允许AI代理通过与环境交互来学习最优策略。本文将介绍如何使用Ray RLlib框架创建自定义强化学习环境并进行训练。无论您是强化学习新手还是寻求高性能分布式训练的专家,这篇指南都能帮您快速上手。 准备工作 在开始前,我们需要安装必要的依赖库: pip install "ray[rllib]" gym torch 注意:如果使用mac...
训练和推理强化学习时, 有些场景下的大量计算都会在环境模拟上, 这时训练的大部份时间占用会在非神经网络更新上, 此时可以通过使用多进程并发加速, 或者直接用cpp进行重构关键部分
Gym 强化学习训练 在我们学习强化学习(Reinforcement Learning,简称 RL)时,如何让智能体和环境高效且可重复地交互一直是一个核心问题。OpenAI 提供的 Gym 库就是为了解决这个问题而生。它以简洁明了的 API 和丰富多样的测试场景,为我们搭建了一个标准化的平台。很多技术博客和相关资料都指出,Gym 的统一接口极大地方便了我们在切换环境、测试算法时,不必反复编...
博客,感动常在
参考文档 相关博客 博客 - 什么是模拟离散事件 开源项目 https://github.com/matsim-org/matsim-libs https://github.com/eclipse-sumo/sumo https://simpy.readthedocs.io/en/latest/ https://github.com/NetLogo/NetLogo?tab=re...
记录一下 multiprocess的多种使用方法
从部署到使用的实操记录