Go模型服务化: 加载ONNX模型

Go ONNX模型加载教程环境准备安装Go环境(建议version < 1.20, 发现1.20运行有问题, 本实例使用v1.17.13) 安装必要的依赖包： go get github.com/owulveryck/onnx-go go get gorgonia.org/gorgonia 项目结构 ```pl...

Mar 21, 2025 算法模型, Golang相关

DDP做强化学习分布式多机多卡训练加速

前话前文提到了ray.rllib来做分布式训练. 但对整个代码的改造会很复杂, 如果只需要简单的进行分布式多机多卡训练,还可以使用pytorch自带的DDP DDP分布式同步原理在反向传播后，通过高效的AllReduce操作同步所有GPU的梯度均值，确保各GPU使用相同的梯度更新本地模型参数，从而实现分布式训练的参数一致性. 以下为DDP训练的数据拆分示意图: 代码修改关键点...

Mar 11, 2025 算法模型, Python相关

使用Ray RLlib构建自定义强化学习环境

强化学习是机器学习中一个令人兴奋的领域，它允许AI代理通过与环境交互来学习最优策略。本文将介绍如何使用Ray RLlib框架创建自定义强化学习环境并进行训练。无论您是强化学习新手还是寻求高性能分布式训练的专家，这篇指南都能帮您快速上手。准备工作在开始前，我们需要安装必要的依赖库： pip install "ray[rllib]" gym torch 注意：如果使用mac...

Mar 6, 2025 算法模型, 开源项目学习

RL 使用Cpp动态库加速环境模拟

训练和推理强化学习时, 有些场景下的大量计算都会在环境模拟上, 这时训练的大部份时间占用会在非神经网络更新上, 此时可以通过使用多进程并发加速, 或者直接用cpp进行重构关键部分

Mar 5, 2025 Python相关, 算法模型

RL训练知识点补齐

Gym 强化学习训练在我们学习强化学习（Reinforcement Learning，简称 RL）时，如何让智能体和环境高效且可重复地交互一直是一个核心问题。OpenAI 提供的 Gym 库就是为了解决这个问题而生。它以简洁明了的 API 和丰富多样的测试场景，为我们搭建了一个标准化的平台。很多技术博客和相关资料都指出，Gym 的统一接口极大地方便了我们在切换环境、测试算法时，不必反复编...

Feb 17, 2025 算法模型

2024年末总结

博客，感动常在

Jan 26, 2025 思考

仿真系统平台

参考文档相关博客博客 - 什么是模拟离散事件开源项目 https://github.com/matsim-org/matsim-libs https://github.com/eclipse-sumo/sumo https://simpy.readthedocs.io/en/latest/ https://github.com/NetLogo/NetLogo?tab=re...

Jan 14, 2025 开源项目学习

游戏服务器中消息是如何传递的

消息协议与传输【msg_id篇】消息流程图解消息定义与数据类型消息定义消息定义+消息结构定义，能让底层传输的数据仅仅只有数据，而没有数据类型、名字、分类。两边通过消息id来区分该消息的结构，一边压缩，一边解析。极大的减少了传输的数据量。 const常量表定义一些在之后的消息定义中会使用到的常量。比如GS的最大数量、密码的长度、角色名的...

Oct 31, 2024 开源项目学习

游戏服务器框架源码学习

服务器架构 GS流程图定义 FBServer_Base 是大部分服务器的基类，代码复用，创建了一些基本的功能。链接的操作见下文IOCP的理解 win32下使用的IOCP，而linux下使用的EPOLL。两者分别都包装好了函数供调用。 Create() 创建。基本socket创建初始化、epoll创建初始化、端口重用、linger等待发送完毕、...