ppo 找出口模型 训练 笔记 26/1/13

cnn模型大小我给他控制在训练耗时30s左右(4060ti)

动作空间6个:4个移动2个转头,因为一开始都要跑一遍,动作太多需要跑更多步才能吃到正反馈

我现在设置是60步一episode,5 episode训练一次

转头70度左右,前后移动控制在4s,时间模型可以调,给了模型位移程度的控制,时间设置这么长也是为了能像无头苍蝇一样先把环境用脚完全跑一遍

第3个episode就已经跑出来正反馈了(距离门很近)

这个模型我没想到的是,它训练出来,是用屁股走路的,后退当前进走到门旁边

奖励是门的面积/10000,门越大奖励越高,面积大于30w就给大奖励

早上用小碎步是能收敛的这种奖励,越训练得分越多,早上哪个架构大一点训练2分钟

yolo我还得重新训练一下近距离的情况,遇到了贴着门太大yolo没识别出来的情况

可能就是因为这样模型收敛不了

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1155931.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【基于机器学习的租房信息分析系统】Python+mysql+Django,(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

【基于机器学习的租房信息分析系统】PythonmysqlDjango,(设计源文件万字报告讲解)(支持资料、图片参考_相关定制) 项目核心功能: 1.登陆登出功能, 2.首页总览分析, 3.房源管理, 4.价格预测&…

教你如何认识数控车床代码、坐标、结构编程、加工工艺

学习识图:学会识别数控车床图纸表达方式,认识图纸标注形式,基本标注、公差标注、形位公差标注、表面粗糙度标注。学习坐标:根据图纸标注、书写出编程所需坐标,加强对图纸的认识。学习辅助代码:M00、M01、M0…

基于python机器学习的电商商品分析与预测(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

基于python机器学习的电商商品分析与预测 (python,jupyter notebook 数据分析,多种机器学习,数据可视化 电子资料)本研究以9935条电商超市订单为样本

【毕业设计】基于python_CNN卷积神经网络深度学习识别花卉是否绽放

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

【计算机毕业设计案例】基于python_CNN卷积神经网络对猫狗识别基于python_CNN深度学习卷积神经网络对猫狗识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

国产力量崛起:2026十大本土HR软件厂商深度盘点

在信息技术应用创新和供应链安全的国家战略指引下,中国人力资源软件市场正经历一场深刻的国产化替代浪潮。曾经由SAP、Oracle等国际巨头主导的HR系统市场,如今已涌现出一批技术领先、服务扎实的国产优秀厂商。这些本土企业不仅深谙中国企业管理特色&…

【课程设计/毕业设计】基于python_CNN深度学习卷积神经网络对猫狗识别基于深度学习卷积神经网络对猫狗识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

基于决策树算法的感冒预测(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

基于决策树算法的感冒预测(设计源文件万字报告讲解)(支持资料、图片参考_相关定制) 来源于公开数据集(梅奥),有完整的数据处理、特征筛选、方法介绍、决策树模型构建流程,测试集AUROC值达94.79%。

多肽定制合成丨Melgain 一种十肽Decapeptide

Melgain是一种外用多肽,主要用于治疗白癜风,这是一种以皮肤色素脱失斑块为特征的病症。了解Melgain的作用机制需要深入研究其活性成分、作用方式以及对皮肤细胞的总体影响。 Melgain中的活性成分是十肽,是一种由十个氨基酸组成的特定肽序列。…

基于YOLOv8的棉花病害图像分类项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!

基于YOLOv8的棉花病害图像分类项目|完整源码数据集PyQt5界面完整训练流程开箱即用! 源码包含:完整YOLOv8训练代码数据集(带标注)权重文件直接可允许检测的yolo检测程序直接部署教程/训练教程 源码在文末哔哩哔哩视频简介处获取。 基本功能演…

【用AI指导人生、沟通、相处、冲突】遇事容易激动,易怒,情绪不稳定,感觉精神有点问题。需要平常心。需要找能代我沟通的人。不顾别人的感受。老感觉自己是受害者。心态问题,沟通问题。

遇事容易激动,易怒,情绪不稳定,感觉精神有点问题。需要平常心。需要找能代我沟通的人。不顾别人的感受。老感觉自己是受害者。心态有问题,沟通有问题。很容易把路越走越窄。 很容易把路越走越窄。别那么较劲。 全部描述出来&#…

【课程设计/毕业设计】基于python人工智能深度学习对狗表情训练识别基于深度学习对狗表情训练识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

基于金融科技的客户流失行为分析预测(python jupyter notebook 机器学习 数据可视化 数据分析)(设计源文件+万字报告+讲解)(支持资料、图片参考_相关定制)

基于金融科技的客户流失行为分析预测(python jupyter notebook 机器学习 数据可视化 数据分析) 本研究基于阿里云天池1万条金融领域银行客户数据,构建模型。经清洗、描述与卡方,,,。对比Logistic、RandomFo…

动画云渲染平台怎么选?同样是云渲染,如何用更低价格实现更高效率!

在选择动画云渲染平台时,渲染101和瑞云Renderbus是市场上备受关注的两大选项,它们各自定位不同,优势各异,适合的项目类型也有所区别。本文基于公开信息与平台官方资料,对两者进行对比分析,并提供选择建议&a…

【课程设计/毕业设计】基于python_CNN深度学习卷积神经网络训练识别猫的表情

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

计算机深度学习毕设实战-基于CNN卷积神经网络对猫狗识别基于python_CNN深度学习卷积神经网络对猫狗识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

出海新机遇:打造海外打车系统的核心逻辑与本地化关键

一、引言:海外出行市场的蓝海机遇在全球数字化转型的浪潮中,出行服务市场正迎来新一轮的国际化扩张。随着国际旅游业的复苏和本地化出行需求的增长,海外打车市场展现出巨大的发展潜力。然而,与国内市场不同,海外市场具…

【递归】判断是不是二叉搜索树

求解代码 之所以加上min和max,是因为二叉搜索树需要满足整棵左子树的所有节点都要小于根,整棵右子树的所有节点都要大于根。public boolean isValidBST (TreeNode root) {return isValidBST(root, null, null);}boolean isValidBST(TreeNode root, TreeN…

计算机深度学习毕设实战-基于python-AI深度学习卷神经网络对狗表情训练识别基于python-AI深度学习对狗表情训练识别

博主介绍:✌️码农一枚 ,专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者,博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围:&am…

港科大突破:AI实现医学文本引导图像精准分割

这项由香港科技大学(广州)的刘安林和薛润东,伊利诺伊大学香槟分校的曹旭然、沈翼帆和李翔,东南大学的陈倩倩,以及香港科技大学的陈锦泰等研究人员共同完成的突破性研究发表于2025年11月的arXiv预印本平台,论…