2025MathorCup大信息竞赛A题B题选题建议与分析,思路模型

news/2025/11/20 14:13:34/文章来源:https://www.cnblogs.com/gccbuaa/p/19246881

2025MathorCup大信息竞赛A题B题完整思路模型代码论文持续更新(见文末名片)

赛道 A基于计算机视觉的集装箱智能破损检测
赛道 B物流理赔风险识别及服务升级问题

“扒表格算账”,琢磨物流理赔的风险,俩方向完全不搭边,咱们逐个赛道、逐个问题掰开揉碎了说,都用大白话,不整那些生僻术语。就是咱们先把这两个赛道的核心区别拎清楚——赛道A是纯纯“看图片干活”,专门找集装箱上的破损;赛道B

先看赛道A,集装箱破损检测这块,适合的学生得是玩过图片识别的,比如计算机科学、人工智能、自动化这些专业,尤其是平时接触过“看图片找东西”的同学,上手会快很多。咱们先讲第一个问题:判断图片里的集装箱有没有残损。这是A赛道里最基础的活,不用找破损在哪,就给个“有”或“没有”的答案,有点像你刷手机看图,判断“这张图里有没有猫”一样,只是对象换成了集装箱的破损。用到的模型也不用自己从零搭,像ResNet、EfficientNet这些现成的图片分类框架,网上一搜全是代码,改改输入输出就能用。但重点不在模型多复杂,而在“处理图片”——你想啊,港口的图片里乱七八糟的,有机器、天空、地面,还有反光、阴影、下雨天的水痕,这些都容易让模型认错,得先给图片“做个大扫除”,比如裁掉没用的背景、调调亮度去掉阴影;另外,没残损的图片可能比有残损的多好多,要是模型光看这些“没挑战”的图,最后可能就偷懒只认“没残损”,漏了真正有问题的,所以得想办法平衡素材,比如多复制点有残损的图,或者少用点没残损的图,这才是这个疑问的关键。

接下来是A赛道的第二个问题,也是最难的:既要找到破损在哪,还得说出是“凹陷” “裂纹”还是“锈蚀”。这就比第一个问题难多了,不光要知道“有”,还得用框把破损圈出来,甚至精确到每个像素——比如裂纹就几像素宽,得让模型能“看见”这么小的东西,还得区分开长得像的破损,比如深凹痕和破洞,一不小心就认错了。用到的模型一般是能同时干“找位置+标细节”的,比如Mask R-CNN,既能画框又能标像素;要是想快点出结果,也能用YOLO先画框找位置,再用U-Net补细节标分割。这里最头疼的是“多尺度检测”,大的锈蚀还好认,小的裂纹可能就一条细线,模型很容易漏看,所以得让模型像用放大镜一样,一层一层看图片的不同大小细节;另外,区分相似破损也得下功夫,可能得专门给这些像的破损样本做标注,让模型多学几遍。

最后是A赛道的第三个挑战,评估前两个模型好不好用。这就简单了,不用建模,就是给模型“打分”。比如第一个疑问判断“有没有破损”,不能只看“准确率”——因为没残损的图多,准确率高不代表能把所有有破损的都找出来,得看“召回率”,也就是到底漏了多少有破损的;第二个问题检测分割,要看“框得准不准”(行业里叫mAP)和“分割得对不对”(叫mIoU)。这些指标用Python的sklearn库就能算,重点是选对指标,别用错了——比如第一个问题用准确率,看似分高,其实没意义;另外,还得分析结果,比如召回率低,到底是因为小裂纹没看见,还是背景干扰太大,得说清楚原因,不能光甩个分数就完事。

再来说赛道B,物流理赔风险识别,这个适合玩表格信息的同学,比如数据科学、统计学、金融工程,要是物流管理专业的同学懂业务,上手会更顺,源于这个赛道全是跟运单相关的表格数据,不用碰图片。第一个问题是给运单分三类:“合理诉求” “诉求偏高” “严重超额”,核心是根据“理赔差额”(实际赔的钱减客户要的钱)和“实际赔付金额”来划界限。这一步不用急着建模,得先“摸透数据规律”——比如画个直方图看看,“合理诉求”的差额是不是堆在一起很密集,“严重超额”的是不是散在外面很稀疏,还得符合业务要求:严重超额的运单不能超过3%,合理诉求的得不少于85%。具体做的时候,先画散点图、直方图看看数据分布,再用K-means聚成3类,或者按“实际赔付金额”分档——比如100块以下、100到500块、500块以上,每档里再按差额的分位数划界,比如每档里差额最小的5%算严重超额,这样既符合数据规律,又能满足业务占比要求。这里要注意别“一刀切”,比如实际赔1000块和赔100块的运单,就算差额一样,也不能归为一类,必须按赔付金额分档定标准,不然就不符合实际业务逻辑了。

B赛道的第二个问题是预测实际赔付金额,也就是算“这单该赔多少钱”,属于连续值预测,不难。用到的模型不用复杂的神经网络,就用处理表格数据最顺手的“树模型”,比如随机森林、XGBoost、LightGBM,这些模型抗干扰能力强,还不用怎么调参。重点在“特征工程”——表格里有很多分类数据,比如“商品类型”是生鲜还是电子产品,得转成数字(行业里叫One-Hot编码);还有缺失值,比如有的运单没填保价金额,得补上,用均值或者中位数都行;另外,像运单号这种跟赔付金额没关系的特征,得删掉,不然会干扰模型。还有个小麻烦是异常值,比如有的运单赔几万块,这种极少数的情况很容易带偏模型,得先找出来处理,比如用“盖帽法”把特别大的值限制在某个范围里。

B赛道最难的是第三个困难:用第一个问题的规则建模型,预测新运单的类别,还得处理“严重超额样本少”的问题,最后对比两种预测方法的好坏。严重超额的样本只占3%,要是直接建模,模型很可能只认“合理诉求”,漏了严重超额的,所以得想办法处理——比如用SMOTE造点“严重超额”的假样本,或者调模型的class weight,给严重超额的样本更多“权重”,让模型重视它。建模还是用XGBoost、LightGBM这些树模型,重点是把之前处理好的特征喂进去。对比方法的时候得客观,不能只说哪个好:直接分类的好处是一步到位,不用先预测赔付金额,避免了两次误差叠加;但坏处是没利用好“赔付金额+差额”的业务逻辑。而先预测赔付金额再分类,好处是符合实际业务流程,先算该赔多少再判断合理不;但坏处是若是赔付金额预测不准,后面的分类也会错,相当于误差会累积。这部分得把优缺点说透,不能糊弄。

最后咱们总结下:想玩图片、调视觉模型的,选赛道A,适合计算机、AI相关专业,最难的是问题2的检测分割,核心是搞定多尺度和相似破损;想扒表格、玩信息的,选赛道B,适合内容科学、统计相关专业,最难的是障碍3的不平衡处理和技巧对比,核心是搞定少数样本和业务逻辑。俩赛道门槛不一样,但只要找准自己擅长的方向,上手都不算难。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/971013.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Redis更新缓存之双重检查 - 邓维

Redis更新缓存之双重检查 Redis更新缓存之双重检查 这是一个非常经典且重要的并发缓存设计模式。在缓存更新的逻辑中,在加锁前和加锁后都去读取缓存,这通常被称为 “双重检查”(Double-Check),它的目的是为了解决…

SSH 客户端 MobarXterm 安装和使用笔记

一、介绍常用SSH 客户端对比Xshell:个人免费,商业收费,之前爆出过有隐藏后门。不推荐Finshell:基础功能免费,高级功能收费,基于Java,内存占用较高(在1个G左右)。不推荐MobarXterm:基础功能免费、高级功能收费…

已有ERP和MES,为什么还需要质量管理系统(QMS)?

很多企业已经有了ERP和MES系统,但是产品合格率依旧不能令人满意,质量风险依旧很大,客户投诉不断。为什么会这样?这是大多数企业质量管理的现状。质量数据分散在各个系统,而这些系统里面的质量模块很不专业。 工欲…

2025年质量气体流量计直销厂家权威推荐榜单:超微量气体流量计/甲烷气体流量计/小口径气体流量计源头厂家精选

在工业自动化与精密测量需求持续增长的背景下,质量气体流量计凭借其高精度测量、直接质量流量输出等技术优势,已成为半导体、生物医药、新能源等高端制造领域的关键仪表。行业数据显示,2025年全球气体流量计市场规模…

SBD3D60V1H-ASEMI可直接替代安世PMEG6010CEJ

SBD3D60V1H-ASEMI可直接替代安世PMEG6010CEJ编辑:ll SBD3D60V1H-ASEMI可直接替代安世PMEG6010CEJ ASEMI首芯半导体可替代安世半导体功率器件 型号:SBD3D60V1H 品牌:ASEMI 封装:SOD-323 特性:肖特基二极管 正向电流…

机器学习之决策树模型

View Post机器学习之决策树模型一、决策树是什么 决策树是一种监督学习算法,既可以用于分类任务,也可以用于回归任务。其基本思想是通过一系列“是/否”的判断将数据逐步分裂成小的子集,直到每个子集足够“纯净”,…

重庆一对一辅导机构精选推荐,2025合规家教机构口碑排名已公布,附师资实力测评

你是否也在为孩子的课外辅导操碎了心?在重庆,想为孩子找一家靠谱的一对一辅导机构,总免不了面对同样的糟心事:怕师资掺水、怕价格虚高、怕耗时良久却看不到提分效果。这种择校焦虑,在小学升初中、初三面临中考、高…

251119D. mod

251119D. mod 维护一个小根堆,有两种操作共 \(n\) 次,在 \([l_i,r_i]\) 中均匀随机一个整数 \(x\),插入小根堆。 弹出最小值。问最终剩下的所有数的积的期望。 \[n,l_i,r_i\le500 \] 下文中,当值相同时令更早的数更…

2025 年 11 月开关柜厂家权威推荐榜单:高压开关柜,低压开关柜,智能开关柜,配电开关柜公司精选

2025 年 11 月开关柜厂家权威推荐榜单:高压开关柜,低压开关柜,智能开关柜,配电开关柜公司精选 随着我国电力装备制造业的持续升级,开关柜作为电力系统中不可或缺的关键设备,其技术水平和产品质量直接影响着电网运…

西门子MES已有质量模块,为何再斥资收购QMS?

西门子MES已有质量模块,为何再斥资收购QMS?深度剖析工业软件的“专”与“全” 西门子,这个昔日的工业巨擘,已悄然转型为仅次于SAP的欧洲第二大软件公司。其构建的庞大工业软件帝国,拥有全球品类最全、竞争力最强的…

2025 年 11 月开关柜供应厂家推荐排行榜,高压开关柜,低压开关柜,配电开关柜,智能开关柜公司推荐

2025年11月开关柜供应厂家推荐排行榜:高压开关柜、低压开关柜、配电开关柜、智能开关柜公司推荐 行业背景与发展趋势 开关柜作为电力系统中不可或缺的关键设备,在输配电环节扮演着核心角色。随着智能电网建设的深入推…

重庆一对一家教机构口碑推荐,2025辅导机构最新排名出炉,带详细选课攻略

重庆的家长们,你是不是也在为孩子的课外补习操碎了心?想给小学、初中、高中的孩子找靠谱的一对一辅导,却在渝中区、江北区、南岸区、九龙坡区、沙坪坝区、大渡口区、北碚区、渝北区、巴南区、涪陵区、江津区、合川区…

成都一对一家教机构推荐,2025最新辅导机构家长实测口碑榜

成都不少家长在为孩子选一对一家教时都面临难题:小学孩子注意力不集中,普通家教难以把控课堂节奏,补了几节课还是坐不住;初中孩子偏科明显,找的家教却总抓不准知识漏洞,成绩不见起色;高中孩子冲刺高考,想找懂本…

2025 年 11 月聚氨酯厂家推荐排行榜,聚氨酯组合料/黑白料/AB料/管道料/发泡剂,外墙/冷库聚氨酯保温材料公司精选

2025 年 11 月聚氨酯厂家推荐排行榜,聚氨酯组合料/黑白料/AB料/管道料/发泡剂,外墙/冷库聚氨酯保温材料公司精选 聚氨酯材料作为一种多功能高分子化合物,在建筑保温、冷链物流、工业管道等领域发挥着重要作用。随着…

2025 年 11 月轴承厂家推荐排行榜,瓦房店轴承,深沟球轴承,调心滚子轴承,圆锥滚子轴承源头厂家实力解析与选购指南

2025 年 11 月轴承厂家推荐排行榜,瓦房店轴承,深沟球轴承,调心滚子轴承,圆锥滚子轴承源头厂家实力解析与选购指南 行业背景与发展现状 轴承作为工业装备的核心基础零部件,其性能直接影响机械设备的运转效率和使用…

vscode没有开启自动保存引起的麻烦

新电脑装了vscode和hbuilderX, 因为是uniapp项目,需要在hbuilderX上运行到浏览器, 突然发现在vscode上写了console.log, 没有输出显示, 查了一通, 也问了ai, 还是没有解决. 最后突然想到看看hbuilderX上有没有该consol…

2025 年 11 月塑胶配件厂家推荐排行榜,塑胶外壳,塑胶组件,精密塑胶件,塑胶零件,塑胶边框,塑胶注塑件公司推荐

2025年11月塑胶配件厂家推荐排行榜:塑胶外壳、组件与精密零件优选指南 随着制造业智能化转型加速,塑胶配件作为工业基础元件的重要性日益凸显。从汽车电子到智能装备,从通信设备到消费电子,精密塑胶件的性能直接影…

2025 年 11 月高温老化房厂家推荐排行榜,老化室/高温老化室/高温房/熟化房/固化房,恒温恒湿室/恒温房/恒温恒湿房公司推荐

2025 年 11 月高温老化房厂家推荐排行榜,老化室/高温老化室/高温房/熟化房/固化房,恒温恒湿室/恒温房/恒温恒湿房公司推荐 在工业制造、科研测试和产品开发领域,高温老化房、老化室、高温老化室、高温房、熟化房、固…

快速下载huggingface模型 -----镜像 huggingface.co 域名

域名 hf-mirror.com,用于镜像 huggingface.co 域名。作为一个公益项目,致力于帮助国内AI开发者快速、稳定的下载模型、数据集。捐赠支持请看网页左下角,感谢支持! 快速下载及工具请见地址:https://hf-mirror.com/ …

黄山一对一家教辅导机构推荐:2025年综合实力权威排行榜,终极测评

“给孩子选课外补习平台比给自己找工作还难!”这是黄山屯溪区家长刘女士的真切感慨。她的孩子上初三,数学成绩长期在及格线徘徊,两个月内试了3家教育机构,要么老师讲课照本宣科,要么课后没人跟进,钱花了近万,成…