深入解析:李宏毅2023机器学习作业 HW01实操

news/2025/9/25 16:33:07/文章来源:https://www.cnblogs.com/wzzkaifa/p/19111457

ML2023Spring - HW01 相关信息:

1.任务目标(回归)

COVID-19 daily cases prediction: COVID-19 每天的病例预测
训练/测试数据大小:3009/997(每一年的homework 可能不同)

2.性能指标(Metric)

均方误差 Mean Squared Error (MSE)

3.数据解析

covid_train.txt: 训练数据
covid_test.txt: 测试数据
数据大体分为三个部分:id, states: 病例对应的地区, 以及其他数据

id: sample 对应的序号。
states: 对 sample 来说该项为 one-hot vector。从整个数据集上来看,每个地区的 sample 数量是均匀的,可以使用pd.read_csv(’./covid_train.csv’).iloc[:,1:34].sum()来查看,地区 sample 数量为 88/89。
其他信息: 这一部分最终应用在助教所给的 sample code 中的 select_feat。
Covid-like illness (5) 新冠症状
cli, ili …
Behavier indicators (5) 行为表现
wearing_mask、travel_outside_state … 是否戴口罩,出去旅游 …
Belief indicators (2) 是否相信某种行为对防疫有效
belief_mask_effective, belief_distancing_effective. 相信戴口罩有效,相信保持距离有效。
Mental indicator (2) 心理表现
worried_catch_covid, worried_finance. 担心得到covid,担心经济状况
Environmental indicators (3) 环境表现
否大部分保持距离 …就是other_masked_public, other_distanced_public … 周围的人是否大部分戴口罩,周围的人
Tested Positive Cases (1) 检测阳性病例,该项为模型的预测目标
tested_positive (this is what we want to predict) 单位为百分比,指有多少比例的人

4. Baselines

根据作业 PDF 中的提示:

Simple Baseline (1.96993)
运行所给的 sample code。
Medium Baseline (1.15678)
特征选择,简单手动的选择你认为关联性较大的特征。
Strong Baseline (0.92619)
尝试不同的优化器(如:Adam)。
应用 L2 正则化(SGD/Adam … 优化器参数中的 weight_decay)
Boss Baseline (0.81456)
尝试更好的特征选择,可以运用 sklearn.feature_selection.SelectKBest。
尝试不同的模型架构(调整 my_module.layers)
调整其他超参数

5.个人完整代码分享

https://github.com/holyeyes8/HUNG-YI_LEE_Machine-Learning_Homework/blob/master/HW01.ipynb

可以在colab上面正常运行

5.1 解决问题1

在这里插入图片描述

/content# pip install optuna
Requirement already satisfied: optuna in /usr/local/lib/python3.12/dist-packages (4.5.0)
Requirement already satisfied: alembic>=1.5.0 in /usr/local/lib/python3.12/dist-packages (from optuna) (1.16.5)
Requirement already satisfied: colorlog in /usr/local/lib/python3.12/dist-packages (from optuna) (6.9.0)
Requirement already satisfied: numpy in /usr/local/lib/python3.12/dist-packages (from optuna) (2.0.2)
Requirement already satisfied: packaging>=20.0 in /usr/local/lib/python3.12/dist-packages (from optuna) (25.0)
Requirement already satisfied: sqlalchemy>=1.4.2 in /usr/local/lib/python3.12/dist-packages (from optuna) (2.0.43)
Requirement already satisfied: tqdm in /usr/local/lib/python3.12/dist-packages (from optuna) (4.67.1)
Requirement already satisfied: PyYAML in /usr/local/lib/python3.12/dist-packages (from optuna) (6.0.2)
Requirement already satisfied: Mako in /usr/local/lib/python3.12/dist-packages (from alembic>=1.5.0->optuna) (1.3.10)
Requirement already satisfied: typing-extensions>=4.12 in /usr/local/lib/python3.12/dist-packages (from alembic>=1.5.0->optuna) (4.15.0)
Requirement already satisfied: greenlet>=1 in /usr/local/lib/python3.12/dist-packages (from sqlalchemy>=1.4.2->optuna) (3.2.4)
Requirement already satisfied: MarkupSafe>=0.9.2 in /usr/local/lib/python3.12/dist-packages (from Mako->alembic>=1.5.0->optuna) (3.0.2)
/content# 

5.2 信息上传

在这里插入图片描述

5.3 运行结果

5.3.1 loss/train

在这里插入图片描述

5.3.1 loss/valid

在这里插入图片描述

6 本地环境搭建

参考:
https://blog.csdn.net/weixin_42426841/article/details/129520007

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/917231.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Java+SpringBoot+SSM,Flask福聚苑社区团购体系(源码+LW+调试文档+讲解等)/福聚苑社区/团购系统/社区团购/福聚苑/团购/社区/环境/福聚苑小区/在线团购/社区购物

基于Java+SpringBoot+SSM,Flask福聚苑社区团购体系(源码+LW+调试文档+讲解等)/福聚苑社区/团购系统/社区团购/福聚苑/团购/社区/环境/福聚苑小区/在线团购/社区购物pre { white-space: pre !important; word-wrap: nor…

按需引入echarts

--// echarts-config.js // ECharts按需引入配置文件 import * as echarts from echarts/core; import {BarChart,LineChart,PieChart,ScatterChart,RadarChart } from echarts/charts; import {TitleComponent,Toolti…

软件构造的用户交互设计 4章

交互设计的原则 1.尽量保持一致 2.满足普遍可用性 3.提供信息反馈 4.设计对话框以产生结束信息 5.预防并成立错误 6.允许撤销操作 7.支持内部控制点 8.减轻短时记忆负担 交互设计的基本过程 标识和建立用户需求 提出满…

自定义制作docker容器自动自愈容器镜像

包括:完整的 autoheal.sh(支持每分钟检查一次、连续 5 次 unhealthy 才重启) Dockerfile docker-compose.yml 详细文档,包含参数说明、用法1️⃣ autoheal.sh #!/usr/bin/env sh set -e set -o pipefailDOCKER_SOC…

阀门公司网站建设广州动漫制作公司

1 mpl_toolkits.mplot3d 功能介绍 mpl_toolkits.mplot3d 是 Matplotlib 库中的一个子模块,用于绘制和可视化三维图形,包括三维散点图、曲面图、线图等。它提供了丰富的功能来创建和定制三维图形。以下是 mpl_toolkits.mplot3d 的主要功能和功能简介&am…

如何利用海外 NetNut 网络代理与 AICoding 实战获取 iPhone 17 新品用户评论数据?

如何利用海外 NetNut 网络代理与 AICoding 实战获取 iPhone 17 新品用户评论数据?如何利用海外 NetNut 网络代理与 AICoding 实战获取 iPhone 17 新品用户评论数据? 一、引言 在数据驱动时代,开发者与研究者越来越依…

第一次编码器测试

共1055圈 平均2047.974408 平均每张丢失距离 0.00001132 mm可以忽略 不丢帧

04-FreeRTOS的概述及编程规范

概述 本文对FreeRTOS源码进行概述,包括其核心文件作用,及其编程规范,有助于阅读rtos的内核源码,更好的帮助理解。 一、FreeRTOS 源码核心结构概述 FreeRTOS 是轻量级实时操作系统,核心功能围绕 “任务调度” 和 “…

10_ select/poll/epoll实现服务端的io多路复用

一、io多路复用 在现有模型中,似乎每一个线程都做了同样的事情,1、监听客户端消息;2、业务消息处理。 “一消息一线程”的缺点究其根本,在于让每个线程都做了同样重复、且消耗资源巨大的事情——单独持有fd、监听客…

模拟实战配置实验

vlan之间的互通 要实现 VLAN 10(192.168.150.0/24)、VLAN 100(192.168.100.0/24)、VLAN 200(192.168.200.0/24) 之间的互联互通,核心原理是:二层交换机仅负责 VLAN 内流量转发,跨 VLAN 流量需通过三层设备(核…

微网站建设的现状设计吧

首先要理解double的存储方式,具体可查找相关的博客本文实现的是将8个字节(存储为16进制的字符串)转化为对应的double类型double MainWindow::qByteArraytodouble(QString qstr){QByteArray byte;StringToHex(qstr,byte);double result;memcpy(&result, byte.dat…

聚力赋能|竹云受邀出席2025华为全联接大会 - 详解

聚力赋能|竹云受邀出席2025华为全联接大会 - 详解2025-09-25 16:21 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; displ…

Linux安装Kafka(无Zookeeper模式)保姆级教程,云服务器安装部署,Windows内存不够允许看看

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

国标GB28181公网直播EasyGBS如何构建全域覆盖的应急管理与安全生产解决方案?

在当今社会,安全生产和应急管理已经成为各行各业不可或缺的重要部分。全面提高安全生产管理水平、构建责任全覆盖、监管全过程、监管全方位的综合治理体系已成为社会发展的必然趋势。国标GB28181网页直播平台EasyGBS作…

Serilog.AspNetCore与Serilog的区别

一直以为用的是Serilog,深入了解后,用的是Serilog.AspNetCore,具体来了解下区别,与使用方法: Serilog 是“核心引擎”,只负责把日志事件生成出来; Serilog.AspNetCore 是“ASP.NET Core 专用适配器”,在 Seril…

基于MATLAB S函数实现多智能体间歇通信仿真

一、系统架构设计 1.1 通信模型 graph LR A[智能体1] -->|脉冲信号| B[智能体2] B -->|脉冲信号| C[智能体3] C -->|脉冲信号| A 1.2 核心模块通信触发模块:基于阈值事件的间歇通信 状态更新模块:离散时间一…

邢台做网站推广价格网站目标

新疆乌鲁木齐市2014-2015学年第二学期高一年级期末考试信息技术试卷(60分钟)第一部分必修模块(共80分)一、单项选择题(本大题共20小题,每小题2分,共40分)1.关于信息,以下说法不正确的是A.信息需要依附于载体而存在B&am…

北京如何申请公司网站备案号wordpress建站发文教程

电能质量在线监测装置 本办法对发电企业(包括分布式电源)、电网企业、用电企业的电能质量管理均有明确要求,要求在发电企业并网点、电网企业非线性设施、用电企业公共连接点设置电能质量监测装置,这会促进市场对电能质量在线监测…

个人网站备案需要哪些资料网站限时抢购怎么做

转自:https://zssure.blog.csdn.net/article/details/49231303 题记: DICOM医学图像处理专栏撰写已有两个年头,积累了近百篇文章。 起初 只是用于记录自己科研、工作中遇到的疑难问题,专注于图像处理(主要是医学图像…

C11中__atomic_thread_fence如何理解

C11 中的 atomic_thread_fence 函数是一种同步原语,用于在线程间强制执行内存排序约束。它为非原子操作和松弛原子操作建立内存同步顺序,而不执行实际的原子操作。这在多线程环境中尤其有用,可确保内存变化在不同线…