2.34 二手车价格预测完整案例:特征工程、模型训练、调参全流程
引言
本文通过二手车价格预测完整案例,演示从数据准备、特征工程、模型训练到参数调优的全流程。这是回归问题的经典案例,涵盖数据分析的各个环节。
一、数据准备
1.1 数据加载
# 二手车数据准备defprepare_car_data():""" 准备二手车数据 """np.random.seed(42)n=3000data={'car_id':range(1,n+1),'brand':np.random.choice(['Toyota','Honda','BMW','Mercedes','Audi'],n),'model':np.random.choice(['Sedan','SUV','Coupe','Hatchback'],n),'year':np.random.randint(2010,2024,n),'mileage':np.random.uniform(0,200000,n),'engine_size':np.random.uniform(1.0,5.0,n),'fuel_type':np.random.choice(['Petrol','Diesel','Hybrid','Electric'],n),'transmission':np.random.choice(['Manual','Automatic'],n),'color':np.random.choice(['Black','White','Silver','Red','Blue'],n),'price':np.random.uniform(5000,50000,n)}# 价格受多个因素影响price_base=20000price=(price_base+-1000*(2024-data['year'])+# 年份越新越贵