旅游景区客流热力图生成基于图像统计

旅游景区客流热力图生成：基于图像统计的智能分析实践

引言：从视觉识别到空间行为洞察

随着智慧旅游和城市数字化管理的发展，如何高效、准确地掌握景区客流分布成为运营决策的关键。传统依赖闸机数据或Wi-Fi探针的方式存在覆盖盲区、成本高、精度不足等问题。近年来，基于计算机视觉的图像级人群密度估计与热力图生成技术逐渐成熟，为景区提供了非接触、低成本、高时空分辨率的客流监测方案。

本文聚焦于一个实际可落地的技术路径：利用阿里开源的“万物识别-中文-通用领域”模型，结合图像统计方法，在PyTorch环境下实现旅游景区图片的自动人群检测与客流热力图生成。我们将从环境配置、模型调用、代码实现到结果可视化，完整还原这一技术方案的工程实践过程，帮助开发者快速构建自己的智能客流分析系统。

技术选型背景：为何选择“万物识别-中文-通用领域”？

在众多目标检测模型中（如YOLO系列、Faster R-CNN等），我们选择阿里开源的“万物识别-中文-通用领域”模型，主要基于以下三点考量：

中文场景优化：该模型在大量中文语境下的图像数据上进行了训练与微调，对国内景区常见元素（如汉服游客、传统建筑、指示牌等）具有更强的识别鲁棒性。
通用性强：支持超过万类物体识别，不仅能检测人，还能区分儿童、动物、交通工具等干扰项，提升人群计数准确性。
开箱即用：提供完整的推理脚本和预训练权重，适合作为基线模型快速集成到业务系统中。

核心思路：通过目标检测获取图像中所有“人”的边界框 → 统计单位网格内的人数 → 映射为颜色强度 → 生成热力图。

环境准备与依赖管理

基础运行环境

操作系统：Linux（Ubuntu/CentOS）
Python版本：3.11
深度学习框架：PyTorch 2.5
GPU支持：CUDA 11.8+（可选，CPU亦可运行）

环境激活与依赖安装

# 激活指定conda环境 conda activate py311wwts # 查看/root目录下的依赖列表并安装 pip install -r /root/requirements.txt

⚠️ 注意：确保requirements.txt文件中包含以下关键库： -torch>=2.5.0-torchvision-opencv-python-numpy-matplotlib

实现步骤详解

步骤一：复制项目文件至工作区（便于开发调试）

为了方便在IDE中编辑和调试，建议将原始脚本和测试图片复制到工作区：

cp /root/推理.py /root/workspace/ cp /root/bailing.png /root/workspace/

复制完成后，需修改推理.py中的图像路径指向新位置：

# 修改前 image_path = "/root/bailing.png" # 修改后 image_path = "/root/workspace/bailing.png"

步骤二：加载模型并执行推理

以下是推理.py的核心代码实现，包含目标检测、人群统计与热力图生成三大模块。

# -*- coding: utf-8 -*- import cv2 import torch import numpy as np import matplotlib.pyplot as plt from PIL import Image # ------------------------------- # 1. 加载预训练模型（假设已提供加载接口） # 注：此处模拟调用阿里“万物识别”API或本地模型 # ------------------------------- def load_model(): """ 模拟加载阿里开源的万物识别模型 实际使用时替换为真实模型加载逻辑 """ print("Loading 'Wanwu Recognition - Chinese General Domain' model...") # 使用torch.hub加载示例模型（如DETR） model = torch.hub.load('facebookresearch/detr', 'detr_resnet50', pretrained=True) model.eval() return model # ------------------------------- # 2. 图像预处理与推理函数 # ------------------------------- def detect_people(model, image_path): """ 对输入图像进行人群检测，返回所有人形bbox """ img = Image.open(image_path).convert("RGB") transform = T.Compose([ T.Resize(800), T.ToTensor(), T.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225]) ]) # 预处理 input_tensor = transform(img).unsqueeze(0) # 添加batch维度 # 推理 with torch.no_grad(): outputs = model(input_tensor) # 后处理：提取类别为"person"的检测框 probas = outputs['pred_logits'].softmax(-1)[0, :, :-1] # 移除no-object类 keep = probas.max(-1).values > 0.7 # 置信度阈值0.7 bboxes = outputs['pred_boxes'][0, keep] labels = probas[keep].argmax(-1) # 过滤出"person"类别 (COCO中id=1) person_indices = (labels == 1) person_bboxes = bboxes[person_indices] # 转换为OpenCV格式 (x1,y1,x2,y2) h, w = img.height, img.width processed_bboxes = [] for bbox in person_bboxes: cx, cy, bw, bh = bbox x1 = int((cx - bw/2) * w) y1 = int((cy - bh/2) * h) x2 = int((cx + bw/2) * w) y2 = int((cy + bh/2) * h) processed_bboxes.append([x1, y1, x2, y2]) return np.array(processed_bboxes), np.array(img) # ------------------------------- # 3. 生成客流热力图 # ------------------------------- def generate_heatmap(image, bboxes, grid_size=(20, 20)): """ 基于检测框生成二维密度热力图 """ h, w = image.shape[:2] heatmap = np.zeros(grid_size) # 将每个bbox映射到网格坐标 for (x1, y1, x2, y2) in bboxes: cx = (x1 + x2) // 2 cy = (y1 + y2) // 2 gx = int(cx / w * grid_size[1]) gy = int(cy / h * grid_size[0]) if 0 <= gx < grid_size[1] and 0 <= gy < grid_size[0]: heatmap[gy, gx] += 1 # 插值放大至原图尺寸 heatmap_resized = cv2.resize(heatmap, (w, h), interpolation=cv2.INTER_CUBIC) return heatmap_resized # ------------------------------- # 4. 可视化结果 # ------------------------------- def visualize_results(original_image, heatmap): """ 叠加热力图与原图显示 """ plt.figure(figsize=(12, 6)) # 原图 plt.subplot(1, 2, 1) plt.imshow(original_image) plt.title("Original Image") plt.axis("off") # 热力图 plt.subplot(1, 2, 2) plt.imshow(original_image) plt.imshow(heatmap, cmap='jet', alpha=0.6) plt.title("Crowd Heatmap") plt.axis("off") plt.colorbar(shrink=0.8) plt.tight_layout() plt.show() # ------------------------------- # 主程序入口 # ------------------------------- if __name__ == "__main__": import torchvision.transforms as T # 加载模型 model = load_model() # 设置图像路径（请根据实际情况修改） image_path = "/root/workspace/bailing.png" # 执行检测 bboxes, original_image = detect_people(model, image_path) print(f"Detected {len(bboxes)} people.") # 生成热力图 heatmap = generate_heatmap(original_image, bboxes) # 可视化 visualize_results(original_image, heatmap)

核心代码解析

1. 模型加载与推理逻辑

虽然“万物识别”模型未公开具体架构，但其接口设计类似于HuggingFace或TorchHub风格。我们以Facebook的DETR作为替代实现，因其具备良好的开放性和可解释性。

model = torch.hub.load('facebookresearch/detr', 'detr_resnet50', pretrained=True)

该模型基于Transformer架构，能够端到端输出目标边界框和类别，适合复杂场景下的人群检测任务。

2. 类别过滤机制

labels = probas[keep].argmax(-1) person_indices = (labels == 1) # COCO数据集中"person"对应ID=1

通过置信度阈值（>0.7）和类别匹配双重筛选，有效减少误检（如树影、广告人像等）。

3. 网格化统计策略

将图像划分为20x20的网格，统计每个网格内的人头中心点数量，形成初步密度矩阵：

gx = int(cx / w * grid_size[1]) gy = int(cy / h * grid_size[0])

此方法简单高效，适用于实时性要求较高的场景。

4. 热力图插值与融合

使用双三次插值将低分辨率密度图放大至原图尺寸，并叠加Jet色彩映射：

cv2.resize(heatmap, (w, h), interpolation=cv2.INTER_CUBIC) plt.imshow(heatmap, cmap='jet', alpha=0.6)

最终呈现直观的客流密集区域分布。

实践问题与优化建议

常见问题及解决方案

| 问题 | 原因 | 解决方案 | |------|------|----------| | 检测漏报严重 | 图像分辨率过低或遮挡严重 | 提升输入图像质量，启用多尺度推理 | | 热力图噪点多 | 小目标误检或重复检测 | 增加NMS（非极大值抑制）后处理 | | 热力图边缘失真 | 边界点映射越界 | 添加网格边界检查if 0 <= gx < grid_size[1]| | CPU推理慢 | 模型较大且无GPU加速 | 使用轻量版模型（如DETR-ResNet34） |

性能优化建议

模型轻量化：采用MobileNet或Tiny-DETR结构，降低计算开销。
异步处理：对于视频流，使用多线程/进程实现读取-推理-渲染流水线。
缓存机制：对静态摄像头画面，可定期更新而非逐帧处理。
动态网格划分：根据视角畸变程度调整网格密度（近处细粒度，远处粗粒度）。

应用扩展：从单图到视频流分析

当前脚本适用于静态图像分析，若要应用于景区实时监控，可做如下扩展：

cap = cv2.VideoCapture("rtsp://camera-stream-url") while True: ret, frame = cap.read() if not ret: break # 调用detect_people和generate_heatmap # 实时绘制热力图并推送到前端

结合Flask或FastAPI搭建Web服务，即可实现景区客流实时热力图平台。