新手学做网站内容网站备案周期

news/2025/10/4 13:53:11/文章来源:
新手学做网站内容,网站备案周期,设计网站开发费用计入什么科目,企业手机网站开通摘要 https://arxiv.org/pdf/2312.07526.pdf 实时多人姿态估计在平衡速度和精度方面提出了重大挑战。虽然两阶段自上而下的方法随着图像中人数增加而变慢#xff0c;但现有的单阶段方法往往无法同时提供高精度和实时性能。本文介绍了RTMO#xff0c;这是一种单阶段姿态估计框…摘要 https://arxiv.org/pdf/2312.07526.pdf 实时多人姿态估计在平衡速度和精度方面提出了重大挑战。虽然两阶段自上而下的方法随着图像中人数增加而变慢但现有的单阶段方法往往无法同时提供高精度和实时性能。本文介绍了RTMO这是一种单阶段姿态估计框架通过在YOLO架构中使用双1-D热图来表示关键点实现了坐标分类的无缝集成同时保持了高速度并实现了与自上而下方法相当的精度。我们提出了一个动态坐标分类器和定制的热图学习损失函数专门用于解决坐标分类与密集预测模型之间的不兼容性问题。RTMO在速度上比最先进的单阶段姿态估计器快约9倍同时在COCO数据集上的准确率提高了1.1%。我们的最大模型RTMO-l在COCO val2017上达到了74.8%的AP同时在单个V100 GPU上的运行速度为141 FPS这证明了其效率和准确性。代码和模型可在https://github.com/openmmlab/mmpose/tree/dev-1.x/projects/rtmo上找到。 1、简介 多人姿态估计(MPPE)在计算机视觉领域至关重要其应用范围从增强现实到体育分析。对于需要即时反馈的应用如运动员定位的指导实时处理尤为关键。虽然已经出现了许多实时姿态估计技术 [3,15,16,30] 但如何在速度和精度之间取得平衡仍然是一个挑战。 当前的实时姿态估计方法分为两类自上而下法 [3,15] 和单阶段法 [16,30]。自上而下方法使用预先训练的检测器在主体周围创建边界框然后对每个人进行姿态估计。一个关键的局限性是它们的推理时间与图像中的人数成比例参见图1。另一方面单阶段方法直接预测图像中所有人体的关键点位置。然而当前的实时单阶段方法 [16,30,33] 在准确性方面落后于自上而下的方法参见图1。这些方法依赖于YOLO架构直接回归关键点的坐标这影响了性能因为这种技术类似于对每个关键点使用Dirac delta分布忽略了固有的歧义和不确定性 [20]。 另外坐标分类方法使用双1-D热图通过将关键点位置的概率分布在跨越整个图像的两个集合的bin上增加了空间分辨率。这提供了更准确的预测同时几乎没有额外的计算成本 [15,22]。然而直接将坐标分类应用于像单阶段姿态估计这样的密集预测场景会导致bin利用率低下因为图像和每个人只占据一个较小的区域。此外传统的Kullback-Leibler散度KLD损失将所有样本视为相等这对于网格中实例难度差异很大的单阶段姿态估计来说是不理想的。 因此RTMO实现了与实时自上而下方法相当的精度并超过了其他轻量级单阶段方法如图1所示。此外当处理图像中的多个实例时RTMO在速度上超过了具有相似精度的自上而下方法。值得注意的是RTMO-1模型在COCO val2017数据集上达到了74.8%的平均精度AP并在NVIDIA V100 GPU上表现出141帧每秒FPS的速度。在CrowdPose基准测试中 [18]RTMO-1达到了73.2%的AP创下单阶段方法的新纪录。这项工作的关键贡献包括 一种创新的坐标分类技术专门针对密集预测场景利用坐标bins进行精确的关键点定位同时解决了实例大小和复杂性的差异所带来的挑战。一种新的实时单阶段MPPE方法无缝地将坐标分类与YOLO架构相结合在现有自上而下和单阶段MPPE方法中实现了性能和速度之间的最佳平衡。 2、相关工作 2.1. 单阶段姿态估计器 受单阶段目标检测算法的进步 [7, 9, 24, 40, 51] 的启发一系列单阶段姿态估计方法已经出现 [10, 30, 34, 39, 51]。这些方法在单个前向传播中执行MPPE并直接从预定的根位置回归实例特定的关键点。其他方法如PETR [37] 和ED-Pose [46]将姿态估计视为集合预测问题为关键点回归建立了完全端到端的框架。除了基于回归的解决方案还有像FCPose [31]、InsPose [35]和CID [42]这样的技术利用动态卷积或注意力机制生成实例特定的热图来进行关键点定位。 与两阶段姿态估计方法相比单阶段方法省去了预处理例如自上而下方法的行人检测和后处理例如自下而上方法的键点分组的需要。这带来了两个好处1一致的推理时间与图像中的实例数量无关2简化的管道便于部署和实际使用。尽管有这些优点现有的单阶段方法在平衡高准确性与实时推理方面仍面临挑战。高准确度模型 [42,46] 通常依赖于资源密集的后备如HRNet [38] 或Swin [25]这使得实时估计变得具有挑战性。相反实时模型 [30,33] 在性能上做出了妥协。我们的模型解决了这一权衡问题同时提供了高准确度和快速的实时推理。 2.2. 坐标分类 SimCC [22] 和 RTMPose [15] 已经采用坐标分类进行姿态估计。这些方法基于水平和垂直轴上的亚像素bins对关键点进行分类实现了空间区分而无需依赖高分辨率特征图。这有效地平衡了准确性和速度。然而对于密集预测方法跨越整个图像的bins是不切实际的因为需要大量的bins来减少量化误差这导致许多bins对于单个实例来说是多余的从而导致效率低下。DFL [20] 在每个锚点的预定范围内设置bins可能无法覆盖大实例的关键点并且对于小实例可能产生显著的量化误差。我们的方法根据每个实例的大小分配bins将它们放置在局部区域内优化了bin的使用确保了关键点的覆盖范围并最小化了量化误差。 2.3. Transformer增强的姿态估计 基于Transformer的架构在姿态估计中变得无处不在利用最先进的Transformer后端来提高准确性如ViTPose [45]或结合CNN和Transformer编码器来捕捉空间关系 [47]。TokenPose [21] 和 Poseur [32] 证明了基于令牌的关键点嵌入在热图和回归方法中的有效性利用视觉线索和解剖学约束。PETR [37] 和 ED-Pose [46] 等框架在端到端多人体姿态估计中引入了Transformers而RTMPose [15] 将自注意力与基于SimCC的框架相结合 [22]用于关键点依赖性分析。虽然位置编码在注意力中是标准的用于指示查询和键的位置但我们创新地使用它来形成每个空间bin的表示向量使计算bin-keypoint相似性成为可能从而促进准确的定位预测。 3. 方法论 在我们的模型中我们采用类似YOLO的架构如图2所示。主干是CSPDarknet [9]我们使用Hybrid Encoder [28]处理最后三个特征图产生具有16和32的相应下采样率的P_{4}和P_{5}空间特征。这些特征图中的每个像素映射到原始图像平面上均匀分布的网格单元格。网络头利用每个空间级别的双卷积块为每个网格单元格生成分数和相应的姿态特征。这些姿态特征用于预测边界框、关键点坐标和可见性。通过动态坐标分类器生成1-D热图预测的细节在3.1节中给出而基于MLE的热图损失在3.2节中提出。完整的训练和推理过程在3.3节中概述。 3.1. 动态坐标分类器 与每个网格单元格关联的姿态特征封装了关键点相对于网格的位移。之前的工作[10、30、34]直接回归这些位移因此在性能上存在不足。我们的研究探索将坐标分类与单阶段姿态估计框架相结合以提高关键点定位精度。现有坐标分类方法的明显限制是它们静态的bin分配策略。为了解决这个问题我们引入了动态坐标分类器DCC它动态地分配范围并形成两个1-D热图中的bin表示有效地解决了密集预测上下文中坐标分类的不兼容性。 动态bin分配。顶部的姿态估计器中使用的坐标分类技术将bins分配到整个输入图像上[15、22]。这种方法导致单阶段方法中的bin浪费因为每个对象只占据图像的一小部分。DFL [20]在每个锚点附近的预定范围内设置bins这可能会错过较大实例中的关键点并在较小实例中导致显著的量化误差。DCC通过动态分配bins来解决这些限制以确保与每个实例的边界框对齐确保局部覆盖范围。首先使用逐点卷积层回归边界框然后将其扩大1.25倍以覆盖所有关键点即使在预测不准确的情况下也是如此。这些扩展的边界框在水平和垂直轴上均匀地划分为B_{x}和B_{y}个bins。每个水平bin的x坐标计算如下 x i x l ( x r − x l ) i − 1 B x − 1 , x_{i}x_{l}\left(x_{r}-x_{l}\right) \frac{i-1}{B_{x}-1}, xi​xl​(xr​−xl​)Bx​−1i−1​, 其中 x r x_{r} xr​和 x l x_{l} xl​是边界框的左右两边索引 i i i从1变化到 B x B_{x} Bx​。y轴的bins计算方式类似。 动态bin编码。在DCC的上下文中由于每个网格的预测边界框不同每个bin的位置在网格之间会有所变化。这与以前的方法[15, 22]不同其中bin坐标是固定的。DCC不是像这些方法那样在网格之间使用共享的bin表示而是实时生成定制的表示。具体来说我们将每个bin的坐标编码为位置编码以创建针对bin的特定表示。我们使用正弦位置编码[41]定义为 [ P E ( x i ) ] c { sin ⁡ ( x i t c / C ) , for even  c cos ⁡ ( x i t ( c − 1 ) / C ) , for odd  c , \left[\boldsymbol{P E}\left(x_{i}\right)\right]_{c}\left\{\begin{array}{ll} \sin \left(\frac{x_{i}}{t^{c / C}}\right), \text { for even } c \\ \cos \left(\frac{x_{i}}{t^{(c-1) / C}}\right), \text { for odd } c \end{array},\right. [PE(xi​)]c​{sin(tc/Cxi​​),cos(t(c−1)/Cxi​​),​ for even c for odd c​, 其中t表示温度c是索引C表示总维度数。我们使用全连接层来完善位置编码的适应性该全连接层应用可学习的线性变换 ϕ \phi ϕ从而优化其在DCC中的有效性。 The primary objective of DCC is to accurately predict keypoint occurrence probabilities at each bin, informed by bin coordinates and keypoint features. Keypoint features are extracted from the pose feature and refined via a Gated Attention Unit (GAU) module [13] following RTMPose [15], to enhance inter-keypoint consistency. The probability heatmap is generated by multiplying the keypoint features \boldsymbol{f}{k} with the positional encodings of each bin \boldsymbol{P E}\left(x{i}\right) , followed by a softmax: \hat{p}{k}\left(x{i}\right)\frac{e^{\boldsymbol{f}{k} \cdot \boldsymbol{\phi}\left(\boldsymbol{P E}\left(x{i}\right)\right)}}{\sum_{j1}^{B_{x}} e^{\boldsymbol{f}{k} \cdot \boldsymbol{\phi}\left(\boldsymbol{P E}\left(x{j}\right)\right)}} where \boldsymbol{f}_{k} is the k -th keypoint’s feature vector. 3.2. MLE for Coordinate Classification In classification tasks, one-hot targets and cross-entropy loss are commonly utilized. Label smoothing, like Gaussian label smoothing used in SimCC [22] and RTMPose [15], along with KLD, can improve performance. The Gaussian mean \mu_{x}, \mu_{y} and variance \sigma^{2} are set to the annotated coordinates and a predefined parameter. The target distribution is defined as: p_{k}\left(x_{i} \mid \mu_{x}\right)\frac{1}{\sqrt{2 \pi} \sigma} e{-\frac{\left(x_{i}-\mu_{x}\right){2}}{2 \sigma^{2}}} \sim \mathcal{N}\left(x_{i} ; \mu_{x}, \sigma^{2}\right) Importantly, we note that p_{k}\left(x_{i} \mid \mu_{x}\right) is mathematically identical to the likelihood p_{k}\left(\mu_{x} \mid x_{i}\right) of the annotation \mu_{x} under a Gaussian error model with true value x_{i} . This symmetrical property arises because the Gaussian distribution is symmetric with respect to its mean. Treating the predicted \hat{p}{k}\left(x{i}\right) as the prior of x_{i} , the annotation likelihood for the k -th keypoint is: \begin{aligned} P\left(\mu_{x}\right) \sum_{i1}^{B_{x}} P\left(\mu_{x} \mid x_{i}\right) P\left(x_{i}\right) \ \sum_{i1}^{B_{x}} \frac{1}{\sqrt{2 \pi} \sigma} e{-\frac{\left(x_{i}-\mu_{x}\right){2}}{2 \sigma^{2}}} \hat{p}{k}\left(x{i}\right) . \end{aligned} Maximizing this likelihood models the true distribution of the annotations. In practice, we employ a Laplace distribution for P\left(\mu_{x} \mid x_{i}\right) and a negative log-likelihood loss: \mathcal{L}{\text {mle }}^{(x)}-\log \left[\sum{i1}^{B_{x}} \frac{1}{\hat{\sigma}} e^{-\frac{\left|x_{i}-\mu_{x}\right|}{2 \hat{\sigma} s}} \hat{p}{k}\left(x{i}\right)\right], 3.3. Training and Inference Training. Our model, adhering to a YOLO-like structure, employs dense grid prediction for human detection and pose estimation. It is crucial for the model to differentiate between positive and negative grids. We extend SimOTA [9] for training, assigning positive grids based on grid scores, bounding box regression and pose estimation accuracy. The head’s score branch classifies these grids, supervised by varifocal loss [50] \mathcal{L}_{c l s} , with target scores being the Object Keypoint Similarity (OKS) between the predicted pose and the assigned ground truth for each grid. Positive grid tokens yield bounding box, keypoint coordinates, and visibility predictions. Keypoint coordinates are derived via the DCC, while other predictions come from pointwise convolution layers. The losses applied are IoU loss for bounding boxes \mathcal{L}{\text {bbox }} , MLE loss for keypoints \mathcal{L}{\text {mle }} , and BCE loss for visibility \mathcal{L}_{\text {vis }} . Given the DCC’s computational demands, we implement a pointwise convolution layer for preliminary coordinate regression, similar to YOLO-Pose [30], to mitigate out-ofmemory issues. This regressed keypoints \mathrm{kpt}{\text {reg }} serves as a proxy in SimOTA for positive grid selection, with the decoded keypoints \mathrm{kpt}{\text {dec }} later used to calculate OKS. The regression branch’s loss is OKS loss [30]: \mathcal{L}{\text {proxy }}1-\text { OKS }\left(\mathrm{kpt}{\text {reg }}, \mathrm{kpt}_{\text {dec }}\right) . The total loss for the proposed model is \mathcal{L}\lambda_{1} \mathcal{L}{\text {bbox }}\lambda{2} \mathcal{L}{\text {mle }}\lambda{3} \mathcal{L}{\text {proxy }}\lambda{4} \mathcal{L}{\text {cls }}\mathcal{L}{\text {vis }}, with hyperparameters \lambda_{1}, \lambda_{2}, \lambda_{3} , and \lambda_{4} set at \lambda_{1}\lambda_{2} 5, \lambda_{3}10 , and \lambda_{4}2 . 推理。在推理阶段我们的模型使用0.1的分数阈值和网格过滤的非最大抑制。然后它从选定的网格解码姿态特征为热图利用热图的积分来导出关键点坐标。这种选择性解码方法最小化了需要处理的特征数量从而降低了计算成本。 4、实验 4.1、设置 数据集。实验主要在COCO2017关键点检测基准[23]上进行该基准包含约250K个人实例具有17个关键点。在val2017和test-dev集上与最先进的方法进行了性能比较。为了探索模型的上限性能训练还扩展到了其他数据集CrowdPose [18]、AIC [43]、MPII [1]、JHMDB [14]、Halpe [8]和PoseTrack18 [2]。这些注释被转换为COCO格式。RTMO在CrowdPose基准[18]上进一步评估该基准以拥挤和遮挡的场景而闻名由20K张图像和约80K个人组成具有14个关键点。对于这两个数据集基于OKS的平均精度AP用作评估指标。 实现细节。在训练过程中我们采用了YOLOX [9]的图像增强管道包括mosaic增强、随机颜色调整、几何变换和MixUp [49]。训练图像的尺寸调整为[480,800]。COCO和CrowdPose数据集的训练周期数分别为600和700。训练过程分为两个阶段第一阶段涉及使用姿势标注训练代理分支和DCC第二阶段将代理分支的目标转向从DCC解码出的姿势。使用AdamW优化器[26]权重衰减为0.05在Nvidia GeForce RTX 3090 GPU上以批量大小256进行训练。两个训练阶段的初始学习率分别为 4 × 1 0 − 3 4 \times 10^{-3} 4×10−3和 5 × 1 0 − 4 5 \times 10^{-4} 5×10−4通过余弦退火衰减到 2 × 1 0 − 4 2 \times 10^{-4} 2×10−4。对于推理图像被调整为640。使用ONNXRuntime在Intel Xeon Gold CPU上测量CPU延迟。使用ONNXRuntime和TensorRT在NVIDIA V100 GPU上测试GPU延迟并使用半精度浮点数FP16格式。 4.2、基准结果 COCO 为了评估RTMO与其他实时姿态估计器我们在COCO val 2017数据集上测量了AP和推理延迟。对于单阶段方法我们考虑了KAPAO [33]、YOLOv8-Pose [16]和YOLOXPose - YOLO-Pose [30]在YOLOX [9]上的改编。对于自上而下的方法我们选择了RLE [19]、SimCC [22]和RTMPose [15]进行比较。RTMDetnano [29]一个高效的对象检测模型作为自上而下模型的“人类检测器”。由于自上而下模型在图像中出现更多人时会变慢我们根据人数将COCO val2017集进行分区并相应地评估自上而下模型的运行速度。如Fig. 3所示RTMO系列在性能和速度上均超越了类似的轻量级单阶段方法。与自上而下模型相比RTMO-m和RTMO-1与RTMPose-m和RTMPose1的精度相当在图像中出现更多人时速度更快。使用ONNXRuntime时当有大约四个人时RTMO与RTMPose的速度相当使用TensorRT FP16时当有两个人或更多人时RTMO更快。这表明了RTMO在多人物场景中的优势。重要的是尽管处理中的令牌数量随着图像中的人数而变化但推理延迟的差异很小。例如在有超过10人的子集中GPU上的RTMO-1的延迟仅比一个子集高出约0.1毫秒占总体延迟的约0.5%。 我们对RTMO在COCO test-dev上与领先的一阶段姿态估计器进行了评估结果如表1所示。RTMO在速度和精度方面表现出显著的优势。具体来说使用ResNet-50 [11]骨干网的RTMO-s性能优于PETR [36]速度快10倍同时保持相似的准确性。与轻量级模型如KAPAO和YOLO-Pose相比RTMO在不同模型大小上的准确性均优于其他模型。当在COCO train2017上进行训练时RTMO-l在所有测试模型中排名第二。表现最好的模型是使用Swin-L [25]骨干网的ED-Pose [46]但该模型相当庞大且不利于部署。使用相同ResNet-50骨干网的RTMO在AP上超越ED-Pose 1.1%并且速度更快。此外将ED-Pose转换为ONNX格式导致延迟慢于其PyTorch模型每帧约1.5秒。相比之下RTMO-l的ONNX模型仅需19.1ms即可处理一张图像。通过在更多人体姿态数据集上进一步训练RTMO-1在一阶段姿态估计器中以准确性排名第一。 CrowdPose 为了评估RTMO在具有挑战性的场景下的性能我们在CrowdPose [18]基准上进行测试该基准以密集人群、显著的人员重叠和遮挡为特点。结果总结如表2所示。在自下而上和单阶段方法中RTMO-s的准确性可与DEKR [10]相媲美但其参数仅为DEKR的15%。当在CrowdPose数据集上训练时尽管模型大小较小但RTMO-1超过了使用Swin-L [25]骨干网的ED-Pose [46]。值得注意的是RTMO-l主要在中等和困难样本上超过ED-Pose这表明其在挑战性场景下的有效性。此外通过使用更多的训练数据RTMO-1达到了81.7%的AP突显了该模型的容量。 4.3、定量结果 RTMO采用坐标分类方法在具有挑战性的多人物场景中表现出强大的性能其中人物相对较小且频繁出现遮挡。图4表明即使在这些困难的条件下RTMO也能生成空间上准确的热图为每个关键点提供稳健且具有上下文感知的预测。 4.4、消融实验 分类与回归。为了评估坐标分类相对于回归的有效性我们将模型中的1-D热图生成替换为用于回归的全连接层并通过OKS损失[30]进行监督。表3比较了两种方法的性能。使用DCC模块和MLE损失坐标分类在COCO上的性能优于回归2.1% AP。 坐标分类的损失函数。与其他使用KLD作为损失函数的具有坐标分类的人体姿态估计方法不同我们的研究指出KLD对于RTMO来说是不够的。表3中的证据表明与我们的MLE损失相比使用KLD会导致较低的准确性。我们将这种改进归因于MLE损失函数中可学习的方差的包含这有助于平衡硬样本和易样本之间的学习。具体来说在一阶段姿态估计器框架中每个网格的难度级别会因分配实例的姿态和大小以及网格与实例之间的相对位置等因素而有所不同。KLD无法考虑这种变化因此在此上下文中效果较差。 动态策略在坐标分类中。我们首先采用类似于DFL [20]的静态坐标分类策略其中bins分布在每个网格的固定范围内。该方法在COCO数据集上超过了回归方法但在CrowdPose上表现不佳。通过引入动态bin分配DBA策略该基线在两个数据集上的性能都下降了。这是合理的因为不同样本中每个bin的语义没有相应的表示调整。这个问题通过结合动态bin编码DBE得到了纠正。使用DBE我们的DCC方法在两个数据集上都超过了静态策略的效率。此外没有动态bin编码DBE附近bins的概率可能会有很大差异如图5所示这与相邻空间位置应该有相似概率的期望相矛盾。相比之下结合DBE会导致输出热图更加平滑表明通过启用更好地捕获附近位置之间相似性的表示向量解码器训练得到了改进。 特征图选择。特征金字塔 [17] 利用多尺度特征检测不同大小的对象更深层次的特征通常用于检测更大的对象。我们最初的模型受到YOLOX的启发使用P3、P4、P5特征步幅分别为8、16和32像素。然而P3在模型头部占用了78.5%的FLOPs同时占用了10.7%的正确检测。为了提高效率我们专注于P4和P5。如表4所示省略P3可以显著提高速度同时只有很小的精度损失这表明P4和P5足以用于多人姿态估计。这表明P3在检测较小实例方面的作用可以通过其余特征得到充分的补偿。 5、结论 总之我们的RTMO模型在一阶段多人姿态估计中显著提高了速度与精度之间的权衡。通过在基于YOLO的框架中集成坐标分类我们实现了实时处理和高精度。我们的方法具有动态坐标分类器和基于最大似然估计的损失函数有效提高了密集预测模型中的位置精度。这一突破不仅增强了姿态估计而且为视觉检测任务密集预测范围的未来发展奠定了坚实的基础。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/927193.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

3小时入门Python无人机编程课程 包含4个项目:监控无人机,人脸跟踪飞行和无人机寻线等(2021最新教程)

3小时入门Python无人机编程课程 包含4个项目:监控无人机,人脸跟踪飞行和无人机寻线等(2021最新教程)资料: https://www.youtube.com/watch?v=LmEcyQnfpDA https://www.bilibili.com/video/BV12X4y1T7WD/https://w…

网站开发用到的虚拟机有哪些商城展示网站建设

轻量可靠的小程序UI组件库,主流移动组件库 Vant 的微信小程序版本。Vant Weapp 和 Vant 的区别之前推荐过的移动端web组件库 Vant 是 Vue.js 版本的,其对内承载了有赞所有核心业务,对外有十多万开发者在使用,一直是业界主流的移动…

CopilotKit

CopilotKit https://docs.copilotkit.ai/ https://github.com/copilotkit/copilotkitWhat is CopilotKit?CopilotKit is the easiest way to add AI copilots - intelligent, context-aware assistants - into your a…

站群系统源码怎么看一个网站是什么时候做的

背景: 项目升级,引入MySQL数据库,之前一直用的是Oracle数据,在做用户登录单位维护的时候,需要返回该用户所属单位下的所有子单位。下边是模拟项目数据实践的过程。 数据准备: 准备一张单位表&#xff0c…

ag-ui

ag-ui https://github.com/ag-ui-protocol/ag-ui?tab=readme-ov-file AG-UI: The Agent-User Interaction Protocol AG-UI is an open, lightweight, event-based protocol that standardizes how AI agents connect …

SCCPC2021重现赛

I Rock Paper Scissors 考场上先看到了 T ≤ 1e3 然后开始质疑贪心算法的正确性。两位队友打完后都WA了,我也没想出来哪有问题,重现赛就放过了这道题。等到下午调题的时候自己打了个贪心交上去,发现 WA on #4 ,输出…

Ros2_control浅析——一个机器人开发通用框架的结构(1)

初学者结合个人理解来讨论一下Ros2_control框架,有错误烦请大佬批评指正。引言: 最近在开发一个送餐机器人,但是在电机和ros2系统交互时犯了难,不知道该怎么写才能让系统架构清晰一些,后来了解到ros2社区有一个规范的…

图的计数问题没做

确实没做。确实没做。

如何设计量子密钥管理系统?——面向后量子时代的密钥管理架构与核心特性探讨

如何设计量子密钥管理系统?——面向后量子时代的密钥管理架构与核心特性探讨2025-10-04 13:41 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-…

沈阳世纪兴网站建设WordPress首页做成插件

文章目录 1.Git简介2.安装Git2.1在Centos上安装git2.2 在ubuntu上安装git 3.创建本地仓库4.配置本地仓库 1.Git简介 Git是一个分布式版本控制系统,用于跟踪和管理文件的更改。它可以记录和存储代码的所有历史版本,并可以方便地进行分支管理、合并代码和协…

11_linux镜像下载

Linux 镜像文件ISO下载地址指南 概述 本文档整理了常用Linux发行版的官方镜像下载地址,方便开发者和系统管理员快速获取所需的Linux系统镜像。 主要Linux发行版下载地址 1. CentOS 官方下载地址:CentOS 7: http://is…

CF2152 Squarepoint Challenge (Codeforces Round 1055, Div. 1 + Div. 2) 游记

$59min$ 开出 $4t$,压线绝杀 E 拿到表现分 $2117$。省流 \(59min\) 开出 \(4t\),压线绝杀 E 拿到表现分 \(2117\)。10.3 内含剧透,请vp后再来。 不是题解!!!!!!! 赛前 国庆之后几天的效率极其低下,只补了三…

完整教程:MindsDB在金融领域的应用:智能风险评估系统

完整教程:MindsDB在金融领域的应用:智能风险评估系统2025-10-04 13:28 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; d…

使用 chrome 调试 android webview 前端 dom script

使用 chrome 调试 android webview 前端 dom script手机连接 USB 调试 chrome 中输入 chrome://inspect 选择对应的设备调试即可桂棹兮兰桨,击空明兮溯流光。

禅城网站建设企业石家庄建站模板源码

有时候我们的目录结构会重新刷新,但是default-active始终保持原来的下标 1.一开始我以为是我给定的属性或者值不对,后来经过一番排查发现根本不是 那我们该如何解决那? 方案1. 通过nextTick去重新赋值方案2. 重写赋值menu方案3. v2和v3都可以…

公司网站开发费怎么入账公司企业邮箱申请流程

文章目录路径总和 I路径总和 II比较简单,就连着一起写了 路径总和 I 注意:一定得走到叶子才算 直接看代码吧,注释也就几行。 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* T…

php学完可以做网站仁怀哪里可以做网站

是的,2023年的java行业如网上说的。 “行业寒冬!!” 后台有粉丝私信我,跟他同期进公司的同事,现在只剩下他自己了,并且每天有很多人来公司面试,很担心自己哪天就被炒了。 程序员就是这样&…

html做成网页aso优化方案

文章目录 1. 定义2. 应用场景3. 代码实现结语 解释器模式(Interpreter Pattern)是一种行为型设计模式,用于定义语言的文法规则,并提供解释器来解释符合规则的语句。解释器模式通过定义语言的文法表示,使得可以解释执行…

株洲营销型网站建设花蝴蝶免费直播视频在线观看

1.1 Calendar类概念 Calendar是日历类,在Date后出现,替换掉了许多Date的方法。该类将所有可能用到的时间信息封装为静态成员变量,方便获取。 Calendar为抽象类,由于语言敏感性,Calendar类在创建对象时并非直接创建&…

框架系统在自然语言处理深度语义分析中的作用、挑战与未来展望 - 实践

框架系统在自然语言处理深度语义分析中的作用、挑战与未来展望 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: &q…