LangSmith Evaluation 深度解析:构建数据驱动的模型优化体系 关键词:模型评估体系、自动化测试框架、业务指标对齐、A/B测试集成、生产级质量监控 1. Evaluation 核心功能全景 1.1 评估维度矩阵 维度评估指标示例采集方式质量评估准确率、相关性评分、事实性检查人工标注+AI评分性能评估响应延迟、Token消耗、吞吐量系统自动采集成本评估单次调用成本、ROI分析计费数据集成安全评估敏感内容检出率、合规性评分规则引擎+模型检测 1.2 评估流程架构