在 Azure OpenAI 上使用 Elastic 优化支出和内容审核

作者:来自 Elastic Muthukumar Paramasivam,Bahubali Shetti 及 Daniela Tzvetkova

我们为 Azure OpenAI 正式发布包添加了更多功能,现在提供内容过滤监控和计费见解的增强!

在之前的博客中,我们展示了如何使用 Elastic 的集成来为托管在 Azure OpenAI 上的模型设置可观测性。我们扩展了集成,现在也包括 Azure OpenAI 的内容过滤和成本分析。如果你之前已经启用了 Azure OpenAI 集成,只需升级它,就能自动获得本博客中讨论的所有新功能。增强后的集成现在提供多个仪表盘,包括通用的 Azure OpenAI 概览、Azure 预配置吞吐单元仪表盘、Azure 内容过滤和 Azure OpenAI 计费仪表盘。

在本博客中,我们将介绍如何使用 Azure OpenAI 内容过滤和跟踪 Azure OpenAI 使用成本。先来回顾这两项 Azure OpenAI 功能能帮你做什么:

Azure OpenAI 内容过滤:增强 AI 安全

Azure OpenAI 的内容过滤在解决 AI 安全挑战中起着关键作用,帮助减轻 AI 模型生成的有害或不适当内容带来的风险。通过实施强大的内容过滤机制,组织可以主动识别并过滤潜在有害内容,比如仇恨言论、错误信息或暴力图像,防止这些内容传播给用户。这有助于防止有害内容扩散,减少对个人和社区的潜在负面影响。

监控 Azure OpenAI 内容过滤对积极应对新出现的内容审核挑战至关重要。通过密切监控系统,企业可以快速发现任何新类型的有害内容或滥用模式。这使组织能够领先应对潜在的内容审核问题,及时采取行动保护用户并维护品牌声誉。

跟踪 Azure OpenAI 使用成本

监控 Azure OpenAI 模型的使用成本对有效管理预算和资源分配至关重要。通过跟踪使用成本,组织可以优化运营,避免不必要的开支,确保从 AI 技术投资中获得最大价值。此外,它有助于预测未来开支,并根据需求调整资源规模,既不影响性能,也避免产生过高费用。有效的监控还提高了透明度和问责制,促进在 Azure 环境内更好地进行 AI 部署和利用的决策。

在本博客中,我们将为你提供设置和使用这两项功能预配置仪表盘的前置条件,这些功能都是 Azure OpenAI 集成的一部分。

前置条件

为了跟随本博客,你需要:

  1. 设置并安装 Azure 计费集成以监控使用成本。安装集成后,你可以在增强的 Azure OpenAI 计费仪表盘中跟踪使用情况。

  2. 确保已启用 Azure API 管理服务,以访问 Azure OpenAI 模型。

如何使用 Azure API 管理配合 Azure OpenAI:

  • 预配 Azure OpenAI 资源:创建一个 Azure OpenAI 资源,并为你的应用选择模型。

  • 创建 API 管理实例:建立一个 Azure API 管理实例来管理 Azure OpenAI API。

  • 导入 Azure OpenAI API:使用 OpenAPI 规范将 Azure OpenAI API 导入到你的 API 管理实例中。

  • 配置策略:在 API 管理中实施策略以管理请求认证、速率限制、流量控制等。

为 Azure OpenAI 创建内容过滤器的步骤

在设置内容过滤的可观测性之前,确保你已经为模型配置了 Azure 内容过滤。按照以下步骤创建 Azure OpenAI 内容过滤器:

  1. 访问 Azure OpenAI 服务控制台:
    使用具有相应权限的账号登录 Azure 控制台,进入 Azure OpenAI 服务控制台。

  2. 导航到 安全与防护(Safety + security):
    从左侧菜单选择 Safety + security

  3. 创建新的内容过滤器:

    • 选择 Safety + security
    •  配置各种内容过滤策略,包括:
      • 设置输入过滤器:内容将按类别标注,并根据你为提示设置的阈值进行阻止。
      • 设置输出过滤器:内容将按类别标注,并根据你为响应输出设置的阈值进行阻止。
      • 阻止列表(Blocklists):定义需要屏蔽的特定词语或短语。
      • 部署(Deployments):将过滤器应用于模型部署。
  4. 审核并创建:
    审核你的设置,选择 Create 以完成内容过滤器配置。

客户还可以配置内容过滤器并创建定制的安全策略,以满足其具体使用需求。该配置功能允许客户分别针对提示(prompts)和完成内容(completions)调整设置,在不同严重级别下过滤每个内容类别。

内容过滤器类型

  • 内容过滤类别包括:
    • (仇恨、性相关、暴力、自残)
    • 其他可选的分类模型用于检测越狱风险和已知的文本及代码内容。
  • 每个内容过滤类别内的严重级别:
    • (低、中、高)
    • 被检测为“安全”级别的内容会被标注,但不进行过滤,且该级别不可配置。

了解 Azure OpenAI 内容过滤的预配置仪表盘

设置好过滤器后,你可以通过 Azure OpenAI 内容过滤仪表盘在 Elastic 中查看被过滤的内容。

操作步骤:

  1. 进入仪表盘菜单 — 在 Elastic 中选择 Dashboard 菜单选项,搜索  [Azure OpenAI] Content Filtering Overview,打开仪表盘。

  2. 进入集成菜单 — 在 Elastic 中打开 Integrations 菜单,选择 Azure OpenAI,进入 Assets 标签页,从仪表盘资产中选择 [Azure OpenAI] Content Filtering Overview

Elastic 集成中的 Azure OpenAI 内容过滤概览仪表盘提供了对被阻止请求、API 延迟和错误率的洞察。该仪表盘还详细展示了内容过滤策略过滤的内容细分情况。

内容过滤概览

当内容过滤系统检测到有害内容时,如果提示被判定为不合适,API 调用会返回错误;或者响应中的 finish_reason 会显示为 content_filter,表示部分完成内容被过滤。

总结如下:

  • 提示过滤(Prompt filters):被分类为过滤类别的提示内容会返回 HTTP 400 错误。

  • 非流式完成(Non-streaming completion):当内容被过滤时,非流式完成调用不会返回任何内容。少数情况下,较长响应可能返回部分结果,此时 finish_reason 会被更新。

  • 流式完成(Streaming completion):流式完成调用会边生成边返回内容。服务会持续流式传输,直到遇到停止标记、达到长度限制,或检测到被分类为过滤类别且达到严重级别的内容。

被屏蔽内容的提示和响应

该仪表盘部分显示了原始的 LLM 提示、来自各种来源(API 调用、应用程序或聊天界面)的输入,以及相应的完成响应。下方面板展示了应用内容过滤策略后,对提示和完成内容的响应情况。

你可以使用以下代码片段将当前的提示和设置集成到你的应用中,以测试内容过滤器:

chat_prompt = [{"role": "user","content": "How to kill a mocking bird?"}
]

运行代码后,你会发现内容被按照 violence 类别 和 medium 严重级别过滤。

按内容来源(输入和输出)过滤的内容

内容过滤系统根据严重级别帮助监控和审核不同类别的内容。这些类别通常包括成人内容、冒犯性语言、仇恨言论、暴力等。严重级别表示内容的敏感程度或潜在危害程度。此面板帮助用户有效监控并过滤不当或有害内容,从而维护安全的环境。

这些指标可以分为以下几类:

  • 按类别统计的被阻止请求:提供每个类别下被阻止请求的总量洞察。

  • 各类别的严重级别分布:监控按类别和严重级别(低、中、高)划分的被阻止请求情况。

  • 被过滤的内容类别:提供随时间推移的内容过滤类别趋势洞察。

查看 Azure OpenAI 计费仪表盘

你现在可以查看在 Azure OpenAI 上的花费情况。

以下是你在该仪表盘上可以看到的内容:

  • 总成本:衡量所有模型部署的总使用成本。

  • 按模型的总体使用情况:跟踪按模型划分的总使用成本。

  • 每日使用情况:按天监控使用成本。

  • 按模型的每日使用成本:按模型部署划分监控每日使用成本。

结论

Azure OpenAI 集成可以帮助你轻松收集为基于 LLM 的应用准备的一组精选指标和日志,包括经过内容过滤的响应。它配有开箱即用的仪表盘,你也可以根据具体需求进行自定义。

在 Elasticsearch Service 上部署一个集群或下载 Elastic Stack,启动全新的 Azure OpenAI 集成,在 Kibana 中打开精选仪表盘,开始监控你的 Azure OpenAI 服务吧!

原文:Optimizing Spend and Content Moderation on Azure OpenAI with Elastic — Elastic Observability Labs

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/80868.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

iOS解码实现

import Foundation import VideoToolboxclass KFVideoDecoderInputPacket {var sampleBuffer: CMSampleBuffer? }class KFVideoDecoder {// MARK: - 常量private let kDecoderRetrySessionMaxCount 5private let kDecoderDecodeFrameFailedMaxCount 20// MARK: - 回调var pi…

Redis应用--缓存

目录 一、什么是缓存 1.1 二八定律 二、使用Redis作为缓存 三、缓存的更新策略 3.1 定期更新 3.2 实时生成 四、缓存预热、缓存穿透、缓存雪崩和缓存击穿 4.1 缓存预热 4.2 缓存穿透 4.3 缓存雪崩 4.4 缓存击穿 一、什么是缓存 缓存(cache)是计算机的一个经典的概念…

Unity 喷烟喷气特效:喷快消失慢

快速喷气缓慢消失同时播放3*3序列帧动画。常用在火车烟囱特效、气体释放、摔倒、等效果中,可变种应用场景较多。 下列为Particle System参数: Color over Lifetime参数: UnityEditor.GradientWrapperJSON:{"gradient":{"ser…

关于收集 Android Telephony 网络信息的设计思考2

需求: 目标1: Android Telephony data(数据模块)侧收集多源(ServiceStateTracker/ImsService/其他)网络状态信息。目标2: 收集的数据需统一上报/存储到外部App的Provider。字段分散,不方便只在ServiceStateTracker中收集和插入。多触发点/多场景,需要统一插入。一、架构…

Elasticsearch 深入分析三种分页查询【Elasticsearch 深度分页】

前言: 在前面的 Elasticsearch 系列文章中,分享了 Elasticsearch 的各种查询,分页查询也分享过,本篇将再次对 Elasticsearch 分页查询进行专题分析,“深度分页” 这个名词对于我们来说是一个非常常见的业务场景&#…

CodeBuddy(腾讯云代码助手)最新功能——智能体 Craft 体验

文章目录 📋 前言🎯 关于智能体 Craft🎯 智能体 Craft 体验🧩 安装方法🧩 如何使用🧩 Craft 初体验🧩 Craft 生成代码效果体验 📝最后 📋 前言 CodeBuddy(腾讯…

05 接口自动化-框架封装思想建立之httprunner框架(中)

文章目录 一、httprunner常规的关键字详解httprunner测试用例的结构简化: 二、httpruner接口自动化项目架构三、环境变量四、代码项目框架如下图:api/wx_get_token.ymlapi/wx_get_tag.ymltestcases/wx_get_tag.ymltestsuites/wx_get_tag.yml.env 一、htt…

LabVIEW中EtherCAT从站拓扑离线创建及信息查询

该 VI 主要用于演示如何离线创建 EtherCAT 从站拓扑结构,并查询从站相关信息。EtherCAT(以太网控制自动化技术)是基于以太网的实时工业通信协议,凭借其高速、高效的特性在自动化领域广泛应用。与其他常见工业通讯协议相比&#xf…

java的synchronized 原理及功能

简介: Java中的synchronized关键字是一种同步机制,用于控制多个线程对共享资源的访问。 原理: 在Java锁有一个内部锁 Intrinsic Lock,也称为监视器锁或管程锁,每个Java对象都有一个关联的监视器锁,隐式锁…

HarmonyOS NEXT端云一体化工程目录结构

视频课程学习报名入口:HarmonyOS NEXT端云一体化开发 端云一体化开发工程由端开发工程(Application)和云开发工程(CloudProgram)两大核心模块构成。 1)端开发工程目录结构 端开发工程主要用于开发应用端侧的业务代码,通用云开发模板的端开发工程目录结构如下图所示: …

普通用户的服务器连接与模型部署相关记录

普通用户的服务器连接与模型部署相关记录 一、从登录到使用自己的conda 1.账号登陆: ssh xxx172.31.226.236 2.下载与安装conda: 下载conda: wget -c https://repo.anaconda.com/archive/Anaconda3-2023.03-1-Linux-x86_64.sh 安装con…

亲测有效!OGG 创建抽取进程报错 OGG-08241,如何解决?

前言 今天在测试 OGG 一个功能的时候,需要重新初始化 oggca,所以重装了一下 OGG。重建完之后重新添加抽取进程报错,一直无法添加成功: 经过一翻分析,找到了解决方案,本文记录一下解决过程。 问题描述 OG…

Docker构建 Dify 应用定时任务助手

概述 Dify 定时任务管理工具是一个基于 GitHub Actions 的自动化解决方案,用于实现 Dify Workflow 的定时执行和状态监控。无需再为缺乏定时任务支持而感到困扰,本工具可以帮助设置自动执行任务并获取实时通知,优化你的工作效率。 注意&…

ubuntu24.04+RTX5090D 显卡驱动安装

初步准备 Ubuntu默认内核太旧,用mainline工具安装新版: sudo add-apt-repository ppa:cappelikan/ppa sudo apt update && sudo apt full-upgrade sudo apt install -y mainline mainline list # 查看可用内核列表 mainline install 6.13 # 安装…

网络爬虫(Web Crawler)详解

网络爬虫(Web Crawler)详解 1. 基本概念与核心目标 定义: 网络爬虫是一种自动化的程序,通过HTTP协议访问网页,提取并存储数据(如文本、链接、图片),并根据策略递归访问新链接。核心目标: 数据采集:抓取特定网站或全网公开数据。索引构建:为搜索引擎提供页面内容(如…

大模型如何助力数学可视化?

大家好,我是 i 学习的老章 在数学学习和教学中,将抽象概念可视化对于理解至关重要。Manim 是一个强大的数学动画引擎,由著名数学科普视频作者 3Blue1Brown 开发并广为人知。 老章较早之前就介绍过 manim:B 站上爆红的数学视频&a…

Oracle基础知识(二)

目录 1.聚合函数 2.COUNT(1)&COUNT(*)&COUNT(字段)区别(面试常问) 3.分组聚合——group by 4.去重:DISTINCT 、GROUP BY 5.聚合函数的过滤HAVING 6.oracle中having与where的区别 (面试常问) 7.ROUND与TRUNC函数 8.ROLLUP上卷…

DTAS 3D多约束装配助力悬架公差分析尺寸链计算:麦弗逊/双叉臂/多连杆/H臂一网打尽

摘要:汽车四轮定位参数与悬架密切相关。汽车悬架对于车辆的行驶性能、安全性和舒适性至关重要。DTAS 3D提供了各类型悬架的公差仿真分析方法。 关键字:DTAS 3D、前后悬架、公差仿真分析、 运动耦合 一、悬架公差分析综述 悬架是车身(或车架…

Serverless爬虫架构揭秘:动态IP、冷启动与成本优化

一、问题背景:旧技术的瓶颈 在传统爬虫架构中,我们通常部署任务在本地机器或虚拟机中,搭配定时器调度任务。虽然这种方式简单,但存在以下明显缺陷: 固定IP易被封禁:目标网站如拼多多会通过IP频率监控限制…

设备预测性维护的停机时间革命:中讯烛龙如何用AI重构工业设备管理范式

在工业4.0的智能化浪潮中,非计划停机每年吞噬企业3%-8%的产值。中讯烛龙预测性维护系统通过多模态感知矩阵分布式智能体的创新架构,实现设备健康管理的范式跃迁,帮助制造企业将停机时间压缩70%以上。本文将深度解析技术实现路径与行业级实践方…