使用豆包多模态API(doubao-seed-1-8模型)分析小红书视频内容pyhton代码

爬虫任务

有一个爬取小红书上视频内容并且分析的任务,下面是一个简单可以运行的demo。

注意加载环境变量,这里的.env表示读取相同路径下.env里面的ARK_API_KEY

import os from volcenginesdkarkruntime import Ark from dotenv import load_dotenv # 加载环境变量 env_path=os.path.join(os.path.dirname(__file__),'.env')load_dotenv(env_path)# 初始化豆包客户端 client=Ark(base_url='https://ark.cn-beijing.volces.com/api/v3',api_key=os.getenv('ARK_API_KEY'),)# 测试视频URL video_url="http://sns-video-hs.xhscdn.com/stream/1/110/259/01e95ce6da070f66010370039b92e65e08_259.mp4"response=client.responses.create(model="doubao-seed-1-8-251228",input=[{"role":"user","content":[{"type":"input_video","video_url":video_url,"fps":1},{"type":"input_text","text":"请详细描述这个视频的内容。"}],}])print("="*80)print("响应对象类型:",type(response))print("="*80)print("\n响应对象属性:")forattr indir(response):ifnot attr.startswith('_'):try:value=getattr(response,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passprint("\n"+"="*80)print("response.output 结构:")print("="*80)ifhasattr(response,'output')and response.output:print(f"output 类型: {type(response.output)}")print(f"output 长度: {len(response.output)}")fori,item inenumerate(response.output):print(f"\noutput[{i}] 类型: {type(item)}")print(f"output[{i}] 属性:")forattr indir(item):ifnot attr.startswith('_'):try:value=getattr(item,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passifhasattr(item,'content')and item.content:print(f"\n content 类型: {type(item.content)}")print(f" content 长度: {len(item.content)}")forj,content_item inenumerate(item.content):print(f"\n content[{j}] 类型: {type(content_item)}")print(f" content[{j}] 属性:")forattr indir(content_item):ifnot attr.startswith('_'):try:value=getattr(content_item,attr)ifnotcallable(value):print(f" {attr}: {type(value).__name__} = {value}")except:passelse:print("response.output 为空或不存在")print("\n"+"="*80)print("尝试提取文本:")print("="*80)try:ifresponse.output andlen(response.output)>0:output_msg=response.output[0]ifhasattr(output_msg,'content')and output_msg.content:forcontent in output_msg.content:ifhasattr(content,'text'):print(f"找到文本: {content.text[:200]}...")breakexcept Exception as e:print(f"提取失败: {e}")

提取的内容为:

output[1] 类型: <class ‘volcenginesdkarkruntime.types.responses.response_output_message.ResponseOutputMessage’>
output[1] 属性:
content: list = [ResponseOutputText(type=‘output_text’, text=‘这个视频是小红书平台的趣味内容,围绕“图书馆的桌子怎么搬进来”展开,内容分段如下:\n\n0-4秒:画面呈现图书馆学习区域,前景是摆满学习用品的桌面——写有笔记的本子、黄色边框平板、咖啡杯、卡通图案笔筒、白色鼠标等,背景有一位女生在整理物品;配文和顶部标题接连抛出疑问:“你们说图书馆这么多张桌子”“真的是一张一张搬进来的吗?”“图书馆这么多桌子咋搬进来的”。\n\n5-6秒:切换到评论区,展示第一条网友评论:“不学你就回宿舍”,发布地为山东,获2091个赞,可展开81条回复,下方同步配有对应字幕。\n\n7-9秒:展示第二条评论:“不想学把手机电脑平板充满电就回宿舍吧”(附带彩虹表情),发布地为上海,获5.4万赞,可展开625条回复;中间插入吐舌头的猫猫表情包,配文字“嘿嘿嘿”,呼应评论的调侃语气。\n\n10-13秒:展示第三条评论:“宿舍门这么小 床又是怎么搬进来的”(搭配带问号的白色小人表情包),发布地为广东,获2164个赞;下方还有一条搞笑回复:“床小时候搬进来的”,延续趣味调侃的风格。\n\n14-17秒:展示第四条评论:“搬一个,然后啃臭加v啃臭加c复制粘贴”,是电脑快捷键“Ctrl+C、Ctrl+V”的谐音梗,发布地为湖北,获2442个赞,可展开46条回复;最后画面是两个紧挨的仓鼠脸表情包,右上角配有红色问号图案,为视频收尾,强化搞笑氛围。\n\n整个视频通过“提出疑问+展示神评论”的形式,借网友的幽默回复制造笑点,风格轻松有趣。’, annotations=None)]
id: str = msg_02176839283688100000000000000000000ffffac1531daa551d8
model_computed_fields: dict = {}
model_config: dict = {‘extra’: ‘allow’, ‘defer_build’: True, ‘protected_namespaces’: ()}
model_extra: dict = {}

后记

2026年1月14日于上海,周三。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1161071.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

国产AI眼镜量产,产学研合作落地,英伟达升级平台,谷歌沃尔沃车载协同

Rokid Style AI眼镜启动全球量产&#xff0c;299美元定价加速全民普及 国内智能硬件企业 Rokid 宣布旗下具身交互入口产品 Rokid Style AI 眼镜正式启动全球量产&#xff0c;首批产品将于 2026 年 2 月登陆欧美及东南亚市场&#xff0c;入门款定价 299 美元&#xff0c;大幅降…

硬核解析:高防 IP 是如何拦截 DDoS 攻击的?从清洗中心到流量调度

在网络安全领域&#xff0c;DDoS 攻击始终是企业业务的“心腹大患”——通过海量虚假流量占用服务器资源&#xff0c;导致正常请求无法响应&#xff0c;小则业务中断&#xff0c;大则造成百万级经济损失。根据 CNCERT 年度报告&#xff0c;2025 年国内 DDoS 攻击峰值已突破 500…

制造业场景人工智能应用分类分级蓝皮书2025

摘要&#xff1a;由工业互联网产业联盟发布&#xff0c;聚焦人工智能与制造业深度融合需求&#xff0c;构建涵盖智能制造生命周期&#xff08;研发设计、生产制造等 6 阶段&#xff09;、制造业系统层级&#xff08;设备层至协同层 5 层级&#xff09;、AI 技术应用&#xff08…

通义千问2.5-7B实战教程:构建多模态问答系统

通义千问2.5-7B实战教程&#xff1a;构建多模态问答系统 1. 引言 随着大模型技术的快速发展&#xff0c;构建具备实际应用能力的智能问答系统已成为AI工程落地的重要方向。Qwen2.5-7B-Instruct作为通义千问系列中性能优异的指令调优语言模型&#xff0c;在知识理解、逻辑推理…

人形机器人行业深度报告:人形机器人海内外竞速,政策护航迈入千亿产业黄金期

摘要&#xff1a;本文聚焦具身智能赋能下的人形机器人产业化浪潮&#xff0c;全面覆盖国内外行业发展格局 —— 海外特斯拉、Figure AI 等头部厂商凭借技术积累推进量产计划&#xff0c;国内依托政策护航&#xff08;《人形机器人创新发展指导意见》等&#xff09;&#xff0c;…

Super Resolution部署指南:系统盘持久化与WebUI配置

Super Resolution部署指南&#xff1a;系统盘持久化与WebUI配置 1. 章节概述 随着图像处理需求的不断增长&#xff0c;传统插值放大技术已难以满足用户对高清画质的追求。AI驱动的超分辨率技术应运而生&#xff0c;成为提升图像质量的核心手段之一。本文将围绕基于OpenCV DNN…

AI基础设施网络展望2026

摘要&#xff1a;本文聚焦 AI 驱动下的网络基础设施变革&#xff0c;全面覆盖网络设备行业核心发展脉络 —— 核心驱动为 AI 催生的数据中心建设热潮&#xff0c;数据中心网络市场预计 2024-2029 年以 30% CAGR 增至 900 亿美元&#xff1b;详解超大规模及二级云服务商主导的资…

IQuest-Coder-V1 vs Claude-3-Opus:代码任务部署成本对比

IQuest-Coder-V1 vs Claude-3-Opus&#xff1a;代码任务部署成本对比 1. 技术选型背景与对比目标 在当前AI驱动的软件工程实践中&#xff0c;大语言模型&#xff08;LLM&#xff09;已成为自动化编码、代码补全、缺陷修复和智能调试的核心工具。随着开发者对模型性能要求的提…

2026年软考从报名到拿证全流程解读,看完不会踩坑!

很多想考软考的小伙伴&#xff0c;是不是都卡在了 “入门第一步”&#xff1f;不知道软考到底是什么、有没有报名资格&#xff0c;也不清楚该怎么准备、什么时候考试&#xff1f;作为已经上岸的学长&#xff0c;今天就把这份整理好的软考全指南分享给大家&#xff0c;从基础认知…

PyTorch 2.9模型安全测试:云端对抗样本生成工具集

PyTorch 2.9模型安全测试&#xff1a;云端对抗样本生成工具集 在AI系统日益普及的今天&#xff0c;模型的安全性正成为安全工程师不可忽视的关键问题。你是否遇到过这样的情况&#xff1a;训练好的图像分类模型&#xff0c;在真实场景中被一张“看起来几乎没变”的图片轻易欺骗…

安达发|钣金冲压厂:APS排程软件如何让金属“乖乖听话”?

走进任何一家钣金冲压车间&#xff0c;你都会看到类似景象&#xff1a;操作员在数控冲床与折弯机间匆忙穿梭&#xff0c;车间主管盯着墙上五颜六色却已过时的进度表打电话催料&#xff0c;模具房里堆满了待切换的模具&#xff0c;而业务部门还在不断追问&#xff1a;“那个急单…

通义千问实时翻译demo:云端GPU加速,延迟低至0.5秒

通义千问实时翻译demo&#xff1a;云端GPU加速&#xff0c;延迟低至0.5秒 你是不是也遇到过这样的情况&#xff1f;视频会议软件产品经理临时接到任务&#xff0c;要在明天的高层汇报中演示AI同声传译功能。本地测试时&#xff0c;翻译延迟高达5秒&#xff0c;说话刚出口&…

汽车维修:技师诊断过程语音记录与知识沉淀

汽车维修&#xff1a;技师诊断过程语音记录与知识沉淀 在汽车后市场服务中&#xff0c;维修技师的经验是企业最宝贵的无形资产。然而&#xff0c;这些经验往往依赖于口耳相传或零散的纸质记录&#xff0c;难以系统化沉淀和复用。随着人工智能技术的发展&#xff0c;尤其是离线…

Fun-ASR支持中英日三语,多语言识别这样设置

Fun-ASR支持中英日三语&#xff0c;多语言识别这样设置 在语音交互日益普及的今天&#xff0c;跨语言识别能力已成为企业级语音系统的核心需求之一。尤其是在全球化协作、跨国客服、多语种会议记录等场景下&#xff0c;单一语言识别已无法满足实际业务需要。Fun-ASR 作为钉钉与…

LCD/LED行李吊钩秤PCBA方案

本文介绍了一种便携式行李吊钩秤的设计与功能&#xff0c;它利用压力传感器采集信号&#xff0c;经由单片机处理后显示物品重量&#xff0c;支持LCD/LED显示&#xff0c;具备去皮称重、单位转换、低压报警等功能&#xff0c;适用于家庭、物流等多种场景。寄快递时经常看到快递员…

DeepSeek-R1-Distill-Qwen-1.5B论文辅助神器:云端1小时1块

DeepSeek-R1-Distill-Qwen-1.5B论文辅助神器&#xff1a;云端1小时1块 你是不是也遇到过这样的情况&#xff1f;研究生写论文写到凌晨两点&#xff0c;文献综述部分卡住了——手头几十篇英文论文看得头晕眼花&#xff0c;想用AI帮忙总结一下&#xff0c;结果实验室的GPU被师兄…

Live Avatar网络配置要求:多机多卡通信带宽评估

Live Avatar网络配置要求&#xff1a;多机多卡通信带宽评估 1. 技术背景与挑战分析 1.1 Live Avatar模型简介 Live Avatar是由阿里巴巴联合多所高校共同开源的实时数字人生成系统&#xff0c;基于14B参数规模的DiT&#xff08;Diffusion Transformer&#xff09;架构实现从音…

CSDN博主亲授:Qwen2.5-7B LoRA微调全流程详细拆解

CSDN博主亲授&#xff1a;Qwen2.5-7B LoRA微调全流程详细拆解 在大模型时代&#xff0c;如何以低成本、高效率的方式让通用预训练模型适配特定业务场景&#xff1f;LoRA&#xff08;Low-Rank Adaptation&#xff09;微调技术正成为开发者手中的利器。本文基于 CSDN 星图镜像广…

新中地学员转行学GIS开发原因盘点(1)

你有没有过那种时刻&#xff1a;明明已经很努力了&#xff0c;结果却不尽如人意&#xff1f;比如考研失利、求职被拒&#xff0c;甚至开始怀疑自己选的专业到底适不适合……其实很多人都经历过这种“卡住”的瞬间&#xff0c;但有些人没有停下&#xff0c;而是悄悄换了赛道。在…

verl实测报告:内存冗余消除带来的性能飞跃

verl实测报告&#xff1a;内存冗余消除带来的性能飞跃 1. verl 介绍 verl 是一个灵活、高效且可用于生产环境的强化学习&#xff08;RL&#xff09;训练框架&#xff0c;专为大型语言模型&#xff08;LLMs&#xff09;的后训练设计。它由字节跳动火山引擎团队开源&#xff0c…