AI 智能体与 Coze 工作流实践:小红书对标账号采集 - 实践

news/2025/9/20 18:50:23/文章来源:https://www.cnblogs.com/wzzkaifa/p/19102728

一、工作流核心功能与设计思路

(一)核心功能

本 Coze 工作流聚焦小红书平台数据采集需求,之前又一篇依据关键字采集,

AI 智能体与 Coze 工作流实践:小红书借助关键词集采-CSDN博客

这里通过对标账号, “主页url - 列表获取 - 详情提取 - 数据存储” 的全流程自动化设计,实现小红书笔记内容及核心数据的高效抓取。

(二)设计思路

本工作流遵循 “简洁高效、可追溯、易复用” 的设计原则,整体流程分为 5 个核心环节,形成闭环式数据采集链路,具体逻辑如下

  1. 启动触发:开始节点参数安装

    以 “主页url” 为启动条件,利用配置核心参数(Cookie、主页url、飞书链接),为后续采集行为奠定基础。其中,Cookie 确保访问小红书平台的合法性,用户主页定义采集范围,飞书链接指定数据最终存储位置,三者缺一不可;

  2. 范围筛选:用户主页搜索笔记列表:以主页url为核心搜索条件,结合 “查询总数、笔记类型、排序方式” 等辅助参数,精准筛选目标笔记,生成包含笔记 URL 的列表。此环节可根据需求灵活调整筛选规则。
  3. 批量处理:循环提取笔记详情
    针对上一环节生成的 URL 列表,凭借循环节点逐一发起请求,获取单条笔记的全维度数据(作者信息、互动数据、内容信息等)。同时,对原始数据进行格式整理,将分散的字段整合为统一数组,确保数据结构规范,为后续存储做好准备。
  4. 数据沉淀:同步写入飞书表格

    利用飞书表格的 API 接口,将整理后的数组数据批量写入指定表格,每个字段对应表格的一列(如 “笔记标题”“点赞数量” 分别对应独立列),实现内容的结构化存储。飞书表格的协同特性还支持多人实时查看、编辑数据,提升团队协作效率

  5. 结束,输出内容

    结束节点,打印输出,便于跟踪执行情况。

整体流程如下:

图片

二、工作流详细搭建步骤

步骤1:创建“开始”节点,配置输入参数

  • 节点作用

    设定工作流启动的必要条件,接收用户输入的用户主页url;

  • cookie获取

    小红书cookie的获取方式如下,pc打开个人主页,打开调试模式,选择网络,查看对应的选项,如下图

    图片

  • 飞书表格链接获取

    操作步骤:

    ① 登录飞书账号,新建空白表格,或打开已有的目标表格;

    ② 点击表格右上角 “分享” 按钮,选择 “获取链接”,设置权限为 “

    互联网获得链接的人可编辑”(确保工作流能正常写入数据);

    ③ 复制生成的链接,粘贴至 “开始” 节点的 “feishu” 参数中

  • 开始节点参数设置
    • cookie:访问小红书的cookie;

    • userProfileUrl:用户主页地址;

    • feishu: 用于存储信息的飞书链接

图片

步骤2:创建 “搜索笔记” 节点,获取目标笔记 URL 列表

  • 节点作用
    根据 “开始” 节点传入的用户主页url及部署的筛选条件,向小红书平台发起搜索请求,获取符合条件的笔记列表,并提取列表中所有笔记的 URL,为后续 “循环获取详情” 环节提供数据源参数说明如下:
    • cookie:访问小红书的cookie;

    • userProfileUrl:开始节点的用户主页地址;

      图片

      步骤3:创建 “循环 - 提取 - 存储” 节点组,达成素材采集

      • 节点作用
        工作流的核心执行部分,通过 “循环处理 URL→提取笔记详情→整理数据格式→写入飞书表格” 的四步操作,实现批量数据的自动化采集与存储。参数说明如下:就是本环节
        • cookieStr:访问小红书的cookie;

        • noteUrl:笔记url

      返回的字段有:

      "作者头像":node.auther_avatar,

      图片

        • 节点作用
          把数据整理成数组

        图片

        把数组数据添加到飞书表格

        图片

        整个获取笔记列表,获取详情,写入飞书流程如下

        图片

        写入飞书的内容示例

        图片

        步骤4:添加“结束”节点,返回最终结果

        • 节点作用

          将获取到的笔记数据返回给用户;

        • 输出类型

        图片

        四、总结

        本Coze工作流通过对标账号url搜索获取小红书的列表和详情,方便了小红书数据的采集,对于笔记分析和修改,能够节省大量的工作流,存入飞书之后,想再二次创作,或者发不到平台也很方便。

        1. 使用注意:
        2. Cookie 维护:定期(每 7-10 天)更新小红书 Cookie,避免因 Cookie 过期导致工作流执行失败;建议保存 2-3 个备用账号的 Cookie,若当前账号被限制,可切换使用。
        1. 采集频率控制:为避免触发小红书平台的反爬机制,建议单次工作流执行间隔不低于 30 分钟,单日采集总量不超过 500 条笔记

        本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/908500.shtml

        如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

        相关文章

        在Linux中设定账户密码的安全性策略

        在Linux环境下,确保账户密码的安全性是保护系统安全的重要环节。要设置强健的密码策略,需要从多个层面制定规则,这些包括密码复杂性、长度、有效期限、历史记录限制和尝试次数限制等方面。 密码复杂性设定和管理:密…

        对比六种JavaScript全文搜索库 fuse.js 、 lunr 、 flexsearch 、 minisearch 、 search-index 、 js-sea

        以下是针对六种JavaScript全文搜索库的对比分析,综合功能特性、性能表现及适用场景: 核心特性对比‌Fuse.js‌‌算法‌:基于Bitap算法的模糊搜索,支持拼写容错和多种匹配模式(前缀、后缀、逻辑组合等)7。 ‌配置…

        精选 4 款基于 .NET 开源、功能强大的 Windows 系统优化工具,助力轻松提升 Windows 系统性能与使用体验!

        前言 今天大姚给大家推荐 4 款基于 .NET 开源、功能强大的 Windows 系统优化工具,希望可以帮助你轻松提升 Windows 系统性能与使用体验。 Optimizer Optimizer 是一款基于 .NET 开源(GPL-3.0 license)、功能强大的 …

        从零开始: c#纯代码实现完整Json解析器的全过程及注释与自定义格式的支持实现

        从零开始: c#纯代码实现完整Json解析器的全过程及注释与自定义格式的支持实现大家好!我们要深入探讨一个非常常用的技术:JSON反序列化。别小看这个技术,它可是现代编程中不可或缺的一部。JSON解析不仅仅是简单的数据…

        MySQL 32 为什么还有kill不掉的语句?

        MySQL有两个kill命令:kill query+线程id,表示终止该线程正在执行的语句;kill (connection)+线程id,表示断开这个线程的连接,如果线程有语句正在执行,会先停止正在执行的语句。有时候可能会遇到:使用了kill,却没…

        Axure RP 9 Mac 交互原型设计 - 实践

        Axure RP 9 Mac 交互原型设计 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monac…

        Ceph IO流程分段上传(1)——InitMultipart - 指南

        pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

        第9章 Prompt提示词设计 - 指南

        pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

        详解Spring Boot DevTools - 指南

        pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

        深入解析:rook-ceph自定义添加osd流程

        深入解析:rook-ceph自定义添加osd流程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mon…

        1789:算24

        题目 总时间限制: 3000ms 内存限制: 65536kB 描述 给出4个小于10个正整数,你可以使用加减乘除4种运算以及括号把这4个数连接起来得到一个表达式。现在的问题是,是否存在一种方式使得得到的表达式的结果等于24。 这里…

        Proxy 库解析(二)

        refl meta template <bool IsDirect, class R> struct refl_meta {template <class P>requires(IsDirect)constexpr explicit refl_meta(std::in_place_type_t<P>): reflector(std::in_place_type&l…

        【Python3教程】Python3高级篇之JSON材料解析

        【Python3教程】Python3高级篇之JSON材料解析2025-09-20 18:04 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: b…

        大模型服务之下的新旧政务智能系统比较 - 指南

        pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

        流行的 3D 文件格式及其用途指南

        了解 3D 文件格式的重要性 三维 (3D) 技术的市场既广泛又复杂,应用范围从电影后期制作和产品原型制作到虚拟现实 (VR) 和增强现实 (AR) 游戏。该技术各种用例不可或缺的一部分是 3D 文件格式,它决定了 3D 数据…

        CentOS7.9上安装MySQL8.4

        CentOS 7 已在 2024 年 6 月 30 日结束生命周期 (EOL),官方源已停止维护! CentOS 7 已在 2024 年 6 月 30 日结束生命周期 (EOL),官方源已停止维护! CentOS 7 已在 2024 年 6 月 30 日结束生命周期 (EOL),官方源已…

        铁头山羊stm32-HAL库 - 实践

        铁头山羊stm32-HAL库 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco",…

        IDEA编译Maven任务后target目录没有class

        pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

        2025CSP-S初赛游记

        哈哈,在致知楼(逆天诡异滏阳楼)考的。

        JBoltAI框架:企业级AI开发的革新路径与行业实践 - 那年-冬季

        JBoltAI框架:企业级AI开发的革新路径与行业实践在人工智能与产业深度融合的当下,企业级AI开发框架正成为推动智能化转型的关键基础设施。JBoltAI作为面向Java技术生态的智能开发框架,通过模块化架构设计与多模型适配…