1. 项目概述
最近在运营自媒体账号时,我发现小红书平台的爆款视频数据对内容创作有重要参考价值。但手动收集整理这些数据耗时耗力,于是尝试用Coze平台搭建了一个自动化工作流,实现小红书热门视频抓取并自动写入飞书多维表。这个方案运行一个月来,每天能稳定采集200+条优质视频数据,极大提升了我的选题效率。
Coze作为新一代AI应用平台,其工作流功能特别适合这类需要结合多个API服务的自动化任务。相比传统爬虫开发,用Coze搭建这类工具的技术门槛更低,且维护成本几乎为零。下面我就详细拆解这个工作流的实现过程,包括核心设计思路、具体配置步骤以及实际使用中的避坑经验。
2. Coze平台核心能力解析
2.1 为什么选择Coze
在对比多个AI平台后,我最终选择Coze主要基于三个考量:
- 可视化工作流:通过拖拽节点就能完成复杂逻辑编排,不需要编写完整代码
- 丰富插件生态:内置小红书、飞书等常用平台的官方插件,省去API对接工作
- 免费额度充足:个人开发者每月有足够免费的调用次数,完全满足日常需求
2.2 工作流的核心设计
这个自动化采集系统需要解决三个关键问题:
- 数据获取:从小红书获取指定话题下的热门视频列表
- 数据处理:提取视频标题、点赞数、作者等关键信息
- 数据存储:将结构化数据写入飞书多维表格方便分析
对应的工作流设计如下:
code复制开始 → 获取小红书列表 → 解析笔记ID → 批量获取详情 → 提取关键字段 → 写入飞书表格
3. 详细配置步骤
3.1 前期准备工作
3.1.1 飞书多维表配置
- 在飞书文档新建一个多维表格
- 设计字段结构(建议包含以下列):
- 视频标题(文本)
- 作者名称(文本)
- 点赞数(数字)
- 收藏数(数字)
- 视频链接(URL)
- 发布时间(日期)
3.1.2 获取必要凭证
- 小红书Cookie:登录网页版小红书后,通过浏览器开发者工具获取(具体步骤见注意事项)
- 飞书权限:在飞书开发者后台创建应用,获取App ID和App Secret
重要提示:小红书Cookie有效期约7天,需要定期更新。建议设置日历提醒。
3.2 工作流节点配置
3.2.1 初始参数设置
在开始节点添加以下输入参数:
- 搜索关键词(如"美妆教程")
- 最大采集数量(建议50-100条)
- 排序方式(最新/最热)
3.2.2 小红书插件配置
- 添加"小红书搜索"插件节点
- 配置参数:
- 关键词:绑定开始节点的输入参数
- 排序方式:选择"综合排序"
- Cookie:填入获取的cookie值
3.2.3 数据解析节点
使用JavaScript代码节点处理原始数据:
javascript复制// 示例:提取笔记基础信息
function extractNoteData(notes) {
return notes.map(note => ({
id: note.id,
title: note.title,
author: note.user.nickname
}));
}
3.2.4 批量处理详情
- 添加"批处理"节点提高效率
- 设置并发数为5(过高可能触发反爬)
- 对每个笔记ID调用"小红书笔记详情"插件
3.2.5 飞书写入配置
- 添加"飞书多维表格"节点
- 配置字段映射关系:
- 表格ID:飞书表格的URL中获取
- 字段映射:将JS对象属性对应到表格列
4. 实战经验与优化建议
4.1 性能优化技巧
- 请求间隔:在批处理节点间添加200-500ms延迟
- 错误重试:对失败请求设置自动重试(最多3次)
- 数据去重:在写入前检查飞表是否已存在相同ID记录
4.2 常见问题解决
-
Cookie失效:
- 现象:突然返回空数据
- 解决:重新获取并更新工作流中的Cookie值
-
频率限制:
- 现象:返回403错误
- 解决:降低并发数,增加请求间隔
-
字段缺失:
- 现象:某些视频缺少预期字段
- 解决:在JS代码中添加默认值处理逻辑
4.3 进阶扩展思路
- 定时触发:设置每天凌晨自动执行
- 数据增强:对接情感分析API标注内容倾向
- 自动预警:当发现爆款模版时发送飞书通知
这个方案我已经稳定运行3个月,累计采集了1.2w+条视频数据。实际使用中发现,配合飞书多维表格的筛选和统计功能,能快速发现近期热门的内容形式和话题走向。对于自媒体运营者来说,这种自动化工具能节省至少60%的选题时间。