
How To Collect? (High level)
触发采集
- 从我们提供的各种 API 中选择目标网站
- 通过 JSON 或 CSV 更新所需输入列表
- 选择数据交付方式:通过 Webhook 或通过 API
通过 Webhook 交付:
- 选择首选文件格式(JSON、NDJSON、JSON lines、CSV)
- 根据需要设置 Webhook URL 和授权标头
- 选择是否将文件压缩后发送
- 测试 Webhook 以验证操作能否成功运行(使用样本数据)
- 复制代码并运行。

Via Deliver to external storage:
- 选择首选交付平台(S3、Google cloud、Snowflake 或其他可选平台)
- 根据所选交付平台填写所需凭据
- 选择首选文件格式(JSON、NDJSON、JSON lines、CSV)
- 复制代码并运行。

限制记录
在运行发现型 API 时,您可限制每个输入请求返回的结果数量

管理 API

获取快照列表
您可使用此 API 查看快照历史记录。 它可返回所有可用快照的列表,包括快照 ID、创建日期和状态。
监控进度
您可使用此 API 查看数据采集状态。当它返回 “collecting” 时,表明数据仍在采集中,当返回 “digesting” 时表明数据进入处理阶段,当返回 “ready” 时表明数据处理完毕且已可以交付。
系统限制
文件大小
输入 | 高达 1GB |
Webhook 交付 | 高达 1GB |
API 下载 | 最大 5GB(对于更大的文件,请使用 API 交付 ) |
交付 API | 无限制 |