没有客户定义视图的初始采集:
3 个主要 API 端点在数据采集工作流程中具有不同的用途,可促进高效获取定制数据集的结构化流程。请求采集:
端点:POST
https://api.brightdata.com/datasets/request_collection
参数:
数据集 ID
discover_new
或 url_collection
Array - json
multipart - csv
示例
discover_new
)时,找到所有链接 (PDP) 可能需要一些时间。
查看以上采集的状态:
端点:GET
https://api.brightdata.com/datasets/request_collection
参数:
从先前的 API 获取。
设置数据新鲜度。如果数据在此期限内(例如,请求在 1 周之前采集,5 天前采集),则会发生 0 次新的抓取。
- 1 周: 604,800,000 毫秒
- 1 个月: 2,592,000,000 毫秒
示例
启动采集:
端点:POST
https://api.brightdata.com/datasets/initiate_collection
参数:
您正在查询的采集请求的唯一标识符。
以毫秒为单位的时间,表示所需的数据新鲜度。
以毫秒为单位的时间,表示所需的数据新鲜度。
示例
定义视图后的采集:
启动采集:
端点:POST
https://api.brightdata.com/datasets/initiate
参数:
discover_new
或 url_collection
Array - json
multipart - csv
示例