• 4008802488
  • 香港、深圳、广州、海南、吉隆坡、华盛顿、伦敦
cr TC001716、TC006080

跨境头条

人工采集,顾名思义就是运营者通过基本的“复制粘贴”方法去亚马逊平台上采集数据,其一般使用于...

亚马逊商品画像数据的抓取办法——人工采集

港勤集团港勤集团 2024年01月19日 跨境电商亚马逊商品画像数据

人工采集,顾名思义就是运营者通过基本的“复制粘贴”方法去亚马逊平台上采集数据,其一般使用于亚马逊搜索曝光页数据和商品详情页数据。人工采集的好处是无技术门槛,灵巧便利,弊端是效率低下。一般而言,人工采集单个数据的时间为5秒(将亚马逊平台上的数据复制粘贴到表格或者数据库中的时间),一个正常工作8小时的运营者一天能分配的有效数据采集时间为0.5~1小时,取中间值45分钟,那么一天的有效采集数据量为540个数据。如果一个商品需要采集3个维度的数据,例如review数量+排名+价钱,那么540-3=180,即一个运营者一天可以有效跟踪与采集180个商品的数据。

亚马逊商品画像数据的抓取办法——人工采集

如果运营者想要提高单日的人工采集效率,笔者有如下两条建议。

1.明白数据采集的目标,从而通过减少数据采集的频次,最终提高采集效率。例如,如果运营者想要了解一个搜索关键词下不同商品的销量分布规律,即可通过人工采集搜索曝光页前500~1000个商品的销售排名数据来进行估算,而无须采集其他维度的数据,也没有必要每天采集一次数据(因为一个品类/关键词下的销量分布并不会在短时间内产生变化),这样就可以提高数据采集的效率。

2.在难以实现数据全面采集时,可以应用抽样采集的办法来提高采集效率。

例如,如果运营者想要分析某搜索关键词下前100页商品的review、排名、价钱的分布规律,但是自身既没有才能与资金开发爬虫流程,也没有找到合适的工具或者第三方采集器,这时就可以应用抽样采集的办法。在该案例下,运营者可以将前100页的商品设定为100个组,设每页有48个商品,可以差异抽取每组的第8个、第16个、第24个第32个、第40个、第48个的商品,那么每个组就只需采集6次,总共6x100=600次,思考到每次采集涉及review、排名、价钱3个维度,那么总共采集的数据量为600x3=1800个。如果一个数据的采集时间为5秒,那么总采集时间约为2.5小时,1周内即可完成所有数据采集。

微信客服

添加客服微信,获取相关业务资料。

业务咨询

在线咨询

上篇

亚马逊第三方爬虫工具采集

2024年01月19日

4008802488

13823549304

微信客服

微信客服