Py thon是一门 有条理 的和 强 大的 面 向对 象的程 序 设计语言, 由 于Py thon 有很多与数据抓 取强大的第三 方工 具 库, 所 以是数 据 抓取 方面 的主要语言。其 中 , 常用 的 工 具 库 有 以 下几 种。
( 1) Requ es t库。自动爬 取 H T ML 页 面, 自动 网络请求提交。
( 2 ) B e a ti ful Soup库。解析 HT M L页面, 提取 页面信 息。
(3) R e库。正 则表达式 库, 提取 页面关键信息
提 供 相 关 细 节 ,「 资 料 分 享 已 经 使 零 售 世 界 演 化 了 」 ,并 且 「 好 的 产 品 资 讯 是 购 买 决 策 过 程 中 最 关 键 的 部 份 」 ,如 尺 码 、颜 色 及 存 货 状 态 等 ,都 是 必 需 提 供 消 费 者的基本资讯。