会员
精通Scrapy网络爬虫
刘硕更新时间:2020-11-28 14:59:54
最新章节:本书特点:开会员,本书免费读 >
本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
精通Scrapy网络爬虫最新章节
查看全部- 本书特点:
- 作者简介:
- 14.4 本章小结
- 14.3 使用scrapy-redis进行分布式爬取
- 14.2 scrapy-redis源码分析
- 14.1 Redis的使用
- 第14章 分布式爬取
- 13.6 本章小结
- 13.5 项目实战:爬取豆瓣电影信息
- 13.4 实现随机代理
刘硕
主页
同类热门书
最新上架
- 会员
细说Python编程:从入门到科学计算
《细说Python编程:从入门到科学计算》以Python3.x为平台,由两位博士执笔,详尽细致地阐述Python编程的基础知识和高级技巧,并以大量示例代码进行实践,同时还介绍人工智能领域广泛使用的科学计算工具NumPy。《细说Python编程:从入门到科学计算》分为两篇,共19章。第1篇(第1~11章)为基础知识,主要讲解Python的编译环境、入门知识、字符串、容器、函数、循环、条件选择、模块计算机18.9万字 - 会员
CPU眼里的C/C++
全书共6章,第1章:介绍本书所使用到的主要工具和一些需要心里有数的预备知识;第2章:解析最简单、常用的基础语法,帮助读者适应本书的节奏;第3章:为进阶知识,会从CPU、操作系统的角度,深入分析函数的工作原理和实现细节;第4章:解析经典的C++语法,背后的实现逻辑,并介绍面向对象的编程思想及优缺点;第5章:讨论跟操作系统强相关的软件技术,会将所有章节的内容贯穿起来,初步形成一个现代操作系统的运作模型计算机9万字 - 会员
OpenCV计算机视觉项目实战(Python版)
计算机视觉是在图像处理的基础上发展起来的新兴学科。OpenCV是一个开源的计算机视觉库,可以实现图像处理、模式识别、三维重建、物体跟踪等算法。本书基于Python,从图像基本原理说起,初步讲解计算机视觉所需的OpenCV知识。本书可作为信息处理、计算机、机器人、人工智能、遥感图像处理、认知神经科学等相关专业的教学用书,也可供相关领域的研究工作者参考。计算机10.4万字 - 会员
企业微信开发详解
《企业微信开发详解》从零基础开始,详细地讲解了企业微信开发相关的知识点。本书重点介绍了企业微信的三大核心开发方式——回调开发方式、主动开发方式和网页开发方式,每种开发方式都从基础知识、架构设计建议、开发案例3个方面进行讲解。同时,针对企业微信开发的重要技术接口,给出了示例程序和执行结果,以方便读者清晰、明了地学习。读者可以按各技术点的讲解顺序学习,也可以根据个人需要有针对性地学习。计算机3.8万字 - 会员
Python GUI设计tkinter菜鸟编程(增强版)
本书是国内首先使用Pythontkinter设计GUI的中文书籍之一。本书主要讲解如何在窗口内使用Python的内部模块tkinter设计图形用户接口(GUI)程序,让用户可以利用图形接口与计算机沟通。tkinter模块是一个跨平台的窗口应用程序,使用它设计的程序可以在Windows、macOS、Linux系统上执行。2019年《PythonGUI设计tkinter菜鸟编程》一经出版便受到广大读者计算机6.4万字 - 会员
TensorFlow程序设计
本书全面介绍TensorFlow2.x框架及其在深度学习中的应用,内容包括TensorFlow简介、Python语言基础、环境搭建与入门、TensorBoard可视化、多层感知机实现、卷积神经网络实现、循环神经网络实现、强化学习、迁移学习、生成对抗网络和GPU并行计算等。计算机7.9万字 - 会员
大数据可视化编程和应用
《大数据可视化编程和应用》从基础开始,全面介绍大数据可视化的底层原理和实现框架,并重点讲解一些常用的大数据可视化关键技术,包括Excel图表、TableauDesktop可视化组件、Web的可视化控件、Java可视化控件及Python数据可视化工具。《大数据可视化编程和应用》共分为8章,第1章着重介绍大数据的发展历程,以及在大数据发展背景下数据可视化的概念、可视化技术的使用及可视化的现实意义;第2计算机4.2万字 - 会员
R语言数据分析从入门到精通
《R语言数据分析从入门到精通》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详细介绍了R语言基础知识、核心技术与高级应用。全书分为3篇,共16章,包括初识R语言、集成开发环境RStudio、R语言入门、数据结构、流程控制语句、日期和时间序列、获取数据、数据处理与清洗、数据计算与分组统计、基本绘图、ggplot2高级绘图、lattice高级绘图、基本统计分析、方差分析、回归分析和时间序列分析计算机12.2万字 - 会员
腾讯游戏开发精粹Ⅲ
《腾讯游戏开发精粹Ⅲ》是腾讯游戏研发团队不断积累沉淀的技术结晶,是继2019年推出《腾讯游戏开发精粹I》和《《腾讯游戏开发精粹II》后的诚意续作。本书收录了21个在上线项目中得到验证的技术方案,深入介绍了腾讯公司在游戏开发领域的新研究成果和新技术进展,涉及人工智能、计算机图形、动画和物理、客户端架构和技术、服务端架构和技术及管线和工具等多个方向。本书适合游戏从业者、游戏相关专业师生及对游戏幕后技术计算机25.5万字