
会员
精通Scrapy网络爬虫
刘硕更新时间:2020-11-28 14:59:54
最新章节:本书特点:开会员,本书免费读 >
本书深入系统地介绍了Python流行框架Scrapy的相关技术及使用技巧。全书共14章,从逻辑上可分为基础篇和高级篇两部分,基础篇重点介绍Scrapy的核心元素,如spider、selector、item、link等;高级篇讲解爬虫的高级话题,如登录认证、文件下载、执行JavaScript、动态网页爬取、使用HTTP代理、分布式爬虫的编写等,并配合项目案例讲解,包括供练习使用的网站,以及京东、知乎、豆瓣、360爬虫案例等。本书案例丰富,注重实践,代码注释详尽,适合有一定Python语言基础,想学习编写复杂网络爬虫的读者使用。
品牌:清华大学
上架时间:2017-10-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
精通Scrapy网络爬虫最新章节
查看全部- 本书特点:
- 作者简介:
- 14.4 本章小结
- 14.3 使用scrapy-redis进行分布式爬取
- 14.2 scrapy-redis源码分析
- 14.1 Redis的使用
- 第14章 分布式爬取
- 13.6 本章小结
- 13.5 项目实战:爬取豆瓣电影信息
- 13.4 实现随机代理
刘硕
主页
同类热门书
最新上架
- 会员
高并发系统:设计原理与实践
本书主要探讨高并发场景下系统设计的原理和实践案例,帮助读者系统、快速地理解高并发系统的设计原理与相关实践,以及掌握解决高并发场景下可能遇到的各种问题的方法。本书共6章。第1章介绍高并发系统的发展历史、设计难点和基本设计原则,以及度量指标;第2~4章介绍有助于提升高并发系统可用性的3种方法—系统容错、冗余和分片;第5章从提升高并发系统性能的角度讲解并发与异步的原理和实践技巧;第6章从系统运维和团队流计算机11.4万字 - 会员
区块链技术及应用
本书系统地阐述了区块链技术的理论体系结构,辅以典型工程案例,为读者展示成熟的分析方法和解决方案。全书内容包括区块链概述、区块链开发基础、区块链核心技术解析、区块链数据存储、区块链网络构建、以太坊技术解析、区块链技术改进、区块链安全性分析、区块链项目实战案例。本书难易适中,内容充实,层次清晰,可作为普通高等学校信息安全、网络空间安全、软件工程、计算机科学与技术等专业本科生和研究生教材,也可以作为区块计算机18.8万字 - 会员
数据结构和算法基础(Java语言实现)
本书书分为以下几部分:第一部分:预备知识:介绍数据结构和算法的基本概念,并演示如何搭建开发环境、编写测试用例。第二部分:数据结构:介绍常见的数据结构,包括数组、链表、矩阵、栈、队列、跳表、散列、树、图等。第三部分:常用算法:介绍常用的算法,包括分而治之、动态规划、贪婪算法、回溯、分支界定、遗传算法等。第四部分:商业实战:介绍汉诺塔及五子棋两款游戏的实现。计算机0字 性能之道:分布式系统全栈性能优化
这是一本从点、线、面、体4个维度深度解读分布式系统性能优化方法的专业工具书,更是一套全栈性能优化解决方案。全书融合了5位长期(最长有近30年工作经验)从事软件开发及优化工作的一线专家的实践经验和深刻理解,不仅从理论层面深入解读了性能优化的本质,还从软件开发整体流程的角度构建性能优化体系和评估策略。本书共分为17章。第1~4章主要介绍作者对性能优化的理解以及性能优化体系及评测方法。第5~9章对网络、计算机23.3万字- 会员
Java编程从入门到精通
本书立足于新工科和工程教育,从工程应用和实践者的视角,全面系统地介绍了目前在工业界中使用最为广泛的JDK8的全部核心知识。全书共17章,主要内容包括Java概述、Java基本类型与运算符、程序流程控制、数组、类与对象、抽象类、接口与嵌套类、GUI编程、Swing高级组件、异常与处理、I∕O流与文件、多线程与并发、容器框架与泛型、字符串与正则表达式、反射与注解。本书适合可作为普通高等院校、高职院校计算机21万字 - 会员
HTML5+CSS3+JavaScript+Bootstrap网站开发实用技术(第3版)
本书系统地讲述了HTML5、CSS3、JavaScript、Bootstrap等开发技术,满足Web前端开发基础学习的需求。本书包括了HTML5与CSS3的典型案例、使用Bootstrap框架开发、响应式布局等内容,适应Web前端开发从PC端转向移动端的变化。计算机14.3万字 - 会员
Three.js权威指南:在网页上创建3D图形和动画的方法与实践(原书第4版)
Three.js在过去几年中已经成为创建令人惊叹的3DWebGL内容的标准方式。本书探讨Three.js的所有特性,并提供额外的内容,包括如何将Three.js与Blender、React、TypeScript以及最新的物理引擎进行集成。本书共分为四个部分:第一部分介绍搭建开发环境和运行Three.js;第二部分介绍Three.js的核心组件;第三部分介绍如何创建复杂的几何体、动画和纹理;第四部计算机13.3万字 - 会员
Java程序设计实战教程
本书从Java初学者的角度出发,用通俗易懂的语言、贴近实际生活的实例,详细地介绍使用Java语言进行程序开发须掌握的知识和技术,帮助读者快速掌握Java程序开发的技能。全书共14章,分别为Java程序设计入门、Java语言基础、流程控制、方法与数组、面向对象基础、深入面向对象、常用类、异常、集合类、File与I/O流、多线程、图形用户界面、网络编程、反射。随书电子资源中还提供了综合项目实训,以巩固计算机17万字 - 会员
Web前端开发技术:HTML、CSS、JavaScript(第3版)
本书全面介绍了Web标准的三个主要组成部分:HTML、CSS和JavaScript。循序渐进的讲述Web开发所涉及的三大前端技术的内容、应用技巧以及它们的综合应用。每部分都配置了大量的实用案例,图文并茂,效果直观。全书共21章,分为四个部分。在HTML部分,系统介绍了主要讲述了主要讲述了HTML基本概念、常用文本标签、文档结构标签、在网页中插入多媒体内容、列表、DIV标签、元素类型、在网页中创建超计算机13.2万字