305人加入学习
(0人评价)
Python学术系列丨Python爬虫学术应用

难度系数:★★☆☆☆ 课程系列:Python爬虫及文本分析学术应用

价格 ¥ 2000.00
课程介绍

提供全部资料和主讲老师Q&A

通过该课程的学习,我们的学员将不再单一依靠开源公开数据网站的数据,适当摆脱对国家统计年鉴、wind数据库、知网数据的依赖,能够从更多元的渠道获取数据,使用python更高效的处理数据,并用更前沿的技术分析和挖掘数据信息,为我们的科研工作减轻中间工作负担。

Python爬虫及文本分析学术应用-Python爬虫学术应用

爬虫基础

网络爬虫简介

爬虫的基本原理

HTML 简介

数据存储

 

网页抓取

使用Urllib网页抓取

requests实战

 

BeautifulSoup4

BeautifulSoup 简介

BeautifulSoup 的安装

BS 对象的种类

遍历文档树

搜索文档树

 

Xpath

什么是Xpath

Xpath开发工具

Xpath常用规则

 

动态渲染页面抓取

Selenium 的安装

基本使用

声明浏览器对象

访问页面

定位元素

节点交互

动作链

执行 JavaScript

获取节点信息

延时等待

前进后退

Cookies

选项卡管理

异常处理

 

爬虫实战

网站的爬取

电商评价文本爬取

 

可供读取数据类型介绍

excel、pdf、txt、html、mysql数据库文件介绍

 

数据的存储

将数据存储到excel表

将数据存储到txt文本

将数据存储到csv

 

数据的读取

python批量读取多个多子表excel

python读取txt文件

python读取csv

 

正则表达式

什么是正则表达式

正则表达式匹配规则

re模块的使用

授课教师

学术学习
量化投资,学术课程

课程特色

视频(6)

最新学员