340人加入学习
(0人评价)
Python学术系列丨Python文本分析学术应用

难度系数:★★★☆☆ 课程系列:Python爬虫及文本分析学术应用

价格 ¥ 3000.00
课程介绍

提供全部资料和主讲老师Q&A

本课程致力于讲授完整的结构化数据、文本数据的获取、存储、读取、处理和分析过程,我们期望课程可以帮助到广大的用户,包括所有想要使用python编程语言实现数据获取和文本分析的在校师生、以及致力于将数据分析与挖掘的价值广泛运用到实际场景的商业人士。

 

Python爬虫及文本分析学术应用-Python文本分析学术应用

文本处理常用字符串方法精讲

字符串的不变性

排序行

段落格式化

二进制转化为ASCII

重复字词过滤

提取邮件地址

提取URL地址

大写转换

符号化

删除停用词

同义词与反义词处理

文本翻译

单词替换

拼写检查

WordNet接口

语料访问

标记单词

块和裂口

块分类

文本分类

双字母组

文字改写

文字换行

频率分布

文字摘要

词干算法

约束搜索

numpy数值计算要点串讲

Pandas数据处理串讲

python统计图表展示

 

重要的库

jieba库简介

 

关键词提取

关键词任务概述

TF-IDF算法原理

相似文章推荐原理介绍

实例:红楼梦文本分析的实现

文件与词库的读取

完成分词与词云图的绘制

 

文本分类

新闻素材介绍

新闻内容的关键词提取

词向量转化与ngram模型

朴素贝叶斯算法完成新闻分类

 

文本聚类

语料的加载,文本特征的提取,利用聚类算法对文本进行聚类

 

主题模型,情感分析

(时间允许)增加主题模型,情感分析部分

授课教师

学术学习
量化投资,学术课程

课程特色

视频(8)

最新学员

学员动态

ouyangqiu 加入学习
chuck.qu 加入学习
SISSI12345678 加入学习
毛聚r 加入学习