自然语言处理+2020年初微博数据(疫情相关)+适用于nlp、数据挖掘模型训练
2023-03-06 00:53:02 2.37MB 数据挖掘 NLP
1
本程序可以连续爬取一个或多个新浪微博用户(如胡歌、迪丽热巴、郭碧婷)的数据,并将结果信息写入文件或数据库。写入信息几乎包括用户微博的所有数据,包括用户信息和微博信息两大类。因为内容太多,这里不再赘述,详细内容见获取到的字段。如果只需要用户信息,可以通过设置实现只爬取微博用户信息的功能。本程序需设置cookie来获取微博访问权限,后面会讲解如何获取cookie。如果不想设置cookie,可以使用免cookie版,二者功能类似。 爬取结果可写入文件和数据库,具体的写入文件类型如下: txt文件(默认) csv文件(默认) json文件(可选) MySQL数据库(可选) MongoDB数据库(可选) SQLite数据库(可选) 同时支持下载微博中的图片和视频,具体的可下载文件如下: 原创微博中的原始图片(可选) 转发微博中的原始图片(可选) 原创微博中的视频(可选) 转发微博中的视频(可选) 原创微博Live Photo中的视频(免cookie版特有) 转发微博Live Photo中的视频(免cookie版特有)
2023-03-04 11:00:59 111KB python 爬虫 新浪微博
1
本程序可以连续爬取一个或多个新浪微博用户(如胡歌、迪丽热巴、郭碧婷)的数据,并将结果信息写入文件或数据库。写入信息几乎包括用户微博的所有数据,包括用户信息和微博信息两大类。
2023-02-28 14:16:16 102KB Web爬虫
1
利于JDBC实现微博应用数据的持久化
2022-12-30 22:07:11 16KB 前端 java web
1
基于微博数据的用户特征分析及行为预测,付旭佳,靳浩,随着社会网络的快速发展,用户行为分析和预测成为研究的热点。研究针对微博用户的用户活跃度和能力等行为特征进行分析,提出了一
2022-12-05 23:32:48 356KB 首发论文
1
# 过滤文本中的html链接等 # 提取微博中的话题名称#和人名@ # 分词 #去除停用词 # 表情处理
2022-06-08 18:03:25 2KB python 开发语言
1
针对微博数据的停用词表
2022-05-18 19:07:21 21KB Hive 停用词
1
数学建模数据。 美赛8万多条微博数据集总有你想要的。
2022-04-04 11:30:52 19KB  数学建模
1
利用新浪微博API下载的数据,并利用相关算法进行标记
2022-01-15 21:01:56 64KB 标签后的数据
1