可直接运行, 1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。
2024-04-10 20:39:49 37.99MB 数据集
1
KDD99入侵检测数据为网络上注明的 训练数据集合,数据特征共计41种特征,41种特征分为4个大类。本算法基于微软的LightGBM实现,实现简练。包括了从数据处理到训练模块到预测的全过程,准确率极高
2024-04-02 16:13:31 12KB KDD99 boost 机器学习 数据预处理
1
基于LightGBM进行海洋轨迹预测.zip
2023-11-06 15:27:52 151.91MB 机器学习
1
2.Parallel Processing(并行处理):如果大家看过我前面分享的一篇集成学习的文章: 集成学习之bagging、boosting及AdaBoos
2023-03-09 14:53:27 30KB 软件/插件 集成学习 boosting 算法
1
轻型GBM 高性能渐变增强-适用于Ruby 安装 将此行添加到您的应用程序的Gemfile中: gem 'lightgbm' 在Mac上,还要安装OpenMP: brew install libomp 培训API 准备数据 x = [ [ 1 , 2 ] , [ 3 , 4 ] , [ 5 , 6 ] , [ 7 , 8 ] ] y = [ 1 , 2 , 3 , 4 ] 训练模型 params = { objective : "regression" } train_set = LightGBM :: Dataset . new ( x , label : y ) booster = LightGBM . train ( params , train_set ) 预测 booster . predict ( x ) 将模型保存到文件 booster . save_mode
2023-03-06 19:44:59 62KB machine-learning lightgbm rubyml Ruby
1
包含比赛代码、数据、训练后的神经网络模型等。 在分析光伏发电原理的基础上,论证了辐照度、光伏板工作温度等影响光伏输出功率的因素,通过实时监测的光伏板运行状态参数和气象参数建立预测模型,预估光伏电站瞬时发电量,根据光伏电站DCS系统提供的实际发电量数据进行对比分析,验证模型的实际应用价值。 1 数据探索与数据预处理 1.1 赛题回顾 1.2 数据探索性分析与异常值处理 1.3 相关性分析 2 特征工程 2.1 光伏发电领域特征 2.2 高阶环境特征 3 模型构建与调试 3.1 预测模型整体结构 3.2 基于LightGBM与XGBoost的构建与调试 3.3 基于LSTM的模型构建与调试 3.4 模型融合与总结 4 总结与展望 参考文献
2022-12-25 13:28:50 1.88MB 光伏发电 XGBoost LightGBM LSTM
1
Kaggle竞赛解决方案-使用LightGBM算法预测二手商品的成交概率 avito是一家俄罗斯公司,从网站上来看是一个线上购物平台,这一次题目的目标,就是预测某一个商品在某一天被售出的概率,给定的数据有一段时间内的商品的销售情况(数量,价格,地区,品类,商品的俄文描述,商品的图片)等信息。 Avito提供了多个数据集, 除了主要的训练集(train.csv, 150万+样本)和测试集(test.csv, 50万+样本)外, 还有train_active.csv/test_active.csv(和train/test同时期的数据, 但没有成交概率和图片信息); periods_train.csv/periods_test.csv(只包含了active数据中每件商品的id, activation_date - 广告投放日期, date_from/date_to - 广告展示的第一天和最后一天); train_jpg.zip/test_jpg.zip(train和test样本的图片)。
2022-12-14 20:27:02 298KB python lightGBM 机器学习
1
LightGBM 轻量级提升学习方法
2022-10-17 09:06:45 8KB numpy复现算法
特征点提取aXgboost与LightGBM的用法速查表方法 自定义损失函数与评估准则 网格搜索与交叉验证 early- stopping早停及并行训练加速
2022-09-23 16:00:44 68KB 核心nlp
1
文件详细地描述了LightGBM的使用教程与各种例子:包括R语言、python、docker等等。供给机器学习初学者使用,加油。
2022-09-12 11:05:59 6.9MB LightGBM 机器学习 Python docker
1