本项目基于朴素贝叶斯和SVM 分类模型,通过对垃圾邮件和正常邮件的数据训练,进行相关词汇词频的统计分析,实现垃圾邮件的识别功能。本项目包括3个模块:数据模块、模型构建、附加功能。需要Python 3.6 及以上配置,在Windows 环境下载Anaconda 完成Python 所需的配置,也可以下载虚拟机在Linux 环境下运行代码。从github 网站下载与python PIL 库配搭使用的文字引擎pytesseract,将PIL 文件夹里的.py 文件,改为相应pytesseract.exe 路径。注册百度云账号,分别建立图像文字识别和图像识别的小程序。
1
贝叶斯算法(bayes)优化随机森林的数据回归预测,bayes-RF回归预测,多变量输入模型。 评价指标包括:R2、MAE、MSE、RMSE和MAPE等,代码质量极高,方便学习和替换数据。
2024-01-23 09:06:13 60KB 随机森林
1
软件: anaconda jupyter notebook 运行代码文件:naive bayes.ipynb python环境
2023-11-12 20:53:50 55.11MB 机器学习 python 数据集 朴素贝叶斯算法
1
朴素贝叶斯算法实战 email邮件数据集,SogouC新闻数据集 Email_NB.py垃圾邮件过滤实现(Python3实现) Naive_Bay.py 朴素贝叶斯算法实现(Python3实现) 样本比较小,成功率大概为90% import numpy as np from functools import reduce """ 函数说明:创建实验样本 Parameters: 无 Returns: postingList - 实验样本切分的词条 classVec - 类别标签向量 """ def loadDataSet(): postingList=[['my', 'dog', 'has', 'flea', 'problems', 'help', 'please'], #切分的词条 ['maybe', 'not', 'take', 'him', 'to', 'dog', 'park', 'stupid'], ['my', 'dalmation', 'is', 'so',
2023-04-06 12:03:35 196KB 贝叶斯
1
采用朴素贝叶斯算法对雷达点云数据进行分类,先构建kd树对点云领域进行搜寻,后提取点云的法向量、残差、主成分及高程差作为朴素贝叶斯算法的参数,运行程序可得到分类结果图。 (1)主程序为Classify.m (2)../data里为txt格式的训练样本与测试样本点云数据。
2023-03-13 23:54:12 3.61MB LiDAR点云 Matlab
1
从数学角度来说,分类问题可做如下定义:       已知集合: 和 ,确定映射规则 ,使得任意 有且仅有一个 使得 成立。(不考虑模糊数学里的模糊集情况)       其中C叫做类别集合,其中每一个元素是一个类别,而I叫做项集合,其中每一个元素是一个待分类项,f叫做分类器。分类算法的任务就是构造分类器f。 这个定理解决了现实生活里经常遇到的问题:已知某条件概率,如何得到两个事件交换后的概率,也就是在已知P(A|B)的情况下如何求得P(B|A)。 条件概率: 表示事件B已经发生的前提下,事件A发生的概率,叫做事件B发生下事件A的条件概率。其基本求解公式为: 对于给出的待分类项,求解在此项出现的条件下各个类别出现的概率,哪个最大,就认为此待分类项属于哪个类别。通俗来说,就好比这么个道理,你在街上看到一个黑人,
2023-03-13 21:35:17 7.91MB 贝叶斯算法 算法 大数据
1
贝叶斯是基于概率的一种算法,是Thomas Bayes:一位伟大的数学大师所创建的,目前此种算法用于过滤垃圾邮件得到了广泛地好评。贝叶斯过滤器是基于“自我学习”的智能技术,能够使自己适应垃圾邮件制造者的新把戏,同时为合法电子邮件提供保护。在智能邮件过滤技术中,贝叶斯(Bayesian)过滤技术取得了较大的成功,被越来越多地应用在反垃圾邮件的产品中。
2022-12-10 14:17:05 18KB 贝叶斯 算法
1
物流人工智能_机器学习
2022-11-29 14:32:25 3.28MB 人工智能 机器学习 物流
本代码实现了朴素贝叶斯分类器(假设了条件独立的版本),常用于垃圾邮件分类,进行了拉普拉斯平滑。 关于朴素贝叶斯算法原理可以参考博客中原理部分的博文。 #!/usr/bin/python # -*- coding: utf-8 -*- from math import log from numpy import* import operator import matplotlib import matplotlib.pyplot as plt from os import listdir def loadDataSet(): postingList=[['my', 'dog', 'has'
2022-11-20 10:39:10 45KB python python算法 朴素贝叶斯
1
练习使用 Python 语言,请对“西瓜数据集2.0"中的数据进行分析,使用朴素贝叶斯方法学习西瓜数据后验条件概率分布,并对如下瓜的类型做出判断(乌黑,蜷缩,浊响,稍糊,平坦,硬滑)将 Python 运行结论截图上传到本题
1