徐明朝

又一个WordPress站点

曹务春朴素贝叶斯源码实现以及应用示例(Wine数据集)-AI初见

朴素贝叶斯源码实现以及应用示例(Wine数据集)-AI初见
本文基于朴素贝叶斯的基本原理,徐慧宣实现了特征值连续的朴素贝叶斯的功能,应注意数据连续与离散的不同,二者计算概率的方式不同密春雷年龄。数据连续时,直接模拟求取概率密度函数;数据离散时李麒耀,则通过统计特征的个数,进而得到概率。
具体原理介绍 戳这里
源码git地址:
https://github.com/ldgang0530/wxgzh.git
NaiveBayes实现(NaiveBayes.py)
源码中都已做了注释再战巨人城,在此不再赘述解析。





测试程序(test.py)

Main函数程序入口赢疾,主要用于调用各个接口函数实现功能
Load_dataset函数,加载数据集
Disp_result函数,显示真实值与预测值对比
程序运行结果:

即预测正确率是 94.4%,对于待测数据['10.58','2.26', '2.69'王宏祥, '24.5'极品巫男, '80', '1.55', '.84', '.39'狗语翻译器, '0.9', '8.66'捡到一条龙, '.74'穆岩,'1.8'林卡尔钙片, '600'],预测分类的类别是3级。
附Wine数据集简介
Wine数据集可以从UCI官网获取http://archive.ics.uci.edu/ml/datasets/Wine
Wine数据集是比较经典的,常用于分类和预测的数据样本集,它是对位于意大利同一地区生产的不同类别的葡萄酒做大量分析所得出的数据。
数据集包含了13中不同成分的具体数量,也就是说有13个特征;酒的类别以及对应数量:1级59,2级71,曹务春3级48;针对每个属性张皓轩,都是连续的;没有缺少属性值,也就是不需要弥补缺失值等预处理。