Python3 决策树

FightLi 2018-01-17 原文

# -*- coding: utf-8 -*-
“””
Created on Fri Dec 29 10:18:04 2017

@author: markli
“””
from sklearn.feature_extraction import DictVectorizer;
from sklearn import preprocessing;
from sklearn import tree;
from sklearn.externals.six import StringIO;
from sklearn.externals import joblib;
import csv;
import sys;

sys.path.append(‘../’);
filepath = ‘decisiontree.csv’;
f = open(filepath,’r’);
reader = csv.reader(f);
header = next(reader); #读取表头
print(“表头为 %s” % header);

feature_list = [];
label_list = [];
for row in reader:
label_list.append(row[len(row)-1]);
rowdic = {};
for i in range(1,len(row)-1):
rowdic[header[i]] = row[i];
feature_list.append(rowdic);

print(“特征值为 %s” % feature_list);

dv = DictVectorizer();
dummX = dv.fit_transform(feature_list).toarray();
print(“特征提取值矩阵为 %s” % str(dummX));

#目标值特征化
lb = preprocessing.LabelBinarizer();
dummY = lb.fit_transform(label_list);
print(“目标特征化值为 %s” % str(dummY));

clf = tree.DecisionTreeClassifier(criterion=’entropy’);
clf = clf.fit(dummX,dummY);
print(“树 %s” % str(clf));

#保存模型
with open(‘dicisiontreeModel.dot’,’w’) as f:
f = tree.export_graphviz(clf,feature_names=dv.get_feature_names(),out_file=f);
joblib.dump(clf,’dicisionTree_entropyModel.dot’);

#读取模型预测
”’
x = np.array([0,1,0,0,0,1,0,1,1,0]); #测试值
print(x.reshape((1,10)));
#sys.path.append(‘F:\\Python\\ML’);
#f = open(‘F:\\Python\\ML\\dicisionTree_entropyModel.dot’);

decisiontree.csv 文件格式
clf = joblib.load(‘F:\\Python\\ML\\dicisionTree_entropyModel.dot’);
y = clf.predict(x.reshape((1,10))); #预测结果
print(y);
”’

posted on 2018-01-17 19:18 FightLi 阅读(…) 评论(…) 编辑收藏

版权声明：本文为FightLi原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://www.cnblogs.com/FightLi/p/8305076.html

Python3 决策树的更多相关文章

决策树
1. 什么是决策树/判定树（decision tree)? 　　判定树是一个类似于流程图的树结构：其中，每个内 […]...
基于sk_learn的k近邻算法实现-mnist手写数字识别且要求97%以上精确率
1. 导入需要的库 from sklearn.datasets import fetch_openml imp […]...
机器学习技法总结（五）Adaptive Boosting, AdaBoost-Stump,决策树
上一讲主要利用不同模型计算出来的g。採用aggregation来实现更好的g。假设还没有做出来g。我们能够採用 […]...
机器学习算法 — Pruning (decision trees) & Random Forest Algorithm
一、Table for Content 　　在之前的文章中我们介绍了Decision Trees Agorit […]...
机器学习笔记(1)决策树
系统不确定性的度量先来看2个概念. 信息熵 $$h(\theta)=\sum_{j=0}^n \theta […]...
《统计学习方法》——从零实现决策树
决策树决策树是一种树形结构，其中每个内部节点表示一个属性上的判断，每个分支代表一个判断结果的输出，最后每个叶 […]...
GBDT入门详解
从提升树出发，——》回归提升树、二元分类、多元分类三个GBDT常见算法。提升树梯度提升树回归提升树二元 […]...
机器学习算法 – 最近邻规则分类KNN
机器学习算法 – 最近邻规则分类KNN Posted on 2017-12-06 15:18 罗兵 […]...

随机推荐

求单链表中环的起点，原理详解
1. 问题描述：链表结构如下，若链表中有环，返回环的起点，否则返回NULL 1 struct ListNod […]...
Oracle查询表里的重复数据方法：
　　一、背景　　一张person表，有id和name的两个字段，id是唯一的不允许重复，id相同则认为是重复 […]...
区块链技术与应用回顾
区块链(BlockChain)是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新 […]...
JDK1.8源码阅读笔记(1)Object类
JDK1.8源码阅读笔记(1)Object类 Object 类属于 java.lang 包，此包下的所有类 […]...
C语言 memcpy_s 函数
目录一.memcpy_s 函数简介 1.memcpy 函数报错：error C4996 2.memcpy 函 […]...
多线程编程学习笔记——任务并行库（一）
接上文多线程编程学习笔记——基础（一）接上文多线程编程学习笔记——基础（二）接上文多线程 […]...
Activiti网关–并行网关
Activiti网关–并行网关 1、什么是并行网关　　并行网关允许将流程分成多条分支，也可以把多 […]...
NGUI_Button
十、按钮，Button 1、按钮的核心作用：按钮能够接收单击并触发响应事件按钮单击时能同时触发多个响应事件 […]...

展开目录

目录导航