明霞山资源网 Design By www.htccd.com
for splitValue in set(dataset[:, featureIndex].tolist()):
首先set是一个无序,无重复的数据结构,所以很多时候使用它来进行去重;但是set接收的函数是原生array,这个怎么办?我现在有的numpy里面的matrix;于是我查了一下,直接使用matrix.tolist(),但是发现返回值有问题:
import os os.chdir("D:\\galaxy\\aliyunsvn\\code\\MLInAction\\dataset") dataArr = loadDataSet("ex00.txt") dataMat = mat(dataArr) dataMat[:, 0].tolist()
输出为:
[[0.036098], [0.727098],..
并不是我想要的,因为如果此时将其放于set中将会报错:
set(dataMat[:, 0].tolist()) TypeError: unhashable type: 'list'
于是查了一下,做了调整:
import os os.chdir("D:\\galaxy\\aliyunsvn\\code\\MLInAction\\dataset") dataArr = loadDataSet("ex00.txt") dataMat = mat(dataArr) dataMat[:, 0].A.flatten().tolist() [0.036098, 0.712386, ....
很好就是要这种一维的数组,然后再使用数组作为参数放入set中,完美。
set(dataMat[:, 0].A.flatten().tolist())
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。
明霞山资源网 Design By www.htccd.com
广告合作:本站广告合作请联系QQ:858582 申请时备注:广告合作(否则不回)
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
免责声明:本站文章均来自网站采集或用户投稿,网站不提供任何软件下载或自行开发的软件! 如有用户或公司发现本站内容信息存在侵权行为,请邮件告知! 858582#qq.com
明霞山资源网 Design By www.htccd.com
暂无评论...