Pima Indians Diabetes Dataset包括根据医疗记录的比马印第安人5年内糖尿病的发病情况,这是一个两类分类问题。每个类的样本数目数量不均等。一共有 768 个样本,每个样本有8个输入变量和1个输出变量。缺失值通常用零值编码。 根据提供的数据集对是否有糖尿病进行分类
Rental Listing Inquiries数据集是Kaggle平台上的一个分类竞赛任务,需要根据公寓的特征来预测其受欢迎程度(用户感兴趣程度分为高、中、低三类)。其中房屋的特征x共有14维,响应值y为用户对该公寓的感兴趣程度。评价标准为logloss
本项目主要是实现对给定车辆的图片进行车辆检测和型号的分类,并对系统进行整合,以GUI界面形式对输入图片进行检测分类后输出结果。
根据活动的关键词(count_1, count_2, ..., count_100,count_other属性)做聚类,采用KMeans聚类 尝试K=10,20,30,..., 100, 并计算各自CH_scores 总体活动的数目太多(300w+记录),只对训练集train.csv和测试集test.cv出现的活动(13418条记录)举行聚类
使用tensorflow,构造并训练一个神经网络,在测试机上达到超过98%的准确率。 使用深度神经网络、激活函数、正则化、初始化等 探索超参数设置: 隐层数量、各隐层中神经元数量、学习率、正则化因子、权重初始化分布参数
最近一年贡献:0 次
最长连续贡献:0 日
最近连续贡献:0 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。