实验详情

中级-09-K近邻分析实验

K近邻分析实验

提示: 实验资源会在固定时间后释放,请创建资源后尽快操作。

实验评分

平均时长

1 小时

难易程度

普通

实验编号

S15044

学习人次

10346

一、实验目的

通过本实验,使学生能够加深对K近邻的理解,掌握使用阿里云PAI产品相关功能组件完成相关的实验。

二、实验内容

某卫生组织对幼儿园学生进行牙齿检测建档,数据主要采集了幼儿的年龄、性别、身高、体重、血型、视力、是否母乳喂养,以及是否有龋齿,由于工作人员疏忽,造成小部分是否有龋齿的信息未记录,工作人员在联系相关幼儿园补充相关数据的同时,期望你通过大数据的K近邻算法对数据进行补充,以便进行后续的一些工作。

三、实验仪器、设备

1 硬件

PC 微型计算机、1G以上内存,40G以上硬盘

2 软件

阿里云账号及开通相关阿里云产品(Maxcompute、Dataworks、PAI)

1、MaxCompute(原ODPS)是一项大数据计算服务,它能提供快速、完全托管的PB级数据仓库解决方案,使您可以经济并高效的分析处理海量数据

2、DataWorks是从工作室、车间到工具集都齐备的一站式大数据工场,助力您快速完成数据集成、开发、治理、服务、质量和安全等全套数据研发工作。

3、阿里云机器学习PAI平台是构建在阿里云MaxCompute(原ODPS)计算平台之上,集数据处理、建模、离线预测、在线预测为一体的机器学习平台。阿里云机器学习封装了阿里巴巴集团内成熟的算法,向机器学习用户提供了更简易的操作体验,真正做到让人工智能触手可及。


实验报告要求 第 2 章实验报告要求
实验注意事项 第 3 章实验注意事项
思考题 第 4 章思考题

开始学习后可阅读实验手册内容