阿里云天池大赛赛题解析——机器学习篇-赛题一(4)

阿里云天池大赛赛题解析——机器学习篇-赛题一(4)

2.1.3 缺失值处理1. 缺失值的产生原因和分类 缺失值的产生原因多种多样,主要分为机械原因和人为原因。机械原因是由机械导致的数据缺失,比如数据存储的失败、存储器损坏、机械故障导致某段时间的数据未能收集(对于定时数据采集而言)。人为原因是由人的主观失误、历史局限或有意隐瞒造成的数据缺失。比如,在市...

阿里云天池大赛赛题解析——机器学习篇-赛题一(3)

阿里云天池大赛赛题解析——机器学习篇-赛题一(3)

2 数 据 探 索2.1 理论知识2.1.1 变量识别 变量识别就是对数据从变量类型、数据类型等方面进行分析。举个例子,数据如表1-2-1所示:表1-2-1 我们可以从以下方面对其进行变量识别:1. 输入变量与输出变量 输入变量(也称为“predictor”或“特征”)有age,...

阿里云大数据工程师ACA认证(2023版)

21 课时 |
807 人已学 |
免费

阿里云人工智能工程师ACA认证(2023版)

41 课时 |
383 人已学 |
免费

阿里云数据中心基础设施初级运维工程师认证培训课程

50 课时 |
141 人已学 |
免费
开发者课程背景图
阿里云天池大赛赛题解析——机器学习篇-赛题一(2)

阿里云天池大赛赛题解析——机器学习篇-赛题一(2)

1.4 评估指标1.5 赛题模型 在赛题分析中,很重要的一点就是要根据赛题的特点和目标明确问题的类型,并选择合适的模型。在机器学习中,根据问题类型的不同,常用的模型包括回归预测模型和分类预测模型。1. 回归预测模型 回归预测模型的预测结果是一个连续值域上的任意值,回归可以具有实值或离散的输入变量。我...

阿里云天池大赛赛题解析——机器学习篇-赛题一(1)

阿里云天池大赛赛题解析——机器学习篇-赛题一(1)

赛题一 工业蒸汽量预测1 赛 题 理 解1.1 赛题背景 火力发电的基本原理是燃料在燃烧时加热水生成蒸汽,蒸汽产生的压力推动汽轮机旋转,然后汽轮机带动发电机旋转,产生电能。在这一系列的能量转化中,影响发电效率的核心是锅炉的燃烧效率,即燃料燃烧加热水产生高温、高压的蒸汽。影响锅炉燃烧效率的因素很多,包...

阿里云天池Apache Spark落幕:AI医疗进入落地实践深水期,达摩院如何用生态破局?

阿里云天池Apache Spark落幕:AI医疗进入落地实践深水期,达摩院如何用生态破局?

10 月 10 日,AI 医疗行业最高规格赛事——阿里云、英特尔(中国)有限公司联合主办的 Apache Spark AI 在杭州落下帷幕。脊柱外科疾病已经越来越困扰着老年人及久坐的上班一族,脊柱病变发展缓慢且不明显,长此以往会压迫神经和血管,甚至造成大脑指挥失灵。此次比赛正是瞄准脊柱外科疾病,参与...

攻坚AI病理诊断,阿里云天池联合英特尔重磅发布《数字病理诊断排行榜》

攻坚AI病理诊断,阿里云天池联合英特尔重磅发布《数字病理诊断排行榜》

病理学被「现代医学之父」威廉 · 奥斯勒称为「医学之本」,其核心方法病理切片分析被医学界公认为癌症诊断的「金标准」。而实际医疗资源的短缺窘境极大程度地限制了病理诊断产业的发展。在我国,目前每个病理医生都超H荷地承担了 5-10 倍的常规工作量,误诊、漏诊在所难免。随着现代计算系统和人工智能技术的引入...

《阿里云天池大赛赛题解析(深度学习篇)》导读

前言 时隔一年左右,天池团队在之前机器学习篇的基础上又推出了深度学习篇,同样第一时间收到了作品。抱着学习的心态仔细的阅读了下,也再次感觉受益匪浅,配合之前的机器学习篇,两本书在算法的介绍和赛题的介绍上形成了闭环,如果都能够把里面的知识点搞懂则可以在算法设计领域达到较高的水平。以下是对于深度学习篇的一...

机器学习之阿里云天池大赛—新闻分类(二)双向长短记忆网络

机器学习之阿里云天池大赛—新闻分类(二)双向长短记忆网络

普通的长短时记忆神经网络只能对正向数据进行处理,而双向长短时记忆神经网络可以处理内容的上下文,通过新闻分类大赛结果可以看到双向长短时记忆神经网络具有一定的提升。在pytorch中实现双向长短时记忆神经网络和简单,只需在参数中设置bidirectional=True即可,同时对循环神经网络中的ht和c...

机器学习之阿里云天池大赛—新闻分类

机器学习之阿里云天池大赛—新闻分类

在学习了循环神经网络之后,进行一次实践,参与一下阿里云天池大赛中入门级比赛—新闻文本分类,使用长短期记忆网络(LSTM)来完成,长短期记忆网络是循环神经网络的变体,建议从最普通的循环神经网络开始。一、赛题数据数据样例labeltext657 44 66 56 2 3 3 37 5 41 9 57 4...

机器学习之阿里云天池大赛--Docker入门(二)

机器学习之阿里云天池大赛--Docker入门(二)

在上一篇文章中,实现了阿里云天池大赛Docker入门得分,此次主要解决的问题是完成剩余的两个功能得到100分。1、创建数据csv文件在开发目录下创建tcdata/num_list.csv,并在文件中输入大于10个随机正整数,操作方法既可以用python生成也可以用Excel生成,为了方便本人使用的是...

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

社区圈子

阿里云最佳实践
阿里云最佳实践
阿里云最佳实践,是基于众多客户上云的成功案例萃取而成的最优化企业上云指导。每个最佳实践包括使用场景、多产品部署架构及部署手册。帮助客户更好地理解阿里云的产品和解决方案,降低企业上云门槛的同时满足客户自服务的需求。
316+人已加入
加入
相关电子书
更多
阿里云云原生开源开发者沙龙北京站 PPT 合集
阿里云产品二月刊
阿里云产品手册2024版
立即下载 立即下载 立即下载

阿里云天池相关内容