首页 > TAG信息列表 > Datawhale

Datawhale 吃瓜教程 Task03打卡

ID3决策树 自信息 \[I(x)=-log_bp(x) \]可以先把自信息理解成跟米,公顷一样的一种单位,不必在这纠结 信息熵 度量随机变量 \(X\)的不确定性,信息熵越大越不确定 \[H(x) = E[I(X)] = -\sum_xp(x)log_bp(x)\tag{以离散型为例} \] 在计算时约定 如果 p(x) = 0 ,则 \(p(x)log_bp(x)=0\)

Datawhale 吃瓜教程 Task02打卡

主要参考了大佬的视频,第三章的公式推导对我这种零基础渣渣来说真是要命 线性回归算法原理 极大似然估计 类似于以偏概全,在极大似然估计中我们选择相信获得的样本数据已经能够很好的概括现实情况中的真实数据分布。将求出的样本数据的概率分布作为我们现实情况中的概率分布使用。 x

Datawhale 吃瓜教程 Task01打卡

Datawhale 吃瓜教程 Task01打卡 感觉西瓜书蛮新手友好的,前两章都是在不厌其烦的介绍基础概念。 数据集就是我们要让机器学习的东西,希望机器能从中学习到“经验”,产生模型,从而在面对新情况(数据集以外的数据)也能做出有效的判断与决策。 特征(属性):反应事物或对象在某方面的表现或性

Datawhale SQL TASK4

第4章 集合运算 摘要:感觉不是很难,但是知识点比较零碎,自己做了两张表格,可能有不大准确的地方,欢迎指正 目录第4章 集合运算4.1 表的加减法4.2 连结 JOIN练习题4.14.24.34.44.5 4.1 表的加减法 表的加法-UNION,两个SELECT FROM 语句中间使用UNION 同一张表,可以使用UNION或者OR,

DataWhale SQL TASK2

第2章 基础查询与排序 摘要:主要记录了SELECT基础语法、算术运算符、逻辑运算符,以及表的聚合、分组、排序 目录第2章 基础查询与排序2.1 SELECT语句基础2.2 算术、比较运算符2.3逻辑运算符练习题2.12.22.32.42.4 对表进行聚合查询2.5 对表进行分组2.6 为GROUP BY结果指定条件2.7

DataWhale SQL TASK1

摘要:选学了MySQL Workbench进行SQL连接。在创建表格的时候采用的是小括号,使用VARCHAR或者CHAR的时候,后面跟的也是小括号,不要跟C语言搞混了。name在MySQL中颜色不对,不建议使用,不过结果好像没问题。插入列是ALTER TABLE,插入数据是INSERT INTO,INSERT INTO 是VALUES ,复数,删除表格的

datawhale李宏毅机器学习——task07总结

在任务01中,对机器学习的定义、结构和功能有了大致了解。 机器学习是为了让机器能够像人一样拥有智慧而设计的一种算法,这种算法最大的特点在于从一堆数据中根据设定的神经网络学习数据中隐含的知识。机器学习的执行步骤,首先,明确要解决的问题类型,是回归还是分类;然后,根据问题类

Datawhale组队学习——数据分析Task05 模型建立与评估

以下学习笔记来自Datawhale组队学习的数据分析课程第二章,此次数据分析课程主要是完成kaggle上泰坦尼克的任务,实战数据分析全流程。 链接:https://github.com/datawhalechina/hands-on-data-analysis 模型建立与评估 数据导入 导入基本库和plt配置 import pandas as pd import

学习笔记 — Datawhale数据分析入门Task04

五、数据可视化 1、【思考】最基本的可视化图案有哪些?分别适用于那些场景? 可视化的场景可以分为五大类:展示趋势变化、展示分布关系、展示相关关系、展示排序信息、展示组成关系。 柱状图 反映一个类别变量和一个数值变量之间的关系散点图反映数值型变量之间的相关性折线图反映

Datawhale组队学习 2022年1月 动手学数据分析 第1章3

上一部分 复习:在前面我们已经学习了Pandas基础,知道利用Pandas读取csv数据的增删查改,今天我们要学习的就是探索性数据分析,主要介绍如何利用Pandas进行排序、算术计算以及计算描述函数describe()的使用。 【笔者注】该教程第一章第三部分感觉和前两部分有不小的区别 目录1 第一章:探

Datawhale组队学习 2022年1月 动手学数据分析 第1章

第一章:数据载入及初步观察 1.1 载入数据 数据集下载 https://www.kaggle.com/c/titanic/overview。 下载好以后把train.csv文件复制几份,使用excel,分别把格式另存为成为tsv、xlsx,全都放到ipynb文件所在文件夹下。 1.1.0 安装numpy和pandas 以管理员身份打开命令行,根据实际情况输入

DataWhale-(scikit-learn教程)-Task07(集成学习)-202112

一、基本原理 集成学习(ensemble learning) 通过构建并结合多个学习器来完成学习任务,以提高比单个学习器更好的泛化和稳定性能。要获得好的集成效果,个体学习器应该“好而不同”。按照个体学习器的生成方式,集成学习可分为两类:序列集成方法,即个体学习器存在强依赖关系,必须串行

【组队学习】【32期】吃瓜教程——西瓜书+南瓜书

吃瓜教程——西瓜书+南瓜书 航路开辟者:谢文睿、秦州领航员:陈伟峰航海士:谢文睿、秦州 基本信息 开源内容:https://github.com/datawhalechina/pumpkin-bookB 站视频:https://www.bilibili.com/video/BV1Mh411e7VU内容属性:机器学习(理论)专题内容说明:周志华老师的“西瓜书”是机器

Datawhale组队学习周报(第045周)

本周报总结了从 12月20日至12月26日,Datawhale组队学习的运行情况,我们一直秉承“与学习者一起成长的理念”,希望这个活动能够让更多的学习者受益。 第 32 期组队学习已经与大家见面了,这次组队学习一共 11 门开源课程,共组建了 11 个学习群,参与的学习者有 815 人。 第 33 期组队

Linux实践学习笔记3 | DataWhale组队32期

哈哈哈,我又来参加DataWhale组队学习了,本期是第32期组队学习,具体时间20211213~20211228,学习网址如下: 课程链接 备份链接 目录 任务88.1 下载周杰伦歌词文本,并进行解压8.2 利用grep命令完成指定操作,并输出到屏幕8.3 利用sed命令完成指定操作,并输出到屏幕 任务99.1 使用zip命

【组队学习】【32期】统计学习方法习题实战

统计学习方法习题实战 航路开辟者:胡锐锋、王维嘉、王瀚翀、王茸茸、毛鹏志领航员:张璇航海士:胡锐锋、王维嘉、王瀚翀、王茸茸、毛鹏志、王天富、范佳慧 基本信息 开源内容:https://github.com/datawhalechina/statistical-learning-method-solutions-manual内容属性:公测课程内

xgboost推导

https://blog.csdn.net/Datawhale/article/details/106893926 XGBoost原理介绍 从0开始学习,经历过推导公式的波澜曲折,下面展示下我自己的推公式的手稿吧,希望能激励到大家能够对机器学习数据挖掘更加热爱! XGBoost公式1

DataWhale-(scikit-learn教程)-Task01(线性回归与逻辑回归)-202112

DataWhale-(scikit-learn教程)-Task01(线性回归与逻辑回归)-202112 DataWhale的scikit-learn教程链接 一、 线性回归 ​​1. 线性回归的基本形式 2. 梯度下降法训练 假设给定模型 h (

datawhale 动手做深度学习 第一节

1 第一章:数据载入及初步观察¶ 1.1 载入数据 数据集下载 https://www.kaggle.com/c/titanic/overview 1.1.1 任务一:导入numpy和pandas import numpy as npimport pandas as pd 1.1.2 任务二:载入数据 (1) 使用相对路径载入数据 (2) 使用绝对路径载入数据 #写入代码import osos.getc

【组队学习】【32期】算法的应用

算法的应用 航路开辟者:肖然领航员:李铭哲航海士:伊雪、左凯文 基本信息 开源内容:https://github.com/datawhalechina/team-learning-program/tree/master/AlgorithmRunning内容属性:公测课程内容说明:本次内容主要是对算法的理解和应用,我们会从优质的课程设计、或者简化的工业界

DataWhale sklearn学习笔记(一)

线性回归 数据生成: 生成数据的思路是设定一个二维的函数(维度高了没办法在平面上画出来),根据这个函数生成一些离散的数据点,对每个数据点我们可以适当的加一点波动,也就是噪声,最后看看我们算法的拟合或者说回归效果。 import numpy as np import matplotlib.pyplot as plt def

徐韬:CCF - 个贷违约预测Baseline

徐韬是华北电力大学数理系大四的学生,Datawhale成员/Dreamtech成员,参加了多期Datawhale的组队学习,也在天池/CCF/讯飞等比赛中取得了不错的成绩,现保送大连理工大学软件学院深造。 这篇图文是他在线下组队学习时,为大家分享自己CCF比赛的baseline。 希望参与我们线下组队学习的同

Datawhale~水很深的深度学习~Task 4: 卷积神经网络(CNN)

写在前面✍ \quad\quad 本系列笔记为Datawhale11月组队学习的学习笔记:水很深的深度学习。本次组队学习重理论知识学习,包含DL相关的基础知识,如CNN、RNN、Transformer等。参与本次组队

回归,逻辑回归,线性判别的python实现-DataWhale吃瓜教程-task02

回归分析 最小二乘法和极大似然估计 :思路不同推出同一个公式 最小二次法是均方误差最小化进行模型求解,极大似然估计则是利用了联合分布及似然函数 得到公式 $ E_{(w,b)}= $ 利用最优化的思路当$ E_{(w,b)}= $最小时w,b的值 求解方法包括梯度下降法,根据推到公式直接解 损失

DataWhale深度学习第三章 -- 机器学习基础

DataWhale深度学习第三章 – 机器学习基础 courseLink: https://datawhalechina.github.io/unusual-deep-learning/#/README 文章目录 DataWhale深度学习第三章 -- 机器学习基础机器学习基础机器学习分类数据集误差分析 有监督学习线性回归逻辑回归支持向量机决策树随机