首页 > TAG信息列表 > KAGGLE

推荐一个 python学习网站

kaggle python课程: https://www.kaggle.com/learn/python 知乎有个博主在专栏放了课程的中文版: https://www.zhihu.com/people/yiyi-21-23-67/posts   小心得:   之前都是看中文课程书籍,虽然能 明白大体框架,但阅读英文课程却会有不一样的收获。   虽然刚开始阅读会有很多生

【Kaggle】如何有效避免OOM(out of memory)和漫长的炼丹过程

本文介绍一些避免transformers的OOM以及训练等流程太漫长的方法,主要参考了kaggle notebook Optimization approaches for Transformers | Kaggle,其中梯度累积Gradient Accumulation,冻结Freezing已经在之前的博客中介绍过,本文会依次介绍混合精度训练Automatic Mixed Precision, 8-b

【Kaggle】如何有效避免OOM和漫长的炼丹过程

本文介绍一些避免transformers的OOM以及训练等流程太漫长的方法,主要参考了kaggle notebook Optimization approaches for Transformers | Kaggle,其中梯度累积Gradient Accumulation,冻结Freezing已经在之前的博客中介绍过,本文会依次介绍混合精度训练Automatic Mixed Precision, 8-b

机器学习-kaggle超市客户分类

#本次采用Kmans分析数据 import pandas as pd import numpy as npp from matplotlib import pyplot as plt from sklearn.cluster import KMeans import matplotlib import warnings warnings.filterwarnings('ignore') #设置全部列显示和浮点数格式 #pd.set_option pd.set_opt

【项目实战】Kaggle电影评论情感分析

前言 这几天持续摆烂了几天,原因是我自己对于Kaggle电影评论情感分析的这个赛题敲出来的代码无论如何没办法运行,其中数据变换的维度我无法把握好,所以总是在函数中传错数据。今天痛定思痛,重新写了一遍代码,终于成功。 从国籍分类入手 在这个题目之前,给了一个按照姓名分类国籍的写法 h

NOTE_PYTHON机器学习及实践-从零开始通往KAGGLE竞赛之路

NOTE_PYTHON机器学习及实践-从零开始通往KAGGLE竞赛之路 作为笔记记录阅读,因为调用库的更新,相对应的对代码也进行了更新。 1.机器学习综述 所谓具备“学习”能力的程序都是指它能够不断地从经历和数据中吸取经验教训,从而应对未来的预测任务。我们习惯地把这种对未知的预测能力叫做

NLP实验打榜全程记录(Kaggle)

资料搜集 1.实验公开资料 中南大学NLP打榜 操作说明 2.收集资料

Kaggle学习笔记之Pipelines

Kaggle中级机器学习 - Pipelines Pipeline:https://sklearn.apachecn.org/#/docs/master/38 ColumnTransformer:https://scikit-learn.org/stable/modules/generated/sklearn.compose.ColumnTransformer.html 通过预处理来部署(甚至测试)复杂模型的关键技能:管道机制 目录使用管道的优

数据分析师相关

来源:知乎(风清扬) 偏技术型数据分析师:数据挖掘工程师、算法工程师、大数据工程师     学习: 几百道leetcode题, excel:主要掌握vlookup、透视表和一些常用图表,不会的函数直接百度 sql:笔试必考,一定要熟,面试的时候大概率是手撕sql,《sql必知必会》,增删改查主要是查询、        练习

解决Kaggle账号注册没有显示验证码

Kaggle账号注册无法显示验证码 问题解决: 之所以没有显示验证码,是因为访问官网失败,尝试安装谷歌助手并没有解决问题,最后下载这个软件才访问成功。 1、百度搜索fotiaoqiang下载 或 点击->>软件下载链接 2、软件安装后,点击中间的按钮:连接 3、打开Kaggle注册:Kaggle注册 按步骤完

[kaggle] 为什么交叉特征能起到作用?

长期以来,自己在做特征的时候,为啥要做交叉特征,已经为什么交叉特征能够起到作用比较迷糊,偶然在kaggle上看见一个例子,完美的解答了这个问题。 数据如下: 数据ID 类别ID X GroupX(交叉特征) Label A 1 1 0.75 1 B 1 0 0.75 1 C 1 1 0.75 1 D 1 1 0.75 1 E 2 0 0.33 0 F

每日一书丨一书帮你了解算法竞赛时代的奥秘

大家好,我是帅东哥。 近几年国内数据科学、机器学习技术的应用和覆盖越来越广,而且普及的脚步也越来越快。一个明显的现象就是各种竞赛的层出不穷,各大互联网公司、高校、平台机构都开始组织数据科学竞赛了,比较有名的有腾讯广告算法、阿里天池。 我一直强调,对于数据科学爱好者而言,

每日一书丨一书帮你了解算法竞赛时代的奥秘

 大家好,我是帅东哥。 近几年国内数据科学、机器学习技术的应用和覆盖越来越广,而且普及的脚步也越来越快。一个明显的现象就是各种竞赛的层出不穷,各大互联网公司、高校、平台机构都开始组织数据科学竞赛了,比较有名的有腾讯广告算法、阿里天池。 我一直强调,对于数据科学爱好者而

 Kaggle基本知识

目录 Kaggle介绍1. 基本情况2.含金量 部分Kaggle题目kaggle的比赛类型选择1. 面向初学者:2. 面向竞赛者:3. 面向求职者:4. 其他比较冷门的比赛类型:★.**建议** 申请Kaggle项目1.项目导师背景:2.项目进阶分级:3.预期成果: 案例分享 Kaggle介绍 1. 基本情况 kaggle成立于2010年,是

每日一书丨一书帮你了解算法竞赛时代的奥秘

大家好,我是帅东哥。 近几年国内数据科学、机器学习技术的应用和覆盖越来越广,而且普及的脚步也越来越快。一个明显的现象就是各种竞赛的层出不穷,各大互联网公司、高校、平台机构都开始组织数据科学竞赛了,比较有名的有腾讯广告算法、阿里天池。 我一直强调,对于数据科学爱好者而言,

从小白到进阶 | 10个适合数据人练手的Kaggle数据集

CDA数据分析师 出品 作者:Andrew Lombarti 编译:Mika Kaggle是一个很流行的数据科学竞赛平台。在上面,你不仅可以参加各种数据分析题竞赛,还可以通过各行业的真实数据集来实践自己的技能。 在本文中我们将介绍10个数据集,从适合新手小白到高级进阶人群的都有。这些数据集非常有趣

考研进度记录表(复试准备阶段)

日期编程项目文献12.31《Python编程–从入门到实践》 第1章 起步第2章 变量和简单数据类型第3章 列表简介1.1《Python编程–从入门到实践》 第4章 操作列表第5章 if语句Kaggle–Titanic Tutorial1.2Kaggle – Titanic Advanced Feature Engineering Tutorial

读书笔记《Deep Learning for Computer Vision with Python》- 第三卷 第9章 Kaggle竞赛:情绪识别

        第三卷 第九章 Kaggle竞赛:情绪识别         在本章中,我们将解决Kaggle的面部表情识别挑战。为了完成这项任务,我们将在训练数据上从头开始训练一个类似VGG的网络,同时考虑到我们的网络需要足够小和足够快才能在我们的CPU上实时运行。         人

从零开始数据分析Kaggle项目——泰坦尼克号(五)

从零开始数据分析Kaggle项目—泰坦尼克号2—2.1 # title: "Kaggle项目泰坦尼克号 2__2.1" # author: "小鱼" # date: "2021-12-17" import pandas as pd import numpy as np df = pd.read_csv("train.csv") # 查看每个特征缺失值个数 df.isna().sum() df.info() <cla

Kaggle API下载与安装

1.下载 pip install kaggle 2.下载api码 account中找到api,点这个下载kaggle.json   3.将kaggle.json放在 .kaggle 目录下 cp kaggle.json /Users/用户名/.kaggle 4.列出关于xxx的所有比赛 kaggle competitions list -s xxx 5.下载 比赛名称 下的Data中所有文件,并指定下载路

kaggle 泰坦尼克事件——随机森林算法实现

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 泰坦尼克事件——随机森林算法实现 前言实现步骤1.引入库2.加载数据集3.具体步骤4.数据清洗5.进行特征构建6.构建新的字段,基于scikit-learn中的LabelEncoder()7.特征选择(根据实际情况进行选择,选择不唯一)8.获取

2021-11-05

fakeforensics++ 数据集下载 fakeforensics++ 数据集下载地址 找了很久 github给的脚本下载一般总是中断 结果在kaggle上找到了… 链接: https://www.kaggle.com/sorokin/faceforensics.

向kaggle中添加包

1,找到tensorflow_privacy包的路径 2,打包压缩成.zip 3,采用kaggle中添加dataset的形式添加该包 4,添加: import os for dirname, _, filenames in os.walk(’/kaggle/input’): for filename in filenames: print(os.path.join(dirname, filename)) 5,添加: import sys sys.path.in

!!! 免费GPU配置,亲测有效!!!

文章目录 免费GPU配置,亲测有效(tensorflow,pytorch均可使用)配置流程1、kaggle 简介1、kaggle注册使用教程参考内容 免费GPU配置,亲测有效(tensorflow,pytorch均可使用) 配置流程 1、kaggle 简介 kaggle 创立于2010年,主要用于学习竞赛、托管数据库、编写和分享代码。(科研工

Kaggle:修改上传文件、使用自定义的包/脚本

在kaggle,如果想用自己写的py文件,需要注意两个地方: py文件用add data的方式上传,它的路径在input文件夹中,而我们的notebook在work里。这里需要调整下当前路径: 新起一个cell输入(不用加感叹号) cd /kaggle/input/your_file 检查下路径是否正确 pwd 我们写的包如果有代码需要修改