首页 > TAG信息列表 > 度量

为机器学习项目设定和衡量目标

为机器学习项目设定和衡量目标 这篇文章涵盖了我们生产中的机器学习课程的“目标和成功措施”讲座的一些内容。其他章节见 表中的内容 . 由于高度重视机器学习,许多项目专注于优化 ML 模型以提高准确性。但是,在构建生产系统时,机器学习组件有助于系统的总体目标。要成功构建产品,了

使用Torchmetrics快速进行验证指标的计算

TorchMetrics可以为我们提供一种简单、干净、高效的方式来处理验证指标。TorchMetrics提供了许多现成的指标实现,如Accuracy, Dice, F1 Score, Recall, MAE等等,几乎最常见的指标都可以在里面找到。torchmetrics目前已经包好了80+任务评价指标。 TorchMetrics安装也非常简单,只需要P

空间旋转,平移用数学表示

向量: 点积(点乘、内积、数量积):a · b = |a| × |b| × cos(θ) 或 a · b = ax × bx + ay × by 叉积(叉乘、向量积):a × b = |a| |b| sin(θ) n ,结果是一个向量(且垂直于a,b),n代表垂直于a,b的单位向量。 三维坐标下,cx = aybz − azby;cy = azbx −

DSA概述

DSA:DataStructure + Algorithm 课程 清华大学邓俊辉数据结构与算法 https://dsa.cs.tsinghua.edu.cn/~deng/ds/dsacpp/ 概论 什么是计算 评判DSA优劣的参照(直尺) 度量DSA性能的尺度(刻度) DSA性能度量的方法 DSA的设计及其优化 计算 算法 特定计算模型下,旨在解决特定问题的指

HorizontalPodAutoscaler 自动扩容方式

HorizontalPodAutoscaler(简称 HPA ) 自动更新工作负载资源(例如 Deployment 或者 StatefulSet), 目的是自动扩缩工作负载以满足需求。 水平扩缩意味着对增加的负载的响应是部署更多的 Pod。 这与 “垂直(Vertical)” 扩缩不同,对于 Kubernetes, 垂直扩缩意味着将更多资源(例如:内存或 CP

10个常用的损失函数解释以及Python代码实现

什么是损失函数? 损失函数是一种衡量模型与数据吻合程度的算法。损失函数测量实际测量值和预测值之间差距的一种方式。损失函数的值越高预测就越错误,损失函数值越低则预测越接近真实值。对每个单独的观测(数据点)计算损失函数。将所有损失函数(loss function)的值取平均值的函数称为

NOKOV度量光学动作捕捉系统工作流程

如果你对影视、动画或者游戏有一定关注,相信你一定听说过“动作捕捉”。事实上,无论是屏幕中的战场,还是真实的军事领域,从2K游戏中的虚拟球员,到医疗、康复、运动领域的专业研究;从机器人/无人机的研发设计,到海底隧道的测量工作;科研、工业、教育、娱乐、军事等各个领域中,光学动作捕捉都

聊聊自动化测试的度量指标

本文是自动化测试系列的第四篇文章,这篇文章我想聊聊对自动化测试度量的一些想法。 上周末在知识星球社群的内部分享中,也有同学问了这个问题:自动化测试度量指标有哪些?各有什么价值? 脱离数据支撑谈价值多少有点底气不足,但脱离自动化的初衷和背景谈度量指标,就有些南辕北辙了。   做

深度度量学习中的损失函数

1、对比loss/Contrastive Loss 1、经典对比loss 目的:对于positive pair,输出特征向量间距离要尽量小;对于negative pair,输出特征向量间距离要尽量大,但若 特征向量距离大于一定值,则不处理这种easy negative pair 经典的Contrastive Loss形式来自于LeCun的文章:Dimensionality Reductio

大数据基准测试

一、简介     二、大数据基准测试的步骤   1. 数据准备    2. 负载选择     3. 指标度量    三、

如何设计自动化测试case?

本文是自动化测试系列的第三篇文章。 前面两篇文章聊了自动化测试在团队中落地的必要性和注意事项,这篇我想聊聊设计自动化测试case的一些实践和观点。   为什么要设计case? 无论是功能测试还是自动化测试甚至性能测试,设计测试case都是必须的。 当然,不同的测试类型,在设计测试case

机器学习—性能度量

一个机器学习模型需要一些性能度量指标来判断它的好坏,了解各种评估的方法优点和缺点,在实际应用中选择正确的评估方法是十分重要的。 对于分类模型的各种性能度量的算法,如准确率(Accuracy)、精确率(Precision)、召回率(Recall)、F1值等,接下来我们将详细的说明这些行性能度量算法。

随笔七:度量工程生产力

使用适当的指标进行数据渠道决策。 依赖数据往往使大多数决策是客观的而不是主观的。 但是从人的角度收集和分析数据有其自身的挑战。   为什么要度量工程生产力   业务的大规模发展,需要增加额外的人员,也可以通过提高每个人的生产力来解决。那么我们就要学会如何提供工程师的工

主动学习(Active Learning) 概述、策略和不确定性度量

主动学习是指对需要标记的数据进行优先排序的过程,这样可以确定哪些数据对训练监督模型产生最大的影响。 主动学习是一种学习算法可以交互式查询用户(teacher 或 oracle),用真实标签标注新数据点的策略。主动学习的过程也被称为优化实验设计。 主动学习的动机在于认识到并非所有标

欧氏距离 曼哈顿距离

欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为: 欧氏距离虽然很有用,但也有明显的缺点。它将样品的不同属性(即各指标或各变量量纲)之间的差别等同看待,这一点有时不能满足实际要求

测试需要做单元测试吗?

昨天在技术交流群里,有同学说自己还想多学点技术,打算去做单元测试,写单测代码来提升技术,然后群里的同学就测试要不要做单元测试展开了很多讨论。 单元测试这方面我没有太多的实践经验,但工作过的几家公司在单元测试的上都有不同程度的落地实践。 这篇文章,我会基于自己的一些实践经

DevOps落地实践点滴和踩坑记录-(1)

记录初衷 本人一直在从事企业内DevOps落地实践的工作,走了不少弯路,也努力在想办法解决面临的问题,期间也经历过不少人和事情,最近突然有想法把经历过的,不管好的不好的都记录下来,分享给和我一样的一线实践者。 我会通过一个个典型故事或场景来叙述,不谈理论,不谈技术, 只谈遇到的人和事,

漫谈测试覆盖率

写这篇文章的动力其实源自昨晚饭后在马路上散步时的一些想法,要谈的内容如标题所述:测试覆盖率。 我在之前的文章,写过对质量保障体系建设的一些思考,也写过对质量度量的一些看法, 所谓测试覆盖率这个词,大多源于质量度量的一个指标或者说维度。因为要度量,要可量化,才有了覆盖率这一维度

Metrics简介

Metrics 简介 metrics作为一款监控指标的度量类库,提供了许多工具帮助开发者来完成各项数据的监控。 metrics提供5中基本的度量类型:meters、gauges、conters、histgrams、timers Meter(测量)是一种只能自增的计数器,通常用来度量一系列事件发生的概率。它提供了平均速率,以及指数

Proj CMI Paper Reading: Mining Metrics to Predict Component Failures

Abstract 研究: 任务:What is it that makes software fail? 数据集:post-release defect history of five Microsoft software systems 结论:容易发⽣故障的软件在统计上与代码复杂性度量相关 前提:没有一套简单的复杂性度量能够全面通用地描述软件缺陷 方法:在代码度量上做主成分分析,

Proj CMI Paper Reading: Fuzzing: On the Exponential Cost of Vulnerability Discovery

Abstract 数据集:300个开源程序 超过 4 个 CPU 年,涉及2个greybox fuzzers,四个代码覆盖度量和两个漏洞发现度量 发现:重新发现相同的漏洞很便宜,但发现新的漏洞很昂贵。即使在没有并行化开销的简化假设下也是如此

聊聊我对质量度量的看法

这篇文章要聊的话题,源于某个测试交流群一位测试同学的提问。 关于质量度量,业内已经有很多资深的同学分享过他们的观点和看法,也有很多文章聊过这个话题。 这篇文章我想从我的角度出发,聊一些关于质量度量,不一样的理解。   质量需不需要度量? 先聊第一个问题:质量需不需要度量? 答案显

151-模型-Power BI&Power Pivot模型DAX函数使用量分析

151-模型-Power BI&Power Pivot模型DAX函数使用量分析 1、背景 我们在 Power BI 或者 Power Pivot 项目中会写很多的 DAX 表达式。在最后项目交付的时候,我们也想看看我们的 DAX 到底写了多少,那么应该怎么去实现呢。 我们先来看看最后的效果。 我们也把文件这个 Power BI 报告发布

从玄学走向科学:在字节跳动广告投放这么干

字节跳动 A/B Tester 团队将 A/B test 实验方法应用在广告营销领域,并首先在西瓜视频成功实践,用科学实验衡量决策收益,让广告营销从创意玄学走向数据科学。 文 | 字节跳动数据平台 A/B Tester 团队 我有一半的广告费都被浪费了! “我有一半的广告费都被浪费了,但就是不知道是哪一半。

度量空间笔记整理及教材不严谨之处分析

以下笔记整理基于 Walter Rudin 所著的 《Principles of Mathematical Analysis Third Edition》(数学分析原理第三版),在下文以及标题中简称为教材. 定义1:度量空间 度量空间(metric space)是一个集合,记为 X,其元素称作点,在 X 上定义一个适用于其中任意两点 p 和 q 距离函数 d(p, q),该函