首页 > TAG信息列表 > TOWARDS
PromptDet: Towards Open-vocabulary Detection using Uncurated Images
使用image-text pair数据+anation数据训练的2阶段检测模型FastRCNN,具有开集检测能力 1、动机 引入image-text pair LAION-400M数据集,训练开集检测模型 2、模型 2阶段检测模型Fast RCNN,分类层换成CLIP模型text encoder生成分类器 针对image-text pair数据集LAION-400M利用方式的问【论文笔记】Towards Certifying l-infinity robustness using neural networks with l-infinity-dist neurons
原文地址 slides GitHub 代码 本文发表于 2021 ICML,提出了一个新颖的神经网络计算方式:对于网络中的每个神经元,不采用传统的线性转换+非线性激活函数的方式,而是计算输入与参数之间的 \(\ell_{\infty}\)-distance,作者将其称为 \(\ell_{\infty}\)-dist net,网络中的神经元称为 \(\ell_【论文阅读】2022-Towards an Online Empathetic Chatbot with Emotion Causes
Towards an Online Empathetic Chatbot with Emotion Causes 2022 小米AI实验室 李嫣然 现有情感感知对话模型都集中在将回复内容与特定的情感类别进行对齐,忽略了理解和关注他人感受的过程。论文通过挖掘用户情感的诱发原因,从而生成移情回复。为了收集在线环境中的情绪原因,利用咨【论文笔记】Towards Deep Learning Models Resistant to Adversarial Attacks
摘要 作者从鲁棒优化(robust optimization)的角度研究了神经网络的对抗鲁棒性(adversarial robustness)。基于鞍点公式(min-max)本文提出了一种防御任何对抗样本的方法。 1 介绍 本文的主要贡献: 对抗样本的生成、对抗训练(即攻击与防御)是同一的,这是一个鞍点公式(下文的公式(1))的优化问题Proj CMI Paper Reading: Registered Report: DATAFLOW Towards a Data-Flow-Guided Fuzzer
Abstract 背景: 由数据流覆盖驱动的模糊器受到的关注相对较少,主要出现在使⽤重量级程序分析。不幸的是,这些 更准确的分析会导致较⾼的运行时间损失,从⽽阻碍模糊器的吞吐量。 控制流模糊测试的轻量级数据流替代⽅案仍未探索。 本文: 工具:DATAFLOW 任务:由轻量级数据流分析驱动的灰盒[论文][表情识别]Towards Semi-Supervised Deep Facial Expression Recognition with An Adaptive Confidence Mar
论文基本情况 发表时间及刊物/会议:2022 CVPR 发表单位:西安电子科技大学, 香港中文大学,重庆邮电大学 问题背景 在大部分半监督学习方法中,一般而言,只有部分置信度高于提前设置的阈值的无标签数据被利用。由此说明,大部分半监督方法没有充分利用已有数据进行训练。 论文创新点 设置了Adtraining —— Refactoring from Anemic Domain Model Towards a Rich One
Refactoring from Anemic Domain Model Towards a Rich One面向域不变的单幅图像去雾(Towards Domain Invariant Single Image Dehazing_AAAI_2021)
概述 图像中存在的雾霾会掩盖底层信息,这在需要准确环境信息的应用中是不希望的。 为了恢复这样的图像,去雾算法应该定位和恢复受影响的区域,同时确保恢复的区域与其相邻区域之间的一致性。 然而,由于卷积核的固定感受野和不均匀的雾度分布,很难保证区域之间的一致性【论文阅读】Towards emotion recognition in immersive virtual environments: A method for Facial emotion rec
1.这篇文章究竟讲了什么问题? 沉浸式虚拟环境下的情感识别,基于面部情感识别 2.这是否是一个新的问题? 不是 3.这篇文章要验证一个什么科学假设? 基于2D和3D集合特征的表情识别能够在沉浸式虚拟环境下获得较好的识别效果。 有哪些相关研究?如何归类?谁是这一课题在这领域值得关注的研究Towards High-Fidelity 3D Face Reconstruction from In-the-Wild Images Using Graph Convolutional Netwo
这篇文章也是解决从一张2D图到3D人脸精细重建的问题的。 文章自称是第一个将图神经网络用于3D人脸重建的。并且说自己的模型不需要精细的人脸纹理做监督,只需要随便的人脸图片就行。 结构如图所示,黄色的部分都是用的别人已经训练好的模型,灰色的是不可训练的,蓝色的就是需要训练的《Towards Model Compression for Deep LearningBased Speech Enhancement》
研究动机 近年来都在使用深度学习的语音增强。但是,做增强需要一个大的深度网络,但是大的网络就意味着更大的内存和计算量,这样的话,对硬件就会有更高的要求,不是很友好。所以这篇文章提出了两种压缩模型的方法,可以有效的减少模型的尺寸,减小模型尺寸用到了三种不同的技术:稀疏正则化、P5731 【深基5.习6】蛇形方阵
P5731 【深基5.习6】蛇形方阵 题目描述 给出一个不大于 9 的正整数 n,输出n×n 的蛇形方阵。 从左上角填上 1 开始,顺时针方向依次填入数字,如同样例所示。注意每个数字有都会占用 3 个字符,前面使用空格补齐。 输入格式 无 输出格式 无 输入输出样例 输入 #1复制 4 输出 #1复制Towards a Deep and Unified Understanding of Deep Neural Models in NLP
这篇文章比较难,需要较多的概率论和信息论知识,论文中公式推导给的不是特别多,有些过程并没有做推导,因此不是太能理解,不过大概意思是能懂的。 论文提出了一种知识量计算方法,通过计算每个输入的知识量,来表征每个输入的重要程度 总的想法非常简单,就是对每个输入加一个可学习的扰Proj EULibHarn Paper Reading: Towards Efficient Large-Scale Interprocedural Program Static Analysis
Abstract 和BigSpa一样https://www.cnblogs.com/xuesu/p/15760169.html 目的:large-scale 进程间分析 问题:计算代价和内存代价搞 本文:data-parallel, a join-process filter computation model 基于CFL可达性的进程间分析 面向云 效果:在百万行代码上能够进行准确进程间分析 I. IntrAutoSlim: Towards One-Shot Architecture Search for Channel Numbers阅读笔记
AutoSlim阅读笔记 (一) Title(二) Summary(三) Research Object(四) Problem Statement(五) Method5.1 搜索通道数整体方案5.2 Slimmable Networks的训练5.3 Greedy Slimming (六) Experiments(七) Conclusion(八) Notes8.1 得到最优的Channel Numbers的方法 (一) TitlTowards Multi-class Object Detection in Unconstrained Remote Sensing Imagery
Towards Multi-class Object Detection in Unconstrained Remote Sensing Imagery 面向无约束遥感图像的多分类目标检测 论文地址: https://arxiv.org/abs/1807.02700 好像没有代码 《ReDet》论文中的定向对象检测: 为了检测任意方向的目标,一些方法[1,22,43]采用了许多具有不同Towards Oracle Knowledge Distillation with NAS
【GiantPandaCV导语】本文介绍的如何更好地集成教师网络,从而更好地提取知识到学生网络,提升学生网络的学习能力和学习效率。从方法上来讲是模型集成+神经网络结构搜索+知识蒸馏的综合问题,在这里使用简单的NAS来降低教师网络与学生网络之间的差距。 背景介绍 解决的问题? 希望从集Brain-inspired global-local hybrid learning towards human-like intelligence
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! Arxiv Abstract 面向神经科学和面向计算机科学的方法的结合是开发可以学习类似于人类的一般任务的通用人工智能(AGI)的最有前途的方法。目前,存在两种主要的学习途径,包括以局部突触可塑性为代表的受神经科学启发的方法论文学习:ApproxiFuzzer: Fuzzing towards Deep Code Snippets in Java Programs(IEEE‘21)
计算机、软件和应用程序会议(COMPSAC) INTRODUCTION 深度代码片段是需要复杂的触发条件或隐藏在不太频繁调用的函数中的代码段,确定这些代码的可达性仍然是一项重大的挑战,符号执行和模糊测试都有局限性。所以本文提出一种近似模糊技术,给定目标代码片段,模糊器收集执行路Paper Reading||MQBench: Towards Reproducible and Deployable Model Quantization Benchmark
论文(NeurIPS 2021 Accepted):https://openreview.net/forum?id=TUplOmF8DsM 源码(Pytorch):https://github.com/ModelTC/MQBench 官方网站:http://mqbench.tech/ MQBench 概要 1 Motivation2 Introduction Towards Reproducible Quantization of QAT2.0 What to ExperimentHaTowards Network Anomaly Detection Using Graph Embedding笔记
Towards Network Anomaly Detection Using Graph Embedding 目录Towards Network Anomaly Detection Using Graph Embedding3、Graph Embedding Algorithm4、Network Anomaly Detection Framework5、 Evaluation5.3 Network Anomaly Detection 3、Graph Embedding Algorithm In th解读与复现:AdderSR: Towards Energy Efficient Image Super-Resolution
AdderSR: Towards Energy Efficient Image Super-Resolution ** 加法网络:高能效的完成图像超分辨率! 摘要 ** 该文主要研究使用加法神经网络(AdderNets)进行单张图超分辨率的问题。AdderNets在进行输出层计算时使用了加法运算,从而避免了传统的卷积神经网络卷积核相乘消耗的大量Learning towards Abstractive Timeline Summarization翻译
摘要 时间线摘要的目标是获得沿时间线的事件演变轨迹,而现有的时间线摘要方法均是基于抽取的方法。在本文中,我们提出了生成式时间线摘要的任务,该任务倾向于简明地解释时间戳事件中的信息。与传统的文档摘要不同,时间线摘要需要对输入事件的时间序列信息进行建模,并按时间顺序汇论文笔记丨FewRel 2.0: Towards More Challenging Few-Shot Relation Classification
作者:凯 单位:燕山大学 code:https://github.com/thunlp/fewrel paper:https://www.aclweb.org/anthology/D19-1649.pdf FewRel 2.0: Towards More Challenging Few-Shot Relation Classification 问题介绍FewRel 2.0BERT-PAIR模型 问题 小样本关系分类有两个挑战: 只有Towards Unsupervised Deep Image EnhancementWith Generative Adversarial Network借助生成对抗网络实现无监督的深度图像增强
Abstract Improving the aesthetic quality of images is challenging and eager for the public. To address this problem, most existing algorithms are based on supervised learning methods to learn an automatic photo enhancer for paired data, which consists of