computer-vision

首页 > TAG信息列表 > computer-vision

使用Python从图像创建数据集以进行人脸识别

我正在尝试用Python编写人脸识别程序(我将应用k-nn算法进行分类). 首先,我将图像转换为灰度,然后创建了一个长列向量(通过使用Opencv的imagedata函数),该向量具有图像的像素(总共128×128 = 16384个特征) 因此,我得到了如下数据集(最后一列是类标签,我只显示了数据集的前7个特征,而

双边过滤算法

我正在尝试在javascript中实现一个简单的双边过滤器.到目前为止,这是我想出的： // For each pixel for (var y = kernelSize; y < height-kernelSize; y++) { for (var x = kernelSize; x < width-kernelSize; x++) { var pixel = (y*width + x)*4; var sumWei

使用OpenCV计算DCT

我试图在OpenCV中使用dct()函数来计算离散余弦变换,但结果却很奇怪. 我的脚本是： import os, sys import cv, cv2 import numpy as np fn1 = 'original.jpg' img1 = cv2.imread(fn1, cv2.CV_LOAD_IMAGE_GRAYSCALE) h, w = img1.shape[:2] vis0 = np.zeros((h,w), np.float32) vis

java-识别位图中的徽标-android

我想检测用户相机视图中的徽标图像-例如是否StackOverflow徽标印在纸上并通过相机查看.或者说,对于较简单的方法,我想在位图中进行检测.我想识别是否有一个特定的徽标-可以将其硬编码到应用程序中. 使用像OpenCV这样的开源库是否有可能实现,或者实现它需要大量的工时？解决方法:openc

python-正方形检测,边缘有像差,一个缺失的角

c#-查找图像中的棋盘,并确定角度和距离

我想要做的是获取一个源图像,其中将包含一个已知物理尺寸和一个已知正方形数的黑白方格板,并标识该板的边界以及其所处的角度被观察到(假设其完全平坦)并从什么距离观察到. 如果我可以可靠地识别棋盘的四个角,那么我知道如何计算角度和距离,因此任务更多是关于识别棋盘的事情. 到目

Python OpenCV立体摄像头位置

我想确定立体摄像机相对于其在世界坐标系中的先前位置的位置和方向.我使用的是大黄蜂XB3相机,立体声对之间的运动约为几英尺. 这会走上正确的轨道吗？ >获得每对的校正图像 >检测/匹配特征点校正图像>计算基本矩阵>计算基本矩阵谢谢你的帮助！解决方法:好吧,这听起来像您对自己想做的

python-OpenCV中的Canny可以同时处理灰度和彩色图像吗？

我对OpenCV中的Canny边缘检测器有一些疑问. 这是我尝试的代码. def auto_canny(image, sigma=0.33): v = np.median(image) lower = int(max(0, (1.0 - sigma) * v)) upper = int(min(255, (1.0 + sigma) * v)) edged = cv2.Canny(image, lower, upper) 然后, #

python-转换矩阵

我一直在审查关于仿射和投影(或透视图)转换的一些资料.我已经审查了PIL和Wikipedia的内容. (http://zh.wikipedia.org/wiki/Transformation_matrix) 不幸的是,我似乎无法找到指定如何形成图像仿射或投影变换矩阵的细节.维基百科的文章似乎与我发现的其他资源有所不同. 网络上是否有

python-Rubik cubefinder.py错误

我想使用一些发现的代码从该站点检测Rubiks多维数据集：cubefinder.py. 在设法安装所有OpenCV库之后,将多维数据集显示给摄像机时出现此错误： Python 2.7.2 (default, Jun 12 2011, 15:08:59) [MSC v.1500 32 bit (Intel)] on win32 Type "copyright", "credits" or "license()" for

python-将屏幕快照加载到内存中以进行简历模板匹配的最快方法

在ubuntu 11.10中,用python截屏并将截屏转换为与图像模板匹配的this question兼容的格式的最快方法是什么？解决方法:xpresser是在ubuntu中工作的项目,该项目也使用opencv.在xutils module中,有一个用于截取屏幕截图的功能,如下所示： def take_screenshot(x=0, y=0, width=None, heig

Python中的3D Sobel算法？

我正在尝试在python中计算3d sobel过滤器.我下面有一个很好的2d图像代码. 顺便说一句我的原始图像是uint8类型. preSobel = preSobel.astype('int32') dx = ndimage.sobel(preSobel, 0) # horizontal derivative dy = ndimage.sobel(preSobel, 1) # vertical deriva

打开CV-Python RGB到GREY转换器

我想将此RGB转换为灰度转换器,而没有任何内置的Open-CV功能.这就是我的代码的样子 import cv2 , numpy def GrayConvertor(img): rows , cols , layers = img.shape matrix = numpy.zeros((rows , cols)) for i in range(rows): for j in range(cols):

当我尝试在Android-NDK上使用getPerspectiveTransform转换透视图图像时,声明失败

所以我试图在ndk上使用opencv在android上检测一个正方形对象,并将其裁剪为2D图,我检测到正方形的点,但是当我尝试使用getPerspectiveTRansform(src,dst)时,出现此错误消息： OpenCV Error: Assertion failed (src.checkVector(2, CV_32F) == 4 && dst.checkVector(2, CV_32F) == 4)

python-在3通道输入中使用HoughCircles时出错

在检测圈子之前,我将红色通道替换为绿色通道.替换通道后,我将其通过模糊滤镜,然后进行霍夫变换以检测圆.但是当我这样做时,我得到了一个糟糕的错误消息： OpenCV(3.4.1) Error: Assertion failed (!_image.empty() && _image.type() == (((0) & ((1 << 3) - 1)) + (((1)-1) << 3)) &

C#上的边缘检测

我有一个这样的黑白图像(彩色叠加层是我的,可以删除)：我需要弄清楚所显示手的边缘,该怎么做？我当前的算法： List<Point> edgePoints = new List<Point>(); for (int x = 0; x < largest.Rectangle.Width && edgePoints.Count == 0; x++) { //top

python-Keras中的idct自定义层

我试图在Keras中为IDCT(逆离散余弦变换)编写一个自定义层,因为与DCT相比,在Keras中没有IDCT的内置功能.因此,当我将图层写为： model = Sequential() model.add(Conv2D(512,1,activation='relu', input_shape= (8,8,64) )) model.add(Lambda( lambda x: get_2d_idct_tensor(x) ) )

如何使用OpenCV从图像中删除特定的标签/贴纸/对象？

我有数百幅珠宝产品图片.其中一些带有“畅销书”标签.标签的位置因图像而异.我想遍历所有图像,如果图像具有此标签,则将其删除.生成的图像将在移除的对象的像素上渲染背景. 带有标签/贴纸/对象的图像示例：标签/贴纸/要删除的对象： import numpy as np import cv2 as cv img = plt.

c-显示时图像改变形状

我正在尝试显示此图像,因为我的目录中有此图像但是我用这段代码显示它 Mat img=imread("D:\\vig.png"); imshow("image",img); waitKey(); imwrite("D:\\img.jpg",img); 相同的图像显示如下它出什么问题了解决方法:您的小插图仅位于alpha [4th]通道中,并且看起来像是倒置的(此

反转颜色OpenCV Java Api

如何在OpenCV的Java API中反转存储在Mat图像中的图像的颜色？使用image.inv()会给我一个错误.解决方法:inv()方法将尝试取矩阵的逆函数,这就是失败的原因(很可能您的图像矩阵不可逆). 您可以相互减去两张图像,因此可以创建所有值均为255的图像,然后从中提取原始图像(如果这是通过反转

c-从对象的图像坐标获取世界坐标

我一直在关注this文档以使用OpenCV.在下面的公式中,我成功地计算了内部矩阵和外部矩阵(我已使用SolvePnP()过程获得了这些矩阵).由于对象位于地面上,因此我已替换Z =0.然后,我刚刚删除了非本征矩阵的第三列,并将其与本征矩阵相乘以获得3X3投影矩阵.我将其取反,然后将其乘以图像坐标

在Python中保存1位深的二进制映像

我在Python中有一个二进制映像,我想将其保存在我的PC中. 一旦存储在计算机中,我需要将其设置为1位深的png图像.我怎样才能做到这一点？我尝试使用PIL和cv2,但无法保存1位深度.解决方法:采用： cv2.imwrite(<image_name>, img, [cv2.IMWRITE_PNG_BILEVEL, 1]) (这仍将使用压缩,因此在

c – openCV中的高斯拉普拉斯运算符,如何找到过零点？

openCV中有拉普拉斯函数,它直接计算双导数.但这并不意味着我会抓住边缘吗？因为在输出中有许多负值. 我通过这个链接,意识到在那之后我也必须找到过零点.我不知道如何找到过零点.有人能帮助我吗？解决方法:当发生零交叉时 >一个值等于0,或>两个相邻的值具有相反的符号如果你有类似的东

c – 使用带SURF的SVM获取错误

下面是我的代码,运行正常,但经过长时间的处理,它显示运行时错误 // Initialize constant values const int nb_cars = files.size(); const int not_cars = files_no.size(); const int num_img = nb_cars + not_cars; // Get the number of images // Initialize your training s

使用Keras卷积网络的内存问题

我对使用大数据的ML非常陌生,之前我曾使用Keras通用卷积示例进行狗/猫分类,但是当我对我的图像集应用类似的方法时,我遇到了内存问题. 我的数据集由非常长的图像组成,大小为10048 x1687像素.为了避免内存问题,我使用批量大小为1,一次向模型提供一个图像. 该模型有两个卷积层,每个层