首页 > TAG信息列表 > 架构

Apache Flink 对数据架构的影响

在数据驱动型决策时代,数据湖仓范式已成为一种有前途的解决方案,汇集了数据湖和数据仓库的优点。通过将数据湖的可扩展性与仓库的数据管理功能相结合,数据湖庄提供了高度可扩展、敏捷且经济高效的数据基础架构。它们为分析和运营工作负载提供强大的支持,使组织能够从其数据中获取更多价

如何在分布式数据库中进行数据复制?分布式数据库中数据复制的优点和缺点

本文中,我们将讨论分布式数据库中数据复制的优缺点。首先,我们将了解数据复制,然后讨论分布式数据库中的数据复制。在其他计算机上保留和维护重要数据的多个副本的过程称为数据复制。接下来,我们将讨论分布式数据库中数据复制的优缺点。现在,让我们进入主要主题。介绍复制数据的过程涉及

JDK中自带的JVM分析工具

一、业务背景对于分布式架构中的文件服务来说,由于涉及大量的IO流操作,很容易引发JVM的相关异常,尤其是内存溢出的问题;在最近的一次版本迭代中,真实的业务处理场景和上述几乎一致,由于在文件服务中添加批量处理的动作,直接唤醒了隐藏许久的BUG,就是最常见的内存溢出;问题的起因:在word文档完

了解Pytorch|Get Started with PyTorch

Basics就像Tensorflow一样,我们也将继续在PyTorch中玩转Tensors。从数据(列表)中创建张量data = [[1, 2],[3, 4]]tensors = torch.tensor(data)tensorstensor([[1, 2], [3, 4]])从NumPy创建np_array = np.arange(10)tensor_np = torch.from_numpy(np_array)tensor_nptensor([0, 1, 2,

Kubernetes后台数据库etcd:安装部署etcd集群,数据备份与恢复

一.系统环境 服务器版本 docker软件版本 CPU架构 CentOS Linux release 7.4.1708 (Core) Docker version 20.10.12 x86_64 二.前言etcd 是兼顾一致性与高可用性的键值对数据库,可以作为保存 Kubernetes 所有集群数据的后台数据库。保持 etcd 集群的稳定对 Ku

字节微服务HTTP框架Hertz使用与源码分析

一、前言Hertz[həːts] 是一个 Golang 微服务 HTTP 框架,在设计之初参考了其他开源框架 fasthttp、gin、echo 的优势, 并结合字节跳动内部的需求,使其具有高易用性、高性能、高扩展性等特点,目前在字节跳动内部已广泛使用。 如今越来越多的微服务选择使用 Golang,如果对微服务性能有要

【深入浅出 Yarn 架构与实现】2-1 Yarn 基础库概述

一、主要使用的库 Protocol Buffers:是 Google 开源的序列化库,具有平台无关、高性能、兼容性好等优点。YARN 将其用到了 RPC 通信中,默认情况 下,YARN RPC 中所有参数采用 Protocol Buffers 进行序列化 / 反序列化。 Apache Avro:是 Hadoop 生态系统中的 RPC 框架,具有平台无关、支持动

你需要知道的4个数据库扩展解决方案

你已经用一个直观的、用户友好的用户界面启动了你的应用程序。但是,如果你的应用程序遇到负载问题,这将使你的终端客户在使用它时感到沮丧。很有可能问题不在应用程序内部,而是在数据库。根据一项调查,38%的数据库专业人员报告说数据库停机是让他们夜不能寐的重要问题。停机可能是由于

EasyExcel对大数据量表格操作导入导出

前言最近有个项目里面中有大量的Excel文档导入导出需求,数据量最多的文档有上百万条数据,之前的导入导出都是用apache的POI,于是这次也决定使用POI,结果导入一个四十多万的文档就GG了,内存溢出... 于是找到EasyExcel的文档,学习了一番,解决了大数据量导入导出的痛点。由于项目中很多接口

使用 Go HTTP 框架 Hertz 进行 JWT 认证

Demo 介绍 使用命令行工具 hz 生成代码 使用 JWT 扩展完成登陆认证和授权访问 使用 Gorm 访问 MySQL 数据库Demo 下载git clone https://github.com/cloudwego/hertz-examples.gitcd bizdemo/hertz_jwtDemo 结构hertz_jwt├── Makefile # 使用 hz 命令行工具生成 hertz 脚手架代

大型网站架构系列:分布式消息队列(一)

一、消息队列概述消息队列中间件是分布式系统中重要的组件,主要解决应用耦合,异步消息,流量削锋等问题。实现高性能,高可用,可伸缩和最终一致性架构。是大型分布式系统不可缺少的中间件。目前在生产环境,使用较多的消息队列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ等。二、消息队列

大数据算法——布隆过滤器

理在我之前的理解当中,如果想要判断某个元素在不在集合当中,经典的结构应该是平衡树和hash table。但是无论是哪一种方法,都逃不开一点,都需要存储原值。比如在爬虫场景当中,我们需要记录下之前爬过的网站。我们要将之前的网址全部都存储在容器里,然后在遇到新网站的时候去判断是否已经爬

【深入浅出 Yarn 架构与实现】2-2 Yarn 基础库 - 底层通信库 RPC

RPC(Remote Procedure Call) 是 Hadoop 服务通信的关键库,支撑上层分布式环境下复杂的进程间(Inter-Process Communication, IPC)通信逻辑,是分布式系统的基础。允许运行于一台计算机上的程序像调用本地方法一样,调用另一台计算机的子程序。 由于 RPC 服务整体知识较多,本节仅针对对 Yarn R

Django更换数据库和迁移数据方案

基本步骤Django 默认使用 SQLite 数据库方便开发,同时其 ORM 支持多种数据库,只要安装对应的驱动就行。切换数据库一般是将开发环境的 SQLite 切换到 MySQL (MariaDB) 或 PostgreSql ,本文只测试了从 SQLite 到 MySQL / PostgreSQL,同理,其他切换路径也是可以的。数据库的表结构没啥问题

Redis Cluster 数据分片

介绍 Redis ClusterRedis 集群是 Redis 提供的分布式数据库方案, 集群通过分片(sharding) 来进行数据共享, 并提供复制和故障转移功能。节点一个 Redis 集群通常由多个节点(node) 组成, 在刚开始的时候,每个节点都是相互独立的,它们都处于一个只包含自己的集群当中, 要组建一个真正可工作的集

数据科学与软件工程:细微的区别

数据科学和软件工程是基于IT的领域,发挥着广泛的组织功能。这两个领域都需要来自不同领域的广泛编程技能。这些领域的职业机会与日俱增。 这份题为“2022 年印度分析和数据科学职位”的报告展示了以下结果: 与 2021 年 6 月全球 9.4% 的空缺职位相比,仅印度就有 11.6% 的空

用于停止云 SQL 数据库的云计划程序

我们在 mkdev 拥有的应用程序之一是 Claimora 我们用它来跟踪时间。当我们想要部署Claimora时,我们有两个环境,暂存和生产,在每个环境中,我们都有一个Postgres数据库启动并运行。当我们不在环境中工作时,我们希望省钱,为此,我们将在工作时间结束时停止数据库。让我们看看我们能做什么。为

Go Vuln the Golang 漏洞数据库

什么是govuln?Govuln 是一个新的漏洞数据库,用于查找代码中易受攻击的软件包并防止供应链攻击如何安装 thecligovulncheckgovulncheck是用于与数据库交互并对照数据库检查代码的命令行推理,请使用以下命令安装它:go install golang.org/x/vuln/cmd/govulncheck@latest然后在项目中运行

Spring Boot 中使用 tkMapper

简介tkMapper 就是一个 MyBatis 插件,基于 MyBatis 提供很多工具,提高开发效率,主要有以下两个功能。 提供针对单表通用的数据库操作方法 逆向工程(根据数据表自动生成实体类、Dao 接口、Mapper 映射文件)MyBatis 基础环境tkMapper 的使用需要基于 MyBatis。 创建 Spring Boot 项目,选中

将数据库洒入 Next.js 和 Vercel 上的静态站点

首先,我们将实现 UI。import { useState } from 'react'import { MdThumbUp } from 'react-icons/md'export default function Component(props) { const [likeCount, setLikeCount] = useState(props.likeCount) const [liked, setLiked] = useSta

Scrapy实例教程

Scrapy实例教程 Scrapy是一套根据Twisted异步处理架构,纯Python网络爬虫架构。 用户只需开发和设计多个简单的控制模块,就可以轻松完成一个网络爬虫。可用于捕捉网页的具体内容及其图片,应用简单方便。 Scrapy架构主要是由于ScrapyEngine(模块),Scheduler(调度器),Downloader(下载工具

太神了!开源大佬的SpringBoot+微服务架构笔记,一般人真肝不出来

SpringBoot是企业级开发的整体整合解决方案,特别用于快速构建微服务应用,旨在用最简单的方式让开发人员适应各种开发场景;下面是SpringBoot的优点: 简化Spring应用开发的一个框架; 整个Spring技术栈的一个大整合; J2EE开发的一站式解决方案; 为了帮助大家更好的理解并运用SpringBoot小

聊聊秒杀系统的设计(一)

​  一、秒杀是什么? 秒杀系统的业务逻辑和复杂程度都被大众熟知,其实主要解决的问题有两个——高并发和一致性。其中高并发又分为读和写,要减少用户从服务端读取数据,控制数据的传输大小;写则需要独立处理数据库。一致性是指保证库存数据的准确,超卖和超买都是不能出现的。至于高可用