首页 > TAG信息列表 > DolphinDB
墨天轮国产数据库沙龙 | 胡津铭:时序数据库DolphinDB,从量化金融到万物互联
分享嘉宾:胡津铭 DolphinDB研发副总监 整理:墨天轮社区 导读 DolphinDB是高性能分布式时序数据库,集成了功能强大的编程语言和高容量高速度的流数据分析系统,为海量结构化数据的快速存储、检索、分析及计算提供一站式解决方案。 时序数据库的主要应用场景 我今天分享的主题是“时序理解分区策略及相关概念in DolphinDB
Overview 分区是对数据库进行深入了解的关键入口。 ddb是为OLAP设计的系统,主要是解决: 海量结构化数据的快速存储和计算;通过内存数据库和流数据计算引擎实现高性能数据处理 ddb不适合数据频繁更改的OLTP; 什么是好的分区策略 一个好的分区策略通过只读取查询所需的相关数据来DolphinDB智臾科技CEO周小华:《从反向控制的终极目标谈时序数据库的架构设计》
2021年4月25-26日,由极客邦科技与InfoQ中国主办的2021ArchSummit全球架构师峰会在上海召开。本次大会聚焦业界强大的技术成果,秉承“实践第一、案例为主”的原则,展示先进技术在行业中的典型实践,以及技术在企业转型、发展中的推动作用。DolphinDB智臾科技CEO周小华博士受邀参加本次会测试报告丨DolphinDB与Pandas对于大文本文件处理的性能对比
DolphinDB Database 是一款高性能的分布式时序数据库。它集成了功能强大的编程语言和高容量高速度的流数据分析系统,为海量数据(特别是时间序列数据)的快速存储、检索、分析及计算提供一站式解决方案。Pandas是Python的一个包,最初被作为金融数据分析工具而开发,为时间序列分析提供了很DolphinDB 1.30.3版本更新:流计算引擎再升级,助你轻松搞定实时计算
在最近推出的1.30.3版本中,我们针对DolphinDB强大的流数据计算功能进行了改进和升级,让用户在复杂计算场景中(例如金融高频因子实时计算)可以拥有更好的体验。本次版本更新中主要有4大亮点:· 流批一体解决方案· 多引擎流水线处理· 流引擎快照功能· 时间序列聚合引擎支持多个时间窗口DolphinDB模块复用教程
在软件团队开发项目中,要提升开发效率和质量,代码必然要进行封装和重用。在使用DolphinDB的脚本进行开发时,可以使用module和use方法,来声明和使用可重用模块。1. Module(模块)介绍在DolphinDB中,模块是指只包含函数定义的代码包。它具有以下特点:以.dos作为模块文件的后缀,dos是"dolphindDolphinDB的权限管理和安全
DolphinDB database 提供了强大、灵活、安全的权限控制系统。控制节点(controller)作为权限管理中心,使用RSA加密方式对用户关键信息进行加密。主要功能:提供用户和组角色,方便权限控制提供8种权限控制类别,适应各种场景丰富的权限控制函数函数视图兼顾保护数据隐私与提供分析结果对任务DolphinDB内存管理详解
DolphinDB是一款支持多用户多任务并发操作的高性能分布式时序数据库软件(distributed time-series database)。针对大数据的高效的内存管理是其性能优异的原因之一。本教程涉及的内存管理包括以下方面:变量的内存管理:为用户提供与回收编程环境所需内存。分布式表的缓存管理:多个sessi干货丨DolphinDB通用计算教程
DolphinDB不仅可以分布式地存储数据,而且对分布式计算有良好支持。在DolphinDB中,用户可以用系统提供的通用分布式计算框架,通过脚本实现高效的分布式算法,而不需关注具体的底层实现。本文将对DolphinDB通用计算框架中的重要概念和相关函数作出详细解释,并提供丰富的具体使用场景和例子DolphinDB脚本语言的混合范式编程
开发大数据应用,不仅需要一个能支撑海量数据的分布式数据库,一个能高效利用多核多节点的分布式计算框架,更需要一门能与分布式数据库和分布式计算有机融合,高性能易扩展,表达能力强,满足快速开发和建模需要的编程语言。DolphinDB从流行的SQL和Python语言汲取了灵感,设计了大数据处理脚本语时序数据库丨DolphinDB流计算引擎如何实现传感器数据异常检测
DolphinDB提供了流数据表(stream table)和流计算引擎用于实时数据处理,包括物联网中传感器数据的异常检测。内置的异常检测引擎(Anomaly Detection Engine)能满足大部分异常检测场景的需求。如果异常检测逻辑复杂且较为特殊,标准化的异常检测引擎不能满足要求,用户可以用自定义消息处干货丨DolphinDB文本数据加载教程
DolphinDB提供以下4个函数,将文本数据导入内存或数据库:loadText: 将文本文件导入为内存表。ploadText: 将文本文件并行导入为分区内存表。与loadText函数相比,速度更快。loadTextEx: 将文本文件导入数据库中,包括分布式数据库,本地磁盘数据库或内存数据库。textChunkDS: 将文本文件划分干货丨手把手教你如何加载和操作DolphinDB内存分区表
DolphinDB的内存数据表可以是非分区的,也可以是分区的。除了组合分区以外的所有分区方式都适用于内存数据表。使用分区内存表进行运算能充分发挥多核CPU并行计算的优势。1. 创建内存数据表1.1 创建非分区内存表使用table函数可以创建非分区内存表。table函数的用法非常灵活:第一种用DolphinDB丨金融高频因子流批一体计算神器
前言量化金融的研究和实盘中,越来越多的机构需要根据高频的行情数据(L1/L2以及逐笔委托数据)来计算量价因子。这些因子通常是有状态的:不仅与当前的多个指标有关,而且与多个指标的历史状态相关。以国内的股票市场为例,每3秒收到一个快照,每个股票每天得到4800个快照,计算因子时可能会用到之干货丨DolphinDB集群如何扩展节点和存储
1. 概述当系统准备上线前,我们会评估和规划硬件平台的容量,并且尽可能的留出余量。可是现实往往是不能预料的,随着业务的扩张,系统的数据容量和计算能力都会变得不堪重负,我们就不得不面对一个问题:如何为现有系统增加数据容量和计算能力?由于DolphinDB的节点是集计算和存储于一体的,所以要数据安全丨DolphinDB高可用集群部署教程
1. 概述DolphinDB提供数据、元数据以及客户端的高可用方案,即使数据库节点发生故障,数据库依然可以正常运作,保证业务不会中断。DolphinDB采用多副本机制,相同数据块的多个副本存储在不同的数据节点(data node)上。即使集群中某个或多个数据节点宕机,只要集群中还有至少1个副本可用,那么数DolphinDB数据导入教程
DolphinDB提供了多种灵活的数据导入方法,来帮助用户方便的把海量数据从多个数据源导入。具体有如下4种途径:通过文本文件导入通过二进制文件导入通过HDF5接口导入通过ODBC接口导入1. DolphinDB数据库基本概念和特点本章中多处使用到DolphinDB的数据库和表的概念,所以这里首先做一个介手把手教你如何用DolphinDB进行机器学习
DolphinDB实现了一系列常用的机器学习算法,例如最小二乘回归、随机森林、K-平均等,使用户能够方便地完成回归、分类、聚类等任务。这篇教程会通过具体的例子,介绍用DolphinDB脚本语言进行机器学习的流程。本文的所有例子都基于DolphinDB 1.10.9。1. 第一个例子:对小样本数据进行分类我茅台招聘刷爆资管圈,量化巨佬钦点DolphinDB
前阵子,一条消息引爆了量化投资圈。中国量化投资界的元老级人物章飚,在朋友圈发布了“一个利好茅台的招聘”(以茅台感谢举荐成功者),宣布将组建一个以量化投资为主的家族办公室投资团队。招聘原文链接:https://rockhammer.feishu.cn/docs/doccnBCO5tqEjczhEvkr3eP6Ppc#WyYt92岗位的基本要DolphinDB客户端软件教程
DolphinDB提供了从基于Java的GUI, VS Code Extension, Web界面,到命令行等各种灵活友好的交互界面,具体包括以下6种客户端交互方式。1. DolphinDB GUIDolphinDB GUI是基于Java的功能最齐全的图形化编程以及数据浏览界面。 DolphinDB GUI可以在任何支持Java的操作系统上使用,例如: Wind干货丨DolphinDB高可用集群部署教程
1. 概述 DolphinDB提供数据、元数据以及客户端的高可用方案,即使数据库节点发生故障,数据库依然可以正常运作,保证业务不会中断。 DolphinDB采用多副本机制,相同数据块的多个副本存储在不同的数据节点(data node)上。即使集群中某个或多个数据节点宕机,只要集群中还有至少1个副本可用,那干货丨时序数据库DolphinDB客户端软件教程
DolphinDB提供了从基于Java的GUI, VS Code Extension, Web界面,到命令行等各种灵活友好的交互界面,具体包括以下6种客户端交互方式。 1. DolphinDB GUI DolphinDB GUI是基于Java的功能最齐全的图形化编程以及数据浏览界面。 DolphinDB GUI可以在任何支持Java的操作系统上使用,例如:时序数据库DolphinDB与InfluxDB对比测试报告2
近日,我们曾发布测试报告 DolphinDB与InfluxDB对比测试报告,此报告测试于2019年。当时的结果显示,DolphinDB的查询性能领先InfluxDB一到三个数据量级,数据导入性能领先一个数量级,数据导出性能相差不大。时隔一年,DolphinDB与InfluxDB都做了不少功能和性能上的优化,两者的性能究竟有何变DolphinDB Database丨使用Window Join快速估计个股交易成本
交易本身对市场会产生影响,尤其是短时间内大量交易,会影响金融资产的价格。一个订单到来时的市场价格和订单的执行价格通常会有差异,这个差异通常被称为交易成本。在量化交易的策略回测部分,不考虑交易成本或者交易成本估计不合理,容易导致回测和实盘结果有较大的差异。 本文将介DolphinDB Database丨利用高频数据找到最相关的股票
在制定投资策略时,我们往往会研究股票之间的相关性。研究个股的相关性或者个股与指数,ETF之间的相关性,从而通过对冲套利来获得稳定收益。找到最相关的股票,可以根据交易员的经验,也可以根据股票的相关信息(行业,beta,每日回报等)。 本文将介绍如何利用海量的高频数据寻找最相关的股票。