首页 > TAG信息列表 > 达观

达观数据CTO 纪达麒:基于阿里云计算底座,打造智能办公机器人

“机器人”一词最早出现在1921年卡雷尔·卡佩克(Karel Capek)创作的一部科幻剧中,而在科学智能技术创新发展百年后的今天,智能机器人已经成为了一个可以应用于各个行业的前沿科技产品,代替人类从事繁琐重复的单调劳动。   随着人工智能技术的进步,智能机器人产业如雨后春笋般蓬勃发展,政

率先推出器件可替代分析功能,达观知识图谱推理技术赋能库存管理智能化

一直以来,备件管理是工业制造型企业库存管理的重要工作,也是公司降低运营成本、改善库存周转效率的主要举措。完善的管理体系结合先进的技术,是工业制造领域优秀企业的进行库存管理的关键。达观数据率先将认知智能引入库存管理领域,赋能工业企业智能化转型,使得库存管理的效率提升更

达观数据OCR赋能银行会计核算数据集中系统降本增效

在银行为代表的金融行业业务场景中,有大量影像文字信息录入需求,比如身份证识别、户口本识别、军官证识别、港澳通行证识别等各类证件识别都可通过标准OCR模型进行识别。但基于行内银行存单、支票、内外部凭证等影像信息人工分类与录入会消耗大量人力、物力和时间成本,严重影响业务

B站公告乌龙,文档质控机器人帮忙来纠错

    3月26日,哔哩哔哩(简称“B站”)在港交所披露的最新公司资料表中出现了失误,将企业名字“哔哩哔哩”错写成了“百度集团”,引起了各界人士的广泛关注和讨论。   其实这类上市公告中的人为错误导致的乌龙事件,在金融领域的文书中一点都不罕见。比如:苏美达曾经发布的关于“发行超

达观数据智能财务审核机器人,助力央企财务共享中心智能转型

  某大型央企集团公司(以下简称为“集团”),出于运营成本控制及工作效率提升的考虑,于数年前启用了财务共享服务平台。按照当时的财务业务状况,财务共享服务平台主要需求之一就是为了解决多系统间的业务及数据的贯通问题。财务审核工作需要贯穿集团总部和下属各级分子公司。随着财务

达观杯文本分类比赛 | (1) 比赛介绍

目录 1. 竞赛信息 2. 数据 3. 评分标准 1. 竞赛信息 比赛网址 自然语言处理一直是人工智能领域的重要话题,而人类语言的复杂性也给 NLP 布下了重重困难等待解决。长文本的智能解析就是颇具挑战性的任务,如何从纷繁多变、信息量庞杂的冗长文本中获取关键信息,一直是文本领域难题。

达观数据CTO纪达麒:小标注数据量下自然语言处理实战经验

自然语言处理在文本信息抽取、自动审校、智能问答、情感分析等场景下都有非常多的实际应用需求,在人工智能领域里有极为广泛的应用场景。然而在实际工程应用中,最经常面临的挑战是我们往往很难有大量高质量的标注语料。     “巧妇难为无米之炊”,在缺少语料的情况下,如何达到良好的

达观杯linghtgbm(五)

达观杯linghtgbm1.linghtgbm2.linghtgbm代码实现 1.linghtgbm LightGBM是个快速的,分布式的,高性能的基于决策树算法的梯度提升框架。可用于排序,分类,回归以及很多其他的机器学习任务中。 在竞赛题中,我们知道XGBoost算法非常热门,它是一种优秀的拉动框架,但是在使用过程中,其训练耗

【数据竞赛】“达观杯”文本智能处理挑战赛3

一、语言模型 在统计自然语言处理中,语言模型指的是计算一个句子的概率模型。 传统的语言模型 词的表示是原始的、面向字符串的。 向量角度:更高维、更稀疏的向量。若词汇表大小为 NNN,每个字符串形式的词语字典序为 iii,则其被表示为一个 NNN 维向量,该向量的第 iii 维为 1,其他

Day1—达观杯智能文本处理

Day1_数据初始Task:项目任务建立模型通过长文本数据正文,预测文本对应的类别数据train_set.csv:test_set.csv:测试集数据情况 Task:项目任务建立模型通过长文本数据正文,预测文本对应的类别 数据 数据包含2个csv文件,即train_set.csv和test_set.csv. ps:因为在外条件有限,先读取