人工智能

案例分享 | 基于Linkis+DSS构建合合信息一站式数据开发平台

目录指引 1. IDS 的简介 2. IDS 的诞生背景 3. IDS——合数据工坊的实践之路 3.1 用户权限 3.2 引擎增强 3.3 作业调度 3.4 数据治理 3.5 IDS 中一些小的功能改造点或应用项 4. 总结 5. 参考文档 1. IDS 的简介 Intsig Data Studio(IDS)是上海合合信息科技股份有限公司,大数据平台基于微众WDS社区开源的Linkis&

29《大概念教学》

吉林焦艳丰《大概念教学》p93--96 (二)迭代逻辑的“变” 1.认知的发展:从具体到抽象的结构化 前面我们主要谈到了迭代逻辑中的“不变”,除了“不变”外,迭代逻辑中也有“变”,否则就只能停留在一个理解水平上,而无法实现螺旋上升。迭代逻辑中的“变”也反映了对大概念的理解是如何被不断加深的,对每一个学习个体来说,从最初基于先前经验而行动的特定想法,发展到能够解释较大范围有关现象更为有用的概念,都有

R语言编程-Tidyverse 书籍 - 数据清洗

1 描述统计 不同概率分布就是不同随机现象规律性的数学描述。 统计学最常用的四大概率分布:正太分布,t分布, 卡方分布,F分布。 数据分布形状的统计量: 偏度(skewness, 是否对称), 峰度(Kurtosis,以标准正太分布为基准) 多个统计参数分析- rstatix::get_summary_stats(), dlookr::desicribe() 列联表- janitor包提供的ta

井点降水系统布置

1)面状降水工程降水井点宜沿降水区域周边呈封闭状均匀布置,距开挖上口边线不宜小于1m。 2)线状、条状降水工程降水井宜采用单排或双排布置,两端应外延条状或线状降水井点围合区域宽度的(1~2)倍布置水井。 3)当真空井点孔口至设计降水水位的深度不超过6.0m时,宜采用单级真空井点;当大于6.0m 且场地条件允许时,可采用多级真空井点降水,多级井点上下级高差宜取4.0~5.0m; 4)井点系统的平

Hbase——运行原理

一、Hbase的架构 架构角色 Region Server Region Server 为 Region 的管理者,其实现类为 HRegionServer,主要作用如下: 对于数据的操作:get, put, delete; 对于 Region 的操作:splitRegion、compactRegion。 Master Master 是所有 Region Se

总结一下近期(2022-09)学习的开源软件(二)

    这一篇文章总结一下数据相关的两个开源软件:ckan 和 watchmen。     很多企业在做数字化转型,尤其是很多公司在做DCMM(数据管理能力成熟度模型)认证,除了熟悉标准条款等工作以外,我们还可以通过学习一些软件的功能和设计来消化理论知识,扩大相关知识面。面对专家的时候才能从容、自信,轻松吸收专家的指导意见。 CKAN CKAN is an open-source DMS (dat

433. 【数据库技术基础】大数据的特征

大数据(Big Data)是指“无法用现有的软件工具提取、存储、搜索、共享、分析和处理的海量的、复杂的数据集合”。业界通常用 “4V” 来概括大数据的特征。 大量化(Volume)指数据体量巨大。随着 IT 技术的迅猛发展,数据量级已从 TB 发展至 PB 乃至 ZB,可称海量、巨量乃至超量。当前,典型个人计算机硬盘的容量为 TB 量级,而一些大企业的数据量已经接近 EB 量级。 多样化(Var