人工智能

大数据入门(一)—— 数据仓库(数仓)基本概念

前言: 最近做需求的时候,涉及到了数仓相关的知识。 简单介绍下数仓的一些基本概念。 以及,了解下大数据开发的一些基本流程。 一、什么是数仓? 数据仓库 ,由数据仓库之父比尔·恩门(Bill Inmon)于1990年提出的。 1991年,他写了一本书,叫《Building the Data Warehouse》(建立数据仓库),书中提出的:数据仓库(Data Warehouse)是一个面向主题的

细胞类型重复性验证----MetaNeighbor(2)

继续上面MetaNeighbor 1的学习,我们做第二个测试数据,第二组场景的测试。 ========测试数据2============ 第二个数据集,基于已经训练好或者注释好的参考数据集,来衡量新数据集细胞类型注释的准确性。这个测试数据是采用的BICCN,一个小鼠初级运动皮层的细胞。可以去作者的paper链接中下载。 library(MetaNeighbor) library(SingleCel

从人类到 AI:意群阅读的奥秘与英语学习的高效技巧

一、人类的英语阅读理解:意群如何加速大脑处理? 1.1 什么是意群(Chunking):自然语义单元意群,顾名思义,就是将语言中具有内在联系的部分组合在一起,形成一个相对独立且完整的语义单元。举个简单的例子,在句子“I love reading books in the

三角形的内角和是180度吗?

        大家好,我是小涂涂,我今天要讲的是三角形的内角和是180度吗?因为好多人一看见类似求出三角形的内角和是多少度的这种题,他们一般都会算出来是180度,180度也不是错的。                                                        我们现在是可以肯定一点,就是任意一个三角形,就比如说,锐角三角形,直角三角形,钝角三角形,等等等等,它

多维学习

不读书的人,没什么好焦虑的。 学习的秘密在于同时调动多维度感官。 真正的学习绝不仅仅涉及思维这一个维度,它包含视觉、听觉、味觉、嗅觉、触觉等所有感知维度。 知识和智慧不是一回事,智慧是去实践。知识中的很大一部分存在于潜意识中,这部分知识如果不去运用就得不到很好的发展。 纸上的知识是一维的,而躬行出来的认知则是多维的。所以在人的成长过程中,除了读书,更重要的还是运用实践、经世致用啊! 对于学习,特别

【AI 大模型】RAG 检索增强生成 ④ ( 向量相似度计算 | 余弦距离 | 欧式距离 | OpenAI 文本向量模型 | 手动实现的 余弦相似度 和 欧氏距离 函数计算 )

文章目录 一、向量相似度计算 二、余弦距离 1、余弦距离 概念 2、余弦距离 特点 3、余弦距离 适用场景 4、余弦距离 代码示例 三、欧式距离 1、欧式距离 概念 2、欧式距离 特点 3、欧式距离 适用场景 4、欧式距离 代码示例 四、OpenAI 文本向量模型 1、OpenAI 的 text-embedding-ada-002 文本向量模型 2、使用

华为数据之道|03 差异化的企业数据分类管理框架|②以统一语言为核心的结构化数据管理

结构化数据包括基础数据、主数据、事务数据、报告数据、观测数据、规则数据。 结构化数据的共同特点是以信息架构为基础,建立统一的数据资产目录、数据标准与模型。 基础数据用于对其他数据进行分类,在业界也称作参考数据。基础数据通常是静态的(如国家、币种),一般在业务事件发生之前就已经预先定义。它的可选值数量有限,可以用作业务或IT的开关和判断条件。当基础数据的取值发生变化的时候,通常需要对流程和IT系统

打造个人品牌三个快速破圈的方法

个人品牌3个破圈的方法: 1、不断输出 不断地输出内容、资源、能力、技能等,因为只有不断向外输出才会吸引志同道合的人······ 2、真诚利他、主动合作 你要积极地去创造价值,学会价值互换,才会越合作越赚钱······ 3、为价值买单 有用的价值:往往三言两语带你走出弯路(有些真理都在言语当中)······ 无用的价值:就是给你无用的课程让你自己去学(什么也不说什么也不教)······