人工智能
大数据入门(一)—— 数据仓库(数仓)基本概念
前言:
最近做需求的时候,涉及到了数仓相关的知识。
简单介绍下数仓的一些基本概念。
以及,了解下大数据开发的一些基本流程。
一、什么是数仓?
数据仓库 ,由数据仓库之父比尔·恩门(Bill Inmon)于1990年提出的。
1991年,他写了一本书,叫《Building the Data Warehouse》(建立数据仓库),书中提出的:数据仓库(Data Warehouse)是一个面向主题的
SpringBoot集成DeepSeek实现AI对话详细教程
1. 环境说明JDK17以上,SpringBoot3 以上版本
2. 引入依赖 <dependency>
<groupId>org.springframework.ai</groupId>
<artifactId>spring-ai-openai-spring-boot-starter</artifa
常用python框架盘点
Flask:一个轻量级的 Web 应用框架,可以用于构建小型应用程序、RESTful API 或大型的 Web 应用程序。
Django:一个高效、功能强大的 Web 应用程序框架,支持快速开发和可重用的组件。
Scrapy:一个用于爬取网页的框架,可以轻松地提取数据、图像、文本和其他类型的内容。
Pygame:一个用于制作 2D 游戏的框架,支持多种音频、视频和输入设备。
Keras:一个高级的
elasticsearch中使用bucket script进行聚合
1、背景
此篇文档简单的记录一下在es使用bucket script来进行聚合的一个例子。
2、需求
假设我们有一个简单的卖车数据,记录每个月month在卖了brand品牌的车salesVolume的数量。
此处我们需要聚合出 每个月brand=宝马的车在每个月的销售占比
3、准备数据
3.1 mapping
PUT /index_bucket_script
{
"mappings": {
305. 【操作系统】文件系统
所谓文件管理系统,就是操作系统中实现文件统一管理的一组软件和相关数据的集合,专门负责管理和存取文件信息的软件结构,简称文件系统。
文件系统的功能包括:
按名存取,即用户可以“按名存取”,而不是“按地址存取”;
统一的用户接口,在不同设备上提供同样的接口,方便用户操作和编程;
并发访问和控制,在多道程序系统中支持对文件的并发访问和控制;
安全性控制,在多用户系统中的不同用户对同一文件可有不同的访问
方差分析、T检验、卡方分析如何区分?
差异研究的目的在于比较两组数据或多组数据之间的差异,通常包括以下几类分析方法,分别是方差分析、T检验和卡方检验。
三个方法的区别
其实核心的区别在于:数据类型不一样。如果是定类和定类,此时应该使用卡方分析;如果是定类和定量,此时应该使用方差或者T检验。
方差和T检验的区别在于,对于T检验的X来讲,其只能为2个类别比如男和女。如果X为3个类别
单细胞之轨迹分析-7:Seurat+scVelo
轨迹分析系列:
单细胞之轨迹分析-1:RNA velocity
单细胞之轨迹分析-2:monocle2 原理解读+实操
单细胞之轨迹分析-3:monocle3
单细胞之轨迹分析-4:scVelo
单细胞之轨迹分析-5:slingshot
单细胞之轨迹分析-6:velocyto.R+Seurat
一般要去计算RNA velocity的时候,是已经预先处理过数据了,比如做过了降维,聚类,差异分
细胞类型重复性验证----MetaNeighbor(2)
继续上面MetaNeighbor 1的学习,我们做第二个测试数据,第二组场景的测试。
========测试数据2============
第二个数据集,基于已经训练好或者注释好的参考数据集,来衡量新数据集细胞类型注释的准确性。这个测试数据是采用的BICCN,一个小鼠初级运动皮层的细胞。可以去作者的paper链接中下载。
library(MetaNeighbor)
library(SingleCel
651.【系统架构】边缘计算——边云协同(一)
边缘计算与云计算各有所长,云计算擅长全局性、非实时、长周期的大数据处理分析,能够在长周期维护、业务决策等领域发挥优势;
边缘计算更适用局部性、实时、短周期数据的处理与分析,能更好地支撑本地业务的实时智能化决策与执行。
因此边缘计算与云计算之间不是替代关系,而是互补协同关系,边云协同将放大边缘计算与云计算的应用价值:
边缘计算既靠近执行单元,更是云端所需高价值数据的采集和初步处理单元,可以更好地支