人工智能

产品经理眼中的数据仓库

作为一名数据产品经理,即使我们不写程序,也需要知道正在运行的大数据系统中,是如何一步步的实现可视化展示的。不仅能指导在新产品规划中提前基于典型业务场景、异常业务分析(如核心客户流失对年度营业收入的影响分析、某次线下活动过后出现一批从未出现过的新线索)、客户最为关心的经营指标波动等等的产品功能设计,也能在需求汇报或原型讲解时,以事实案例为依据、数据为支撑来提升可行性和上线后的成功概率。甚至在产品投入

亿万级海量数据去重软方法,spark/hive/flink/mr通用

一、场景描述: 小强作为一名数据工程师,给予hadoop生态,经常会接到类似uv的去重统计。对于这种需求,一般的数据工程师撸起袖子直接干!一般情况下不会有问题。某一天,你公司突然业务发展发展起来,数据量慢慢暴涨,你会突然发现之前的count distinct去重经常oom或是龟速出数据。上来一股脑加内存!加!果断加!某一天你老板要你在原来按天的uv加一个月uv、年uv,这时你慌了。只会说“老板!加

时间平方根法、时间对数法笔记

规范求取固结系数的方法有时间平方根法和时间对数法,基本原理都是利用理论曲线和试验曲线的形状相似性,配合经验,找某一固结度下(时间平方根法选的是90%固结度,时间对数法选的是50%固结度)理论曲线上时间因数相当于试验曲线上的某一时间值。时间平方根法步骤如下:先根据试验数据绘制变形与时间平方根的关系曲线,然后找到曲线上初始阶段的直线段,延长交与纵轴,交点叫做理论零点,再过理论零点做一条直线,新直线是老

智能AI医疗物资/耗材管理系统升级改造方案分析

基于AI技术的智能物资管理系统为各级医疗机构(包括三甲医院、社区诊所、药房等)提供了一套完整的数字化管理解决方案。系统通过物联网传感器实时监控库存状态,结合机器学习算法分析历史消耗数据、季节性因素和突发公共卫生事件影响,可提前90天预测物资需求波动,使库存周转率提升40%以上。系统具备以下核心功能: 智能预警机制&

BASE理论

BASE理论 BASE是Basically Available(基本可用)、Soft state(软状态)和 Eventually consistent(最终一致性)三个短语的缩写。BASE理论是对CAP中一致性和可用性权衡的结果,其来源于对大规模互联网系统分布式实践的总结, 是基于CAP定理逐步演化而来的。BASE理论的核心思想是:即使无法做到强一致性,但每个应用都可以根据自身业务特点,采用适

多模型 AI 协同技巧:让 ChatGPT、Claude 、MCP高效 “为你打工”

前言在数字化浪潮席卷全球的今天,我们每个人都渴望拥有一个真正智能、全能的数字助手。ChatboxAI就是这样一款集成了多种AI模型的应用,旨在为用户提供跨平台、隐私保护且信息更新的智能助手服务。 关于chat box 聚合 AI 主流模型,1 个应用顶 N 个当前AI模型百花齐放,DeepSeek在某些领域表现卓越,ChatG

ScheduledThreadPoolExecutor踩过最痛的坑

概述 最近项目上反馈某个重要的定时任务突然不执行了,很头疼,开发环境和测试环境都没有出现过这个问题。定时任务采用的是ScheduledThreadPoolExecutor,后来一看代码发现踩了一个大坑.... 还原"大坑" 这个坑就是如果ScheduledThreadPoolExecutor中执行的任务出错抛出异常后,不仅不会打印异常堆栈信息,同时还会取消后面的调度, 直接看例子。 @Test p

maftools包分析突变数据,绘制瀑布图

前面给大家介绍了MAF文件格式 ☞ MAF格式(mutation annotation format) 以及如何从TCGA数据库下载MAF格式的突变数据。 ☞ 如何从TCGA数据库下载体细胞突变数据(somatic mutation) 今天我们来讲讲,怎么用R的maftools包来分析MAF格式的突变数据,并用瀑布图来展示结果。maftools这个包的主要分为两部分功能,分析和可视化。下图列出了,

答读者问(6):单细胞TPM矩阵如何分析?

问题 一、有的文章只提供TPM的单细胞表达矩阵,可以用seurat分析吗? 二、分析流程和用count矩阵有什么不同? 三、10X的单细胞转录组数据的标准化需要考虑基因长度吗? 先来看看第3个小问题 10X的单细胞转录组数据的标准化需要考虑基因长度吗? 答案是不需要。 我们看一下seurat里面NormalizeData()函数是如何做标准化,然后求Log。 test.seu <-