人工智能

一文读懂:接触DeepSeek等AI大模型时常接触到的7B/32B/671B、Q2/Q4/Q8、AWQ、Zero、Distill等名词或代码的含义

文章目录 一、大模型的参数量 二、大模型的量化 三、Q2/Q4/Q8分别什么意思 四、Zero 四、大模型蒸馏 一、大模型的参数量我们经常会看到大模型后面,会跟一个奇怪的后缀,如: DeepSeek-R1 - 1.5b DeepSeek-R1 - 7b DeepSeek-R1 - 8b DeepSeek-R1 - 14b

2022-06-12

        我们所做的任何事情和要实现的任何目标,都需要使用一定的资源才能完成,客观上都存在着一个理想的资源使用的情形:       理想的资源使用的情形=有效的物质资源X有效的时间资源X有效的精神资源       但是,现实中资源使用的情形常常是这样的:       现实中资源使用的情形=(有效的物质资源+无效的物质资源)X(有效的时间资源+无效的时间资源)X(有效的精神资源+无效的精神资源

IO-Zero Copy

要说 IO 的性能优化就不得不提 Zero Copy(零拷贝),虽然名字叫零拷贝,但其实并不是完全没有拷贝过程,而是尽量减少不必要的拷贝及上下文切换。各种消息队列可以说是将零拷贝技术用到了极致,像 Kafka、RocketMQ 都用到到了 mmap、sendfile 等零拷贝技术来提升服务的性能。我们最常用的应用服务 Tomcat、Nginx 在返回静态资源的时候,都有使用零拷贝技术

基于R语言的微生物群落组成多样性分析——PCA分析

    PCA,即主成分分析(Principal Component Analysis),是一种考察多个变量间相关性的降维统计方法,其原理是设法将原来变量重新组合成一组新的互相无关的几个综合变量,同时根据实际需要从中可以取出几个较少的综合变量尽可能多地反映原来变量的信息的统计方法(摘自百度百科)。     通俗来说,就是将数据从高维映射到低维以达到降低特征维度的目的。计算时,主要通过对协方差矩阵进

嵌入式仿真实验教学平台接入Deepseek,开启AI实验教学新时代!

嵌入式仿真实验教学平台全新上线Deepseek+嵌入式知识库功能,深度融合大模型能力与垂直领域知识库,让嵌入式学习、开发更高效、更智能!四大核心功能,AIGC重新定义嵌入式实验教学!一、通用问题,Deepseek妙答从基础语法到操作系统原理,从通信协议到算法逻辑,所有嵌入式领域的

原子内部99.99%都是空的,那么为什么多数物体都不透明

        原子空是基于粒子模型的结论,以波或者能量的角度来看,原子并不空。透明也是一个相对概念,重点是物质能透过那种频率的电磁波。         如何理解原子的空?         第一个发现原子很空的人叫卢瑟福。                  1911年,他做了一个“α粒子散射实验”,就是用α射线轰击一片薄金箔。他发现大多数α粒子都能直接穿透金箔,但少数α粒子会发生较大的散射,大约

心理学研究方法(22)

中原焦点团队坚持分享第1084天(20230123) 主因素分析使用最广泛,它可以运用每一变量与其它所有变量的平方和作为公共因素方差的估计值。人们主张以主因素分析确定基本因素数目,以最大似然因素分析求出因素荷重的准确值。 传统因素分析法采用重心法。 因素分析的基本步骤: 1、数据的采集,要求连续的,不间断的数据资料。从同一总体抽样,运用等距或等比量表测定,获得原始数据,应力求数据测量的高效度,防止

ChatGPT 背后的数学

ChatGPT是由OpenAI开发的语言模型,它使用深度学习在自然语言中生成类似人类的响应。它基于转换器架构,并在大量文本数据语料库上进行训练,以生成连贯且有意义的答案。ChatGPT 背后的数学很复杂,涉及几种深度学习技术。 image.png 转换器架构 转换器架构是一种深度学习模型,由Vaswani等人在论文“注意力是你所需要的一切”中引入。它是一种神经网络架构,使用自注意机制来