数学

【DeepSeek系列】逐行讲解MLA朴素+吸收矩阵代码全新实现

引言注意力机制作为大语言模型的核心组件,这么多年从最开始的 MHA 到现在最常用的 MQA、GQA,最主要的目的都是为了节省kv cache的大小。MHA每一层需要存储【序列长度注意力头数每头维度】的大小,而MQA让每个头的k共享,需要存储的维度直接降低为【序列长度1每头维度】,但后面发现这样降的太多就导致性能下降&#xff0

2025 年江西研究生数学建模竞赛题A题电动汽车充电桩共享优化与电网安全协同模型完整思路 模型代码 结果 成品分享

背景描述随着我国“双碳”战略的推进,电动汽车(EV)已全面普及。截至 2025年,全国电动汽车保有量突破2亿辆,占汽车总量的40%。充电需求激增带来的电网冲击问题日益凸显: 1.家庭充电桩利用率低:私家充电桩日均使用时长不足2 小时,大量时间闲置; 公共快充桩分布不均:部分区域高峰时段充电排队超1小时,而低谷时段设备闲置; 2.

【狂热算法篇】探秘图论之Dijkstra 算法:穿越图的迷宫的最短路径力量(通俗易懂版)

                    羑悻的小杀马特.-CSDN博客羑悻的小杀马特.擅长C/C++题海汇总,AI学习,c++的不归之路,等方面的知识,羑悻的小杀马特.关注算法,c++,c语言,青少年编程领域.#####在本篇文章中,博主将带大家去学习所谓的Dijkstra算法;从基本理解,画图分析展示&#x

力扣404周赛 T1/T2/T3 枚举/动态规划/数组/模拟

博客主页:誓则盟约 系列专栏:IT竞赛 专栏 关注博主,后期持续更新系列文章 如果有错误感谢请大家批评指出,及时修改 感谢大家点赞👍收藏⭐评论✍  3200.三角形的最大高度【简单】题目:给你两个整数 red 和 blue,分别表示红色球和蓝色球的数量。你需要使用这些球来组成一个三角形&#xff

【动态规划】斐波那契数列模型

📝前言说明: 本专栏主要记录本人的基础算法学习以及LeetCode刷题记录,按专题划分 每题主要记录:(1)本人解法 + 本人屎山代码;(2)优质解法 + 优质代码;(3)精益求精,更好的解法和独特的

线性代数:AI大模型的数学基石

🧑 博主简介:CSDN博客专家、CSDN平台优质创作者,高级开发工程师,数学专业,10年以上C/C++, C#, Java等多种编程语言开发经验,拥有高级工程师证书;擅长C/C++、C#等开发语言,熟悉Java常用开发技术,能熟练应用

2025深圳杯东三省数学建模竞赛B题完整分析论文(共27页)(含模型、可运行代码、求解结果)

2025深圳杯数学建模竞赛B题完整分析论文目录摘要 一、问题背景 二、问题分析 三、问题重述 四、模型假设 五、符合定义 六、 模型建立与求解 6.1问题1 6.1.1问题1思路分析 6.1.2问题1模型建立 6.1.3问题1求解结果 6.2问题2 6.2.1问题2思路分析 6.2.2问题2模型建立 6.2.3问题2求解结果 6.3问题3 6.3.1问题3思路分析 6.3.2问题3模型建立 6.3