人工智能

实测AI Ping,一个大模型服务选型的实用工具

作为一名长期奋战在一线的AI应用工程师,我在技术选型中最头疼的问题就是:“这个模型服务的真实性能到底如何?” 官方的基准测试总是在理想环境下进行,而一旦投入使用,延迟波动、吞吐下降、高峰期服务不可用等问题就接踵而至。 直到我发现了由清华系团队打造的AI Ping,这个平台号称能提供真实、客观的大模型服务性能评

Apache Flink——多流转换

概述 无论是基本的简单转换和聚合,还是基于窗口的计算,都是针对一条流上的数据进行处理的。而在实际应用中,可能需要将不同来源的数据连接合并在一起处理,也有可能需要将一条流拆分开,所以经常会有对多条流进行处理的场景。 简单划分的话,多流转换可以分为“分流”和“合流”两大类。目前分流的操作一般是通过侧输出流(side output)来实现,而合流的算子比较丰富,根据不同的需求可以调用 union、con

Flink简介

第一章 初识Flink 大数据开发总体架构 大数据开发总体架构 数据传输层: 常用的数据传输工具有Flume、Sqoop、Kafka。Flume是一个日志收集系统,用于将大量日志数据从不同的源进行收集、聚合,最终移动到一个集中的数据中心进行存储。Sqoop主要用于将数据在关系型数据库和Hadoop平台之间进行相互转移。Kafka是一个发布与订阅消息系统,它可以实时处理大量消息数据以满足

“FAQ + AI”智能助手全栈实现方案

文章目录 **第一部分:总体架构与技术选型** **1.1 核心架构图** **1.2 技术选型说明** **第二部分:详细实现步骤** **2.1 环境准备与项目初始化** **2.2 知识库处理与向量化 (Ingestion Pipeline)** **2.3 构建后端API (FastAPI Server)** **2.4 构建简单

mysql之抖动

flush: 就是把内存里的数据写入磁盘的过程。 脏页:当内存数据页跟磁盘数据页内容不一致的时候。 干净页:内存数据写入到磁盘后,内存和磁盘上的数据页的内容一致的时候。 脏页和干净页都是在内存中。 1、数据库的flush场景 对应的redo log日志满了,系统会停止所有更新操作,把checkpoint往前推进,redo log日志留出空间继续写。 对应的系统内存不足,当需要新的内存页,而内存不

统计学习方法1.4-2.1 笔记

1.4 模型评估与模型选择 训练误差与测试误差 关于模型的拟合好坏,计算训练集的训练误差进行衡量。 关于模型预测的好坏,通过测试集衡量 计算预测和真实的差异:测试误差:衡量预测效果 训练误差: 所有样本来自训练集,模型对于已知数据的预测能力。 测试误差: 样本来自测试集。模型对于未知数据的预测能力。 误差率和准确率是测试误差的两个特例 误差率里,当

加法混合

书名:代码本色:用编程模拟自然系统 作者:Daniel Shiffman 译者:周晗彬 ISBN:978-7-115-36947-5 目录 4.13 图像纹理和加法混合 1、加法混合 计算机图形学有很多颜色混合算法,这些算法通常称作“混合(blend)模式”。 在Processing中,如果在一幅图像之上绘制另一幅图像,默认显示最上层图像——这通常称为“常规”混合模式。 如果图像有一定的透明

创建自定义的 Angular 管道

我们在上一篇文章中,了解了什么是 Angular 管道,以及如何使用 Angular 提供的一些常用管道。本文将进一步深入探讨如何创建一个 Angular 管道,实现对数据的自定义转换。 创建管道 我们可以使用 Angular CLI 的 generate 命令,创建一个管道: ng generate pipe sort 输出结果: CREATE src/app/sort.pipe.spec.

SparkThriftServer内存泄漏排查

STS(SparkThrfitServer)版本 spark-3.2.1-bin-hadoop3.2 问题表现 Spark UI 经常无响应 STS 经常挂掉 问题分析 获取heap.hprof和gc.log spark.driver.extraJavaOptions -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/home/spark/

DG知识点整理 - 数据伦理

//本系列是基于DMBOK2的学习过程中的知识点整理,方便学习与回顾// 数据伦理描述的是在数据全生命周期中,如何用符合伦理(不仅仅是法律要求)的行为来完成数据的处理。组织要注重数据伦理的原因有几个     1)数据对个人的影响,它会被用于各类决策,进而影响个人的生活;     2)数据有被滥用的可能;     3)数据具有经济价值,需要规定数据的所有权,使用权和使用方式。 数据管理者有有管理数据