音视频

Opencv(十六) : 图像边缘检测

文章目录 思维导图 一、前言 二、最优边缘检测准则 1. 最优检测准则 2. 最优定位准则 3. 检测点与边缘点 三、核心算法步骤详解 1. 高斯滤波 1.1 原理与必要性 1.2 高斯核的定义与计算 1.3 卷积运算过程 1.4 难点标注 2. 计算图像梯度与方向 2.1 梯度的物理意义 2.2 Sobel算子:梯度计算的工具 2.3

whisper.cpp - 高性能Whisper语音识别推理

文章目录 一、关于 whisper.cpp 1、项目概览 2、相关链接资源 3、功能特性 二、安装配置 三、使用示例 1、基础转录 2、实时音频处理 3、量化模型使用 四、高级功能 1、Core ML加速(Mac) 2、OpenVINO加速 3、NVIDIA CUDA加速 五、性能参考 六、扩展支持 1、Docker使用 2、语言绑定

DeepSeek视频生成广告短片自动合成高效工具

1. DeepSeek视频生成广告短片自动合成高效工具的技术背景与行业趋势 随着AIGC技术的突破性进展,广告内容生产正经历从“人工主导”到“AI驱动”的范式转移。传统视频制作依赖编剧、拍摄、剪辑等多环节协作,平均周期长达2–4周,成本高昂且难以规模化。而DeepSeek通过融合大规模语言模型与扩散生成网络,实现了基于自然语言指

Java 大视界 -- Java 大数据在智能安防视频监控系统中的视频内容理解与智能预警升级(401)

Java 大视界 -- Java 大数据在智能安防视频监控系统中的视频内容理解与智能预警升级(401) 引言: 正文: 一、传统安防监控的 “三重困局”:看不全、看不懂、反应慢 1.1 人工盯屏 “力不从心” 1.1.1 摄像头密度与人力的矛盾 1.1.2 录像调阅 “马后炮”

利用DirectX和TCP技术实现音频采集、压缩、传输与回放的完整流程

本文还有配套的精品资源,点击获取 简介:音频处理技术在游戏开发、多媒体应用和实时通信中扮演着关键角色。本话题将探讨包括DirectX音频采集、MP3压缩、TCP网络传输和音频回放在内的完整实时音频流处理流程。DirectX提供高效音频数据捕捉和处理,MP3压缩技术Lame_Enc优化音频大小,TCP确保稳定的数据传输,

Android上使用无障碍服务(AccessibilityService)完成一键拨打微信视频电话

无障碍服务适配大家应该多多少少的都遇到过,简单点讲就是给图片、文本等控件加上 android:contentDescription=""标签,这样在使用无障碍服务(比如手机自带的 talkback)时,可以将contentDescription的内容以声音的方式读出来,方便视障用户使用我们的 app。这不是本文的重点&

嵌入式linux学习之opencv交叉编译/移植并使用CmakeList编译demo

文章目录 一.交叉编译opencv库 1.下载opencv源码 2. 安装编译工具 3.安装opencv前安装环境依赖 处理图像所需的包 处理视频所需的包 优化opencv功能 4. 编译 问题汇总: 问题1: 问题2 问题3 问题4 问题5 问题6 二.cpp程序编写 1.CMakeList.tx

【深度学习基础】一篇带你入门计算机视觉(从计算机视觉任务出发)

🌈 个人主页:十二月的猫-CSDN博客 🔥 系列专栏: 🏀《AI认知筑基三十讲》_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步,十二点的黑夜遮蔽不住黎明的曙光  目录1. 前言2. 计算机视觉3. 十大基础任务3.1 图像分类3.2 带定位的

2025年小白入行计算机视觉,超详细学习路线!

入门计算机视觉(Computer Vision, CV)是一个系统化的过程,需要结合数学基础、编程技能、算法理解和项目实践。以下是详细的学习路径和就业方向建议,分阶段梳理:一、就业方向概览算法工程师(核心方向)1.负责CV算法研发、模型优化(如目标检测、图像分割、人脸识别等&#xff09