Opencv(一): 用Opencv了解图像 文章目录 思维导图 前言 一、图像的最小单元 1. 像素的本质 2. 像素的存储形式 二、图像的颜色体系 1. RGB三通道的定义 2. 通道数值的物理意义 3. 灰度图与单通道 三、存储图像的核心 1. 不同类型图像的数组维度 2. OpenCV的BGR通道顺序 四:实验现象 五.总结 思维导图 前言我们每天浏览的图片、视频 音视频 2025年10月29日 198 点赞 0 评论 16451 浏览
C++分布式语音识别服务实践 基于 brpc+etcd + 百度 AI SDK 的分布式语音识别服务实践:从代码架构到踩坑复盘 一、项目背景与核心功能最近基于 C++ 实现了一个分布式语音识别子服务,核心目标是提供高可用的 RPC 接口,支持客户端上传 PCM 音频文件并返回识别结果。技术栈选型如下: RPC 框架:brp 音视频 2025年10月29日 129 点赞 0 评论 17285 浏览
【深度学习计算机视觉】14:实战Kaggle比赛:狗的品种识别(ImageNet Dogs) 【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ 音视频 2025年10月29日 41 点赞 0 评论 4095 浏览
西电25年A测 语音识别机械臂方案与教程 A测语音识别机械臂攻略大家好啊,这里是 超级电鼠( 划掉),其实是基本操作啊。这次的西电老东西A测不讲五德的更换了题目,而网上现在又没有合适的攻略ψ(`∇´)ψ而电鼠又在贴吧立了flag ,所以让我们话不多说,直接开始吧。注意,此教程请配合整理出的资料包使用…࿰ 音视频 2025年10月29日 123 点赞 0 评论 19851 浏览
AI一键去除视频字幕,告别素材浪费!完全免费!亲测效果惊艳 内容简介:本文介绍了一款免费、实用的AI去字幕工具——VSR,实测效果不错。正文:很多人都曾因为字幕而烦恼:辛辛苦苦找到的素材,却因字幕而弃用。最近发现了一款免费的AI去字幕工具:VSR,测试了一下,效果非常不错。 很适合做精细视频用。1. VSR是什么?VSR是一款免费开 音视频 2025年10月28日 95 点赞 0 评论 16591 浏览
告别显卡焦虑:Wan2.1+cpolar让AI视频创作走进普通家庭 文章目录 前言 【视频教程】 1.软件准备 1.1 ComfyUI 1.2 文本编码器 1.3 VAE 1.4 视频生成模型 2.整合配置 3. 本地运行测试 4. 公网使用Wan2.1模型生成视频 4.1 创建远程连接公网地址 5. 固定远程访问公网地址 总结 无需专业工作站,普通电脑也能跑AI视频模型;告别复杂配置&#x 音视频 2025年10月28日 130 点赞 0 评论 4067 浏览
labelme数据标注保姆级教程:从安装到格式转换全流程,附常见问题避坑指南(含视频讲解) 引言:为什么选择labelme?在人工智能和机器学习领域,高质量的标注数据是训练优秀模型的基础。而 labelme作为一款开源、跨平台的图像标注工具,凭借其强大的功能和易用性,成为了数据标注领域的热门选择。它支持多种标注类型,如矩形框、多边形、线段、点、文本等,能满足目标检测、图像分割、姿态估计等多 音视频 2025年10月28日 117 点赞 0 评论 12284 浏览
【深度学习计算机视觉】13:实战Kaggle比赛:图像分类 (CIFAR-10) 【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈PyTorch深度学习 ⌋ 音视频 2025年10月28日 135 点赞 0 评论 9767 浏览
RTX 4090 加速国产 AIGC 视频生成:腾讯混元与阿里千问开源模型 国产AIGC视频大模型正加速落地,RTX 4090凭借强大算力与大显存,成为本地部署腾讯混元、阿里通义万相等前沿视频生成模型的最佳选择,开启桌面级AI创作新时代。 目录 一、引言:国产AIGC视频大模型,桌面算力的新疆域 二、解锁潜能:RTX 4090与国产视频大模型的协同优势 三、项目解析: 音视频 2025年10月28日 129 点赞 0 评论 15773 浏览