音视频

探索元生代:ComfyUI 工作流与计算机视觉的奇妙邂逅

目录一、引言二、蓝耘元生代和 ComfyUI 工作流初印象(一)蓝耘元生代平台简介(二)ComfyUI 工作流创建是啥玩意儿三、计算机视觉是个啥(一)计算机视觉的基本概念(二)计算机视觉的应用场景四、蓝耘元生代平台上的 ComfyUI 工作流与计算机视觉的联系(一&#xff

【相机标定】OpenCV 相机标定中的重投影误差与角点三维坐标计算详解

摘要: 本文将从以下几个方面展开,结合典型代码深入解析 OpenCV 中的相机标定过程,重点阐述重投影误差的计算方法与实际意义,并通过一个 calcBoardCornerPositions() 函数详细讲解棋盘格角点三维坐标的构建逻辑。 在计算机视觉领域,相机标定(Camera Calibration&#x

AI一键去除视频字幕,告别素材浪费!完全​免费!亲测效果惊艳

内容简介:本文介绍了一款免费、实用的AI去字幕工具——VSR,实测效果不错。正文:很多人都曾因为字幕而烦恼:辛辛苦苦找到的素材,却因字幕而弃用。最近发现了一款免费的AI去字幕工具:VSR,测试了一下,效果非常不错。 很适合做精细视频用。1. VSR是什么?VSR是一款免费开

OpenCV机器人视觉:机械臂目标抓取(定位+位姿估计)ROS+OpenCV联合开发指南(附工业级实战代码)

大家好,我是南木。 机械臂目标抓取是工业机器人落地的核心场景,从物流分拣、电子装配到食品包装,都依赖“视觉定位+位姿估计+机械臂控制”的闭环。但很多开发者卡在“视觉与控制衔接”的环节:OpenCV能识别目标,却不知道怎么把坐标传给ROS;ROS能控制机械臂,却无法精准匹配视觉输出的位姿

Opencv(一): 用Opencv了解图像

文章目录 思维导图 前言 一、图像的最小单元 1. 像素的本质 2. 像素的存储形式 二、图像的颜色体系 1. RGB三通道的定义 2. 通道数值的物理意义 3. 灰度图与单通道 三、存储图像的核心 1. 不同类型图像的数组维度 2. OpenCV的BGR通道顺序 四:实验现象 五.总结 思维导图 前言我们每天浏览的图片、视频&#xf

Deepseek + 即梦,你要的 AI 视频保姆级教程来了

大家好呀,前天写的 Deepseek 写 AI 视频脚本的文章小爆。好多朋友留言问用 Deepseek 脚本怎么去做图做视频。今天我就来分享个保姆级教程。之前提到的 Deepseek出视频脚本教程在这里: [Deepseek 做 AI 视频恐怖如斯!]基于这一批脚本,我们直接开始出图。1、 首先需要下载一个即梦,下载链接&#xf

视频服务器:GB28181网络视频协议及相关流媒体开源框架

一、前言某项目中需要集成视频管理平台,实现分布在各省公司的摄像及接入,对视频进行统一管理。本项目中视频管理平台采用GB/T28181实现的监控设备接入管理平台,支持在开放互联网和局域网对监控设备进行远程接入、远程管理、远程调阅、录像回看等功能。本文对此记录GB/T28181协议的原理和一些问题,以供后续参考。相关资源:Ngin

B站神级插件!B站视频字幕提取,支持总结B站视频、翻译字幕内容

B站神级插件!哔哩哔哩字幕列表,B站视频字幕提取脚本,并且可以自动跳转到对应的时间线 将 B 站视频的字幕单独提取出来,以列表的形式展示在侧边栏,并且可以通过点击字幕跳转到对应时间线。我测试了一下,效果确实可以呀!插件简介 众所周知,从视频中获取信息的效率很低,而阅读文字

Faster R-CNN目标检测算法原理解析视频课程

本文还有配套的精品资源,点击获取 简介:Faster R-CNN是2015年由Ross Girshick等人提出的深度学习目标检测算法,作为R-CNN系列的里程碑式改进,通过引入区域提议网络(RPN)实现了端到端的高效检测。该算法共享卷积特征图,将区域提议与目标分类、边界框回归统一于一个网络