音视频

探索元生代:ComfyUI 工作流与计算机视觉的奇妙邂逅

目录一、引言二、蓝耘元生代和 ComfyUI 工作流初印象(一)蓝耘元生代平台简介(二)ComfyUI 工作流创建是啥玩意儿三、计算机视觉是个啥(一)计算机视觉的基本概念(二)计算机视觉的应用场景四、蓝耘元生代平台上的 ComfyUI 工作流与计算机视觉的联系(一&#xff

【相机标定】OpenCV 相机标定中的重投影误差与角点三维坐标计算详解

摘要: 本文将从以下几个方面展开,结合典型代码深入解析 OpenCV 中的相机标定过程,重点阐述重投影误差的计算方法与实际意义,并通过一个 calcBoardCornerPositions() 函数详细讲解棋盘格角点三维坐标的构建逻辑。 在计算机视觉领域,相机标定(Camera Calibration&#x

Deepseek + 即梦,你要的 AI 视频保姆级教程来了

大家好呀,前天写的 Deepseek 写 AI 视频脚本的文章小爆。好多朋友留言问用 Deepseek 脚本怎么去做图做视频。今天我就来分享个保姆级教程。之前提到的 Deepseek出视频脚本教程在这里: [Deepseek 做 AI 视频恐怖如斯!]基于这一批脚本,我们直接开始出图。1、 首先需要下载一个即梦,下载链接&#xf

视频服务器:GB28181网络视频协议及相关流媒体开源框架

一、前言某项目中需要集成视频管理平台,实现分布在各省公司的摄像及接入,对视频进行统一管理。本项目中视频管理平台采用GB/T28181实现的监控设备接入管理平台,支持在开放互联网和局域网对监控设备进行远程接入、远程管理、远程调阅、录像回看等功能。本文对此记录GB/T28181协议的原理和一些问题,以供后续参考。相关资源:Ngin

B站神级插件!B站视频字幕提取,支持总结B站视频、翻译字幕内容

B站神级插件!哔哩哔哩字幕列表,B站视频字幕提取脚本,并且可以自动跳转到对应的时间线 将 B 站视频的字幕单独提取出来,以列表的形式展示在侧边栏,并且可以通过点击字幕跳转到对应时间线。我测试了一下,效果确实可以呀!插件简介 众所周知,从视频中获取信息的效率很低,而阅读文字

推荐几个TTS和视频配音神器 | 一款TTS & 视频配音神器 | 超强情感、语气克降的文本语音生成模型

推荐几个TTS和视频配音神器 | 一款TTS & 视频配音神器 | 超强情感、语气克降的文本语音生成模型在内容创作爆发的今天,无论是短视频、在线课程、广告文案还是多语言播报,文本转语音(TTS)技术和视频配音工具已成为不可或缺的生产力工具。特别是在情感表达与语气克隆方面的技术进展,使得AI声音不再“机器味”十足&#xf

RV1106 YOLOv5s部署:OpenCV优化实现20FPS边缘推理(无大量硬件加速)

序言基于RV1106平台开展YOLOv5模型移植过程中,发现RKNN官方参考代码存在两大技术瓶颈:其一,算法实现深度依赖RK底层硬件加速模块,导致代码架构与硬件强耦合;其二,原始实现仅支持单帧图像推理模式,无法满足实际应用场景需求。尽管参考了幸狐LockFox团队的视频流推理方案,但其

【音视频】使用 GStreamer 管道和 opencv 读取摄像头并实现自定义码率视频录制

一、背景    文接上回,在成功编译出 GStreamer 支持的cv2后,本文介绍如何使用GStreamer管道读取摄像头rtsp流,同时实现自定义码率的视频录制,有效控制视频体积。二、代码及参数说明 1. 代码import cv2 # 使用GStreamer管道 gst_str = ( 'appsrc ! vid