音视频 - 小智博客

ROS2+OpenCV综合应用--1. ROS+opencv案例

本章节以单目摄像头为例。        ROS 以自己的sensor_msgs/Image消息格式传递图像，无法直接进行图像处理，但是提供的【CvBridge】可以完美转换和被转换图像数据格式。【CvBridge】是一个 ROS 库，相当于ROS和Opencv之间的桥梁。    

音视频 2025年04月20日 126 点赞 0 评论 9481 浏览

【音视频】使用 GStreamer 管道和 opencv 读取摄像头并实现自定义码率视频录制

一、背景文接上回，在成功编译出 GStreamer 支持的cv2后，本文介绍如何使用GStreamer管道读取摄像头rtsp流，同时实现自定义码率的视频录制，有效控制视频体积。二、代码及参数说明 1. 代码import cv2 # 使用GStreamer管道 gst_str = ( 'appsrc ! vid

音视频 2025年04月20日 66 点赞 0 评论 15892 浏览

Qwen2.5-Omni 大模型部署实践（八）：视频信息提取的多模态应用探索

系列篇章💥 No. 文章 1 Qwen2.5-Omni 大模型部署实践（一）：环境搭建与模型下载 2 Qwen2.5-Omni 大模型部署实践（二）：使用transformers推理实践 3 Qwen2.5-Omni 大模型部署实践（三）：

音视频 2025年04月20日 110 点赞 0 评论 6501 浏览

基于深度学习的多模态人脸情绪识别研究与实现（视频+图像＋语音）

这是一个结合图像和音频的情绪识别系统，从架构、数据准备、模型实现、训练等。包括数据收集、预处理、模型训练、融合方法、部署优化等全流程。确定完整系统的组成部分：数据收集与处理、模型设计与训练、多模态融合、系统集成、部署优化、用户界面等。详细说明，还要给出详细的代码框架和工具。包括如何处理实时数据流，如何同步音频和视频&#xf

音视频 2025年04月20日 87 点赞 0 评论 14431 浏览

B站神级插件！B站视频字幕提取，支持总结B站视频、翻译字幕内容

B站神级插件！哔哩哔哩字幕列表，B站视频字幕提取脚本，并且可以自动跳转到对应的时间线将 B 站视频的字幕单独提取出来，以列表的形式展示在侧边栏，并且可以通过点击字幕跳转到对应时间线。我测试了一下，效果确实可以呀！插件简介众所周知，从视频中获取信息的效率很低，而阅读文字

音视频 2025年04月20日 103 点赞 0 评论 16825 浏览

【一键让照片动起来】阿里万相2.1图生视频+蓝耘智算零门槛部署指南

先给大家带来一段效果视频，这是我用图生视频功能创作的精彩演示，虽然博客限制了上传大小，画质可能不够完美，因为我视频转换成gif后容量还是很大，我又经过一系列压缩，但内容绝对让你眼前一亮！全当开个"盲盒"，大家凑合着看吧，嘿嘿！ 引言&#xff

音视频 2025年04月20日 186 点赞 0 评论 21231 浏览

【深度学习基础】一篇带你入门计算机视觉（从计算机视觉任务出发）

🌈 个人主页：十二月的猫-CSDN博客 🔥 系列专栏： 🏀《AI认知筑基三十讲》_十二月的猫的博客-CSDN博客 💪🏻 十二月的寒冬阻挡不了春天的脚步，十二点的黑夜遮蔽不住黎明的曙光目录1. 前言2. 计算机视觉3. 十大基础任务3.1 图像分类3.2 带定位的

音视频 2025年04月21日 176 点赞 0 评论 5054 浏览

智能驱动的视频未来：蓝耘MaaS平海螺AI技术的革新与应用

目录引言一、蓝耘MaaS平海螺AI视频技术的背景与发展二、蓝耘MaaS平海螺AI视频技术的核心功能（1）视频内容识别与分析（2）视频自动剪辑与合成（3）视频内容生成与优化（4）基于图像生成视频（5）视频整体提升三、如何在蓝耘MaaS平台使用海螺

音视频 2025年04月21日 150 点赞 0 评论 3848 浏览

【AIGC前沿】MiniMax海螺AI视频——图片/文本生成高质量视频

目录1.MiniMax海螺AI视频简介2.使用教程1.MiniMax海螺AI视频简介海螺视频，作为 MiniMax 旗下海螺 AI 平台精心打造的 AI 视频生成工具，致力于助力用户产出高品质视频内容。该工具依托 abab-video-1 模型，具备强大的文生视频功能。用户仅需输入关键词或简短语句，海螺视频就能据此创作出情节丰富的完整视频。此

音视频 2025年04月21日 61 点赞 0 评论 5993 浏览

Wan2.1 本地部署碾压级「文生视频+AI绘图转电影」双引擎，免费开源！3步秒出4K超清大片（附手把手教程+资源包）

你是否想过，只需要一行文字，就能本地生成高质量的视频，而且人人都能免费离线使用。大家好，今天我们来介绍一款真正突破视频生成极限的文生视频以及图生视频的免费开源AI大模型，它就是最近在Vbench榜单上排名第一的开源视频生成大模型——WAN 2.1。生成视频的质量非常的高，SOTA性能相当震撼，因为在多

音视频 2025年04月21日 167 点赞 0 评论 13083 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间