运行图生视频/文生视频(Wan2.X等)的显卡配置总结 运行图生视频/文生视频(如Wan2.2)的显卡配置总结 Wan2.2 是一个基于深度学习的视频生成项目,支持 图生视频(Image-to-Video) 和 文生视频(Text-to-Video) 任务,类似于 Stable Video Diffusion 或 RunwayML 的视频生 音视频 2025年09月25日 157 点赞 0 评论 15192 浏览
【音视频】使用 GStreamer 管道和 opencv 读取摄像头并实现自定义码率视频录制 一、背景 文接上回,在成功编译出 GStreamer 支持的cv2后,本文介绍如何使用GStreamer管道读取摄像头rtsp流,同时实现自定义码率的视频录制,有效控制视频体积。二、代码及参数说明 1. 代码import cv2 # 使用GStreamer管道 gst_str = ( 'appsrc ! vid 音视频 2025年04月20日 66 点赞 0 评论 15184 浏览
OpenCV计算机视觉实战(27)——深度学习与卷积神经网络 OpenCV计算机视觉实战(27)——深度学习与卷积神经网络 0. 前言 1. 深度学习简史 1.1 感知器 1.2 浅层学习网络 1.3 深度学习网络 2. 权重、偏置和激活函数 2.1 权重 2.2 偏置 2.3 激活函数 2.4 优化过程 3. 卷积神经网络 3.1 卷积层 3.2 全连接网络 vs 卷积神经网络 音视频 2025年10月28日 106 点赞 0 评论 15150 浏览
如何下载链接为blob类型的视频,video 标签 src:blob 链接转下载MP4 文章目录 前言 这种链接是如何生成的? 原理分析 第一步,找到源地址 1.在想下载的视频网页,按f12打开开发人员工具。找到video标签,锁定src属性 2.确认src源为blob:样式,转到网络(network),在筛选中输入.m3u8ÿ 音视频 2025年08月21日 85 点赞 0 评论 15123 浏览
用 OpenCV 给图像 “挑挑拣拣”,找出关键信息! 目录一、背景二、OpenCV 关键词提取基础概念什么是关键词提取OpenCV 在关键词提取中的作用三、OpenCV 关键词提取的流程整体流程概述详细步骤及作用流程图四、OpenCV 关键词提取的代码实现环境准备代码演示代码说明五、常见问题及解决方法特征提取不准确关键词匹配错误六、小结一、背景在当今数字化信息爆炸的时代,图像和视频数据海量增长。从这些视觉数据中提取关键信息变得尤为重要。 音视频 2025年04月16日 67 点赞 0 评论 15076 浏览
基于PyQt5的UI界面开发——图像与视频的加载与显示 介绍这里我们的主要目标是实现一个基于PyQt5和OpenCV的图像浏览和视频播放应用。用户可以选择本地的图像或视频文件夹,进行图像自动播放和图像切换以及视频播放和调用摄像头等操作,并且支持图像保存功能。项目的核心设计包括文件路径选择、图像或视频的显示、自动播放、图像保存等功能。录得教程视频:专为深度学习开发者设计的PyQt5快速上手教程_哔哩哔哩_bili 音视频 2025年04月16日 127 点赞 0 评论 15028 浏览
【视频生成模型】通义万相Wan2.1模型本地部署和LoRA微调 目录 1 简介 2 本地部署 2.1 配置环境 2.2 下载模型 3 文生视频 3.1 运行命令 3.2 生成结果 4 图生视频 4.1 运行命令 4.2 生成结果 5 首尾帧生成视频 5.1 运行命令 5.2 生成结果 6 提示词扩展 7 LoRA微调 1 简介通义万相 2.1 在 2025 年 1 月推出, 音视频 2025年05月18日 113 点赞 0 评论 14729 浏览
B站视频秒转文字,开源神器bili2text 引言在信息爆炸的时代,视频内容已成为知识传播和娱乐的重要载体。Bilibili作为中国领先的视频分享平台,汇聚了海量的教育、娱乐和专业内容。然而,将视频中的语音内容高效转换为可编辑、可搜索的文本,仍然是内容创作者、教育工作者和研究人员面临的挑战。bili2text 是一个开源工具,旨在通过自动化流程实现Bilibili视频到文本 音视频 2025年11月02日 63 点赞 0 评论 14695 浏览
YOLOv8基于视频的帧图像识别与目标检测实战:从项目文件结构开始到多场景应用的解析(文章包括完整代码以及演示视频和结果视频) YOLOv8视频目标检测项目解析 目录 YOLOv8视频目标检测项目解析 目录 效果预览 项目文件结构 项目简介 代码详细解析 1. 环境配置和依赖导入 2. 模型加载和视频读取 3. 视频处理流程 4. 结果保存与显示 应用场景 项目特点 使用说明 效果预览原始视频: test 效果视频: result 项目文件结构YOL 音视频 2025年10月06日 188 点赞 0 评论 14668 浏览
FramePack V2版 - 支持首尾帧生成,支持LoRA,支持批量,支持50系显卡,一个强大的AI视频生成软件 本地一键整合包下载 FramePack 是斯坦福大学主导开发的视频生成框架,是一种用于视频生成的下一帧(下一帧部分)预测神经网络结构,可以逐步生成视频。FramePack 主要开发者之一,就是业内大名鼎鼎的张吕敏大佬,AI领域的“赛博佛祖”,ControlNet的作者,站内也发布了他的很多项目一键包。 F 音视频 2025年05月18日 72 点赞 0 评论 14632 浏览