音视频 - 小智博客

PPT插入视频的播放控制：自动播放与点击播放设置！

嘿，各位PPT设计的小伙伴们！在做PPT的时候，插入视频那可是提升内容丰富度和吸引力的一大利器。但视频插入之后，到底是让它自动播放，还是设置成点击播放，这可大有讲究。设置得好，能让你的PPT瞬间高大上，设置不好，就可能搞得一团糟。今天咱就来好好唠唠PPT插入视频的播放控制&

音视频 2026年01月09日 114 点赞 0 评论 18047 浏览

FunASR搭建语音识别服务和VAD检测

调整VAD参数1. 查找VAD模型的配置文件FunASR中的VAD模型为FSMN-VAD，参数配置类为VADXOptions，可以在以下路径中找到： /workspace/FunASR/runtime/python/onnxruntime/funasr_onnx/utils/e2e_vad.py其中，VADXOptions类定义了多个VAD参

音视频 2025年08月21日 128 点赞 0 评论 18041 浏览

Sora王者归来：300天磨一剑，OpenAI如何重新定义AI视频创作

【摘要】历经300天沉淀，OpenAI Sora V2正式发布，其核心并非仅是视频生成，而是通过分镜工具、高级编辑功能与对物理世界的深刻理解，重塑了AI视频创作的范式，标志着一个从“生成”到“创造”的新纪元。引言2024年12月10日，科技圈的日历被重重地圈上了一个红圈。从2月15日初次惊艳亮相，

音视频 2025年10月03日 100 点赞 0 评论 18034 浏览

Java 大视界 -- Java 大数据在智能安防视频监控系统中的视频语义理解与智能检索进阶（365）

Java 大视界 -- Java 大数据在智能安防视频监控系统中的视频语义理解与智能检索进阶（365） 引言： 正文： 一、Java 视频数据处理架构与关键技术 1.1 视频流实时解析与预处理 1.2 夜间场景语义理解优化二、行为语义理解与实时预警系统 2.1 多模型融合的行为识别

音视频 2025年08月21日 121 点赞 0 评论 17967 浏览

安卓格式工厂v6.6.4高级版，全格式视频转换与音频提取方案

[软件名称]: 安卓格式工厂v6.6.4高级版[软件大小]: 58.1 MB[下载通道]: 夸克盘 | 迅雷盘软件介绍一、产品定位格式工厂视频转换器（Format Factory Converter）v6.6.4 高级版是一款面向 Android 平台的多媒体处理工具，集“视频转码、音频提取、压缩、配音”于一体，支持主流格式无损互转&#xf

音视频 2025年08月29日 165 点赞 0 评论 17877 浏览

Cmake编译带CUDA加速的OpenCv(保姆级）--附编译好的文件

文章目录前言一、需要准备的软件二、NVIDIA CUDA安装过程 CUDNN安装下载Cmake编译软件下载OpenCv_contribute Cmake编译过程 VS编译OpenCv阶段手残党必备前言CUDA允许利用GPU的并行计算能力，显著提高图像处理和计算的速度，尤其是在处理大规模数据时。相比于C

音视频 2025年04月20日 48 点赞 0 评论 17857 浏览

计算机视觉 - 物体检测开山鼻祖 R-CNN系列：Fast R-CNN、Faster R-CNN、Mask R-CNN

特性 R-CNN Fast R-CNN Faster R-CNN 区域提议方法选择性搜索（传统算法） 选择性搜索（传统算法） 区域提议网络（RPN）（深度学习） 特征提取方式每个候选区域独立提取（极度冗余） 整张图像提取一次&#xff0

音视频 2025年09月29日 101 点赞 0 评论 17854 浏览

ESP32-s3音频开发详解：ES8311音频输出实战教程

ESP32-s3音频开发详解：ES8311音频输出实战教程前言大家好，今天给大家带来ESP32开发板上音频输出功能的完整实现教程。在嵌入式开发中，音频输出功能非常重要，无论是智能家居设备、可穿戴设备还是各类IoT终端，都可能需要语音提示或音频播放功能。本文将详细讲解如何基于ES8311芯片实现音频输出，手把手教

音视频 2026年01月10日 179 点赞 0 评论 17829 浏览

超省心！一键提取抖音视频文案，轻松搞定内容整理！

嘿，小伙伴们！今天给你们分享一个超实用的小工具，简直是抖音内容创作者和运营者的福音！它叫“抖音视频提取文字”，是基于抖音同集团的Coze工作流开发的。这个工具超简单，你只需要把抖音视频的链接贴进去，它就能自动帮你把视频里的文案提取出来，然后直接存到飞书文档里。最后，它还会

音视频 2025年09月06日 156 点赞 0 评论 17811 浏览

Redis缓存中间件接入：加速重复音频识别

Redis缓存中间件接入：加速重复音频识别在语音识别系统被广泛应用于客服质检、会议转录和智能助手的今天，一个现实问题日益凸显：大量重复音频反复触发模型推理，不仅浪费计算资源，还拖慢整体响应速度。比如，在某银行客服中心，每天有上千通电话中都包含“您的来电已被录音”这句提示音——如果每次都要加载大模型进行

音视频 2026年01月16日 118 点赞 0 评论 17770 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间