音视频 - 小智博客

Java程序员面试实战：互联网大厂音视频场景技术问答

Java程序员面试实战：互联网大厂音视频场景技术问答场景背景互联网大厂正在招聘一名Java程序员，负责音视频场景的技术开发。面试官以严肃态度对程序员超好吃进行了3轮技术问答，内容涵盖从基础到进阶的关键技术栈。以下是详细对话与解析。第一轮：基础知识与场景应用问题 1：音视频场景中，如何使用Spring Boot快速搭

音视频 2026年03月30日 172 点赞 0 评论 8539 浏览

FunASR流式语音识别终极实战指南：从零到一构建低延迟实时转写系统

还在为语音识别的高延迟而烦恼吗？实时语音交互场景中，传统ASR系统往往存在明显的响应延迟，严重影响用户体验。FunASR作为高效语音识别工具包，其paraformer_streaming模型通过创新的非自回归结构，实现了首字输出延迟低至600ms的突破性表现。本文将为你完整解析流式语音识别的核心技术，从模型原理到部

音视频 2026年03月30日 121 点赞 0 评论 5998 浏览

Flutter 三方库 video_url_validator 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、准确的视频外部链接合法性审计引擎

欢迎加入开源鸿蒙跨平台社区：# Flutter 三方库 video_url_validator 的鸿蒙化适配指南 - 在鸿蒙系统上构建极致、准确的视频外部链接合法性审计引擎在鸿蒙（OpenHarmony）系统的社交分享、内容创作或在线教育应用中，用户经常需要粘贴来自 YouTube、Vimeo 等主流视频平台的链接。如何快速判断这些链接是否合

音视频 2026年03月30日 171 点赞 0 评论 16276 浏览

Remotion音乐可视化终极指南：从零打造专业级音频视觉盛宴

Remotion音乐可视化终极指南：从零打造专业级音频视觉盛宴【免费下载链接】remotion 🎥 Make videos programmatically with React 项目地址: 在当今内容为王的时代，音乐可视化视频已成为社交媒体上的新宠。无

音视频 2026年03月30日 157 点赞 0 评论 2460 浏览

opencut：用AI工具擦除视频中的动态人物和文字，太简单了！

在视频创作越来越普及的当下，不少创作者都曾遇到过这样的困扰：精心拍摄的Vlog里突然闯入路人，破坏了画面的完整性；下载的素材带有硬编码字幕，遮挡关键信息；工作所需的视频中有多余文字标识，影响传播效果……想要解决这些问题，传统的视频剪辑软件不仅操作复杂，学习成本高&#xff0

音视频 2026年03月31日 65 点赞 0 评论 891 浏览

OpenCV DNN实战：年龄性别识别的模型剪枝技巧

OpenCV DNN实战：年龄性别识别的模型剪枝技巧1. AI 读脸术 - 年龄与性别识别在计算机视觉领域，人脸属性分析是一项极具实用价值的技术方向。从安防系统到智能营销，从个性化推荐到人机交互，自动识别人脸的性别与年龄段已成为许多AI应用的基础能力。传统的深度学习方案往往依赖PyTorch或TensorFlow等重型框架，部署

音视频 2026年03月31日 55 点赞 0 评论 12277 浏览

口播博主必备神器：旗博士爆款口播自动生成智能体，一键生成AI口播视频，无限次数生成

KrLongAI 旗博士：本地部署的 AI 数字人口播视频全流程自动化工程在 AIGC 赋能内容创作的浪潮下，数字人口播视频成为内容生产的重要形式，但传统制作流程存在文案创作难、音视频处理繁琐、多平台发布效率低等痛点。今天给大家推荐一款本地运行、模块化、可扩展的 AI 数字人口播视频自动化生成工具 ——KrLongAI 旗博士，它实现了从对标

音视频 2026年04月03日 156 点赞 0 评论 3798 浏览

《计算机视觉：模型、学习和推理》第 16 章-多摄像机系统

目录前言16.1 双视图几何学理论16.1.1 极线约束16.1.2 极点16.2 实矩阵16.2.1 实矩阵的属性16.2.2 实矩阵的分解16.3 基础矩阵16.3.1 基础矩阵的估计16.3.2 8 点算法 8 点算法实战代码（完整可运行）代码说明效果说明16.4 双视图重构的流程16.5 校正16.5.1 平面校正16.5.2 极面校正16.5.3

音视频 2026年04月03日 188 点赞 0 评论 11680 浏览

告别ModelScope魔搭联网依赖！sherpa-onnx + SenseVoice 完全离线语音识别部署指南（2026版，离线语音识别、声纹鉴定、sherpa-onnx、SenseVoice）

关键词：离线语音识别、声纹鉴定、sherpa-onnx、SenseVoice、FunASR、ModelScope魔搭社区、Kaldi、语音转文字、声纹比对、说话人识别 GitHub: 官方文档: 一、问题背

音视频 2026年04月03日 67 点赞 0 评论 16845 浏览

Wan2.2-T2V-A5B环境部署：一文详解AI视频生成模型配置全过程

Wan2.2-T2V-A5B环境部署：一文详解AI视频生成模型配置全过程1. 技术背景与选型价值随着AIGC技术的快速发展，文本到视频（Text-to-Video, T2V）生成正成为内容创作领域的重要工具。Wan2.2-T2V-A5B是由通义万相推出的开源轻量级T2V模型，具备50亿参数规模，在保持高效推理能力的

音视频 2026年04月03日 109 点赞 0 评论 9047 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间