音视频 - 小智博客

FunASR流式语音识别终极实战指南：从零到一构建低延迟实时转写系统

还在为语音识别的高延迟而烦恼吗？实时语音交互场景中，传统ASR系统往往存在明显的响应延迟，严重影响用户体验。FunASR作为高效语音识别工具包，其paraformer_streaming模型通过创新的非自回归结构，实现了首字输出延迟低至600ms的突破性表现。本文将为你完整解析流式语音识别的核心技术，从模型原理到部

音视频 2026年03月30日 121 点赞 0 评论 5999 浏览

从零搭建中文语音识别服务｜基于FunASR镜像实现文件转写与实时录音识别

从零搭建中文语音识别服务｜基于FunASR镜像实现文件转写与实时录音识别1. 引言1.1 业务场景描述在智能客服、会议记录、教育录播和内容创作等场景中，将语音高效准确地转换为文字是一项核心需求。传统的语音识别方案往往依赖云端API，存在数据隐私风险、网络延迟高以及调用成本高等问题。本地化部署的语音识别系统成为越来越多企业与开发者的首选。1.2 痛点分析目前

音视频 2026年01月23日 67 点赞 0 评论 6005 浏览

【Unity】音频管理系统，统一控制游戏音效

简介：在 Unity 游戏开发中，音效是提升游戏体验的重要部分。然而，直接在各个脚本中调用 AudioSource.Play() 会导致管理混乱、代码冗余。本教程将使用单例模式 + 列表（List）+字典（Dctionary）+事件系统设计一个 AudioManager&#

音视频 2025年07月18日 88 点赞 0 评论 6014 浏览

dolby 音频技术简介（atmos）

杜比全景声（Dolby Atmos）是杜比实验室（Dolby Laboratories Inc）在2012年推出的电影环绕声，首次运用于美国好莱坞电影《勇敢的传说》的声音创作中。杜比全景声突破了传统的以“声道”为基础的声音系统，将声音从在平面的环绕拓展到三维空间，并引入了“声音对象”的概念(objec

音视频 2025年04月16日 145 点赞 0 评论 6068 浏览

蓝耘携手通义万象 2.1 图生视频：开启创意无限的共享新时代

在科技飞速发展的今天，各种新奇的技术不断涌现，改变着我们的生活和工作方式。蓝耘和通义万象 2.1 图生视频就是其中两项非常厉害的技术。蓝耘就像是一个超级大管家，能把各种资源管理得井井有条；而通义万象 2.1 图生视频则像是一个神奇的魔法师，能把一张张静止的图片变成生动有趣的视频。当这两者结合在一起，会产生什么样的奇

音视频 2025年11月02日 96 点赞 0 评论 6111 浏览

OpenCV中文显示中文内容与标题乱码问题完美解决方案

OpenCV中文显示中文内容与标题乱码问题完美解决方案在使用OpenCV进行图像处理时，中文显示一直是个头疼的问题。上一篇文章我们介绍了如何解决图像中中文内容的显示问题，但有细心的读者反馈窗口标题的中文乱码问题依然存在。本文将完整解决这两个问题，并分享我最终的解决方案。一、先解决图像中中文内容的显示问题OpenCV自带的cv2.putText()函数不

音视频 2026年01月23日 151 点赞 0 评论 6121 浏览

轻松获取B站视频资源：bilibili-parse解析工具完全指南

轻松获取B站视频资源：bilibili-parse解析工具完全指南【免费下载链接】bilibili-parse bilibili Video API 项目地址: 想要快速获取B站视频的播放链接或详细信息吗？bilibili-parse是一个功能强大的PHP视

音视频 2026年03月30日 76 点赞 0 评论 6127 浏览

HTTPS 的加密过程~

一、HTTP 与 HTTPS 的区别HTTP 本身不加密，所有通信（用户名、密码、Cookie、内容）都是明文的 HTTPS 则是在 HTTP 外层加了一层 SSL/TLS 安全层，核心功能包括：加密（防止窃听） 认证（防止伪造网站） 完整性（防止数据被篡改

音视频 2025年10月20日 99 点赞 0 评论 6143 浏览

2024年9月GESPC++三级真题解析（含视频）

视频讲解：GESP2024年9月三级C++真题讲解一、单选题第1题解析：答案B，会有精度缺失double a=0.9; double b=1.0; //输出为0.09999999999999997780 cout<<fixed<<setprecision(20)<<b-a<&l

音视频 2025年10月29日 165 点赞 0 评论 6172 浏览

自适应语言引导的多模态变换器：通过抑制视觉和音频中的无关信息来改进情感分析（14 Dec 2023）

Learning Language-guided Adaptive Hyper-modality Representation for Multimodal Sentiment Analysis#xff08;MSA）中，模型通常需要整合来自不同模态（如

音视频 2025年04月20日 97 点赞 0 评论 6235 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间