音视频 - 小智博客

人工智能训练师——智能语音识别ASR

人机对话——ASR概念ASR（Automatic Speech Recognition，自动语音识别）是一种将人类语音转换为文本的技术。它使得计算机能够“听”懂人类的语音指令或对话，并将其转换成可读、可编辑的文本形式。ASR技术是人机交互领域中的一个重要分支，广泛应用于各种智能设备和服务中。两大组成部分ASR（Au

音视频 2025年08月06日 196 点赞 0 评论 14262 浏览

【从零开始学Dify】 Dify + 视觉模型构建文生视频工作流

目录题 DIfy 工作流创建工作流 1、添加模型 2、创建应用 3、Workflow的系统变量 4、添加用户输入变量 5、添加LLM节点 6、安装文生视频插件 7、添加文生视频节点 8、添加LLM节点 9、添加结束节点 10、发布测试最后 DIfy 工作流工作流通过将复杂的任务分解成较小的步骤（节点）降低系统复杂度，减少了对提示

音视频 2025年08月06日 190 点赞 0 评论 11452 浏览

基于OpenCV实现实时颜色检测

文章目录一、引言二、系统概述三、代码解析 1. 导入库 2. 颜色识别函数 3. 主程序循环四、HSV色彩空间详解五、颜色范围设定六、系统优化建议七、完整代码八、总结一、引言今天我将介绍一个使用Python和OpenCV库实现的实时颜色识别系统。这个系统能够通过摄像头捕捉视频流，并在视频中指定区域内识别主要颜色（红、黄、

音视频 2025年08月06日 173 点赞 0 评论 13075 浏览

OpenCV从入门到精通：OpenCV安装、配置、依赖安装、基本语法、常用方法详解

OpenCV从入门到精通：OpenCV安装、配置、依赖安装、基本语法、常用方法详解引言OpenCV（Open Source Computer Vision Library）是一个开源的跨平台计算机视觉库，提供了丰富的图像和视频处理算法接口，支持 Python、C++、Java 等多种语言。它在工业检测、人脸识

音视频 2025年08月06日 127 点赞 0 评论 11863 浏览

AudioRelay 手机与电脑互传流式音频(手机做电脑音箱或麦克风)

之前曾有个“榨干旧手机性能”的软件包，可以用手机做电脑的副屏、摄像头、键盘。美中不足的是，没有手机充当电脑音响或麦克风的工具。近日得大神推荐：AudioRelay 让手机充当电脑的音响或麦克风吾特来补充分享，AudioRelay官网：#xff0c;将您的手机变成

音视频 2025年08月06日 70 点赞 0 评论 10905 浏览

23电赛e题复盘（舵机+opencv方案，附源码）

题目解读和大致思路需要指导可以联系vx：xiaobai712356 1.激光点需能从任意位置回到原点任务需求： 需知道激光点当前位置，原点位置， 控制激光点在白板上运动解决方法： 1.识别激光点： 根据激光点所在像素点的亮度远远高于其他像素点，所以将图像转为[[HSV空间]] 而V表示亮

音视频 2025年08月06日 194 点赞 0 评论 5376 浏览

SenSeVoice模型微调记录，语音识别垂直领域术语准确率提升至99%

场景：项目需要开发一个语音下单助手，但在识别能源石油领域的专业名词（如石油产品、仓库、炼油厂等）时准确率较低，导致无法正确匹配下单信息。需对语音识别模型进行微调，提升垂直领域术语的识别准确率。本文复现下之前微调的过程，以作记录。微调步骤一.准备数据集从数据库中查询出所有的商品名称，

音视频 2025年08月14日 93 点赞 0 评论 12316 浏览

使用 DeepSeek 配合即梦AI 生成视频的详细教程

以下是使用 DeepSeek 配合即梦AI 生成视频的详细教程，结合了多篇搜索结果的实操经验与优化技巧，帮助用户高效完成从脚本设计到视频输出的全流程：一、生成视频脚本与分镜提示词启动DeepSeek的深度思考模式在DeepSeek官网或应用中，勾选“深度思考”功能，输入具体需求。例如： “我要制作一个关于普

音视频 2025年08月14日 159 点赞 0 评论 13433 浏览

计算机视觉---视觉伺服控制

一、视觉伺服控制的基本概念与定义视觉伺服控制（Visual Servoing Control）是一种将计算机视觉与自动控制相结合的技术，通过相机获取环境图像信息，提取目标特征，再基于特征误差生成控制信号，驱动执行机构（如机器人手臂、无人机）完成目标跟踪、定位或操作任务。其核心思想是建立

音视频 2025年08月14日 49 点赞 0 评论 20938 浏览

【工具】HandBrake使用指南：功能详解与视频转码

HandBrake使用指南：功能详解与视频转码一、前言高清视频在当下日益普及，从影视制作到个人拍摄，从社交媒体发布到远程教育，如何高效地压缩、转换和管理视频文件的体积与清晰度，成为内容创作者与技术开发者的核心任务。作为一款免费、开源、跨平台的视频转码神器，HandBrake 拥有强大的编码能力和直观的图形界面&

音视频 2025年08月14日 100 点赞 0 评论 16017 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间