计算机视觉---RealSense深度相机技术 一、RealSense技术概述 定义与定位 RealSense是英特尔开发的深度感知技术平台,通过融合多种传感器(红外、RGB、IMU等),为设备提供高精度的三维空间感知能力。其核心目标是让机器“看懂”世界,广泛应用于机器人、AR/VR、安防监控、工业检测等领域。 发展历程 2014年:英特尔发布第一代R 音视频 2025年10月06日 110 点赞 0 评论 13986 浏览
CANN图像批处理创新实战:让OpenCV加速28倍的秘密 欢迎来到我的博客,代码的世界里,每一行都是一个故事 🎏:你只管努力,剩下的交给时间 🏠 :小破站 CANN图像批处理创新实战:让OpenCV加速28倍的秘密 前言 环境准备 核心实现 批量数据准备 图像缩放实现 高斯模糊实现 NPU预热的重要性 音视频 2026年01月10日 67 点赞 0 评论 14055 浏览
KrillinAI:视频跨语言传播的一站式AI解决方案 引言在全球内容创作领域,跨语言传播一直是内容创作者面临的巨大挑战。传统的视频本地化流程繁琐,涉及多个环节和工具,不仅耗时耗力,还常常面临质量不稳定的问题。随着大语言模型(LLM)技术的迅猛发展,一款名为KrillinAI的开源工具横空出世,为内容创作者带来了革命性的视频翻译与配音解决方案。本文将深入剖析这款Git 音视频 2025年05月09日 100 点赞 0 评论 14056 浏览
FunASR开源项目实战:解锁语音识别新姿势 摘要:FunASR是阿里巴巴达摩院开源的高性能语音识别工具包,具备语音识别、说话人分离、标点恢复等核心功能。项目采用先进的Paraformer非自回归架构,在中文识别任务上表现优异,支持实时与非实时处理模式。通过预训练模型和易用API,可快速搭建智能语音助手、会议转写、视频字幕等应用场景。技术亮点包括:多说话 音视频 2025年09月29日 139 点赞 0 评论 14084 浏览
全网首发! Nvidia Jetson Thor 128GB DK 刷机与测评(一)刷机与 OpenCV-CUDA、pytorch CUDA13.0+ 使用 Nvidia Jetson Thor DK 于 2025年8月25日正式发售,我们实验室获得了首批套件,经过几天的折腾,这篇博客将总结如何刷机以及刷机过程中的注意事项。【Note】:由于评测部分内容太多,我们将这篇博客拆分为多篇避免单独的博客失去重点,你可以通过下面的链接进行跳转: 《全网首发! Nv 音视频 2025年10月24日 181 点赞 0 评论 14104 浏览
终极指南:用m3u8下载器永久保存直播视频的5个关键步骤 终极指南:用m3u8下载器永久保存直播视频的5个关键步骤 【免费下载链接】m3u8-downloader 一个M3U8 视频下载(M3U8 downloader)工具。跨平台: 提供windows、linux、mac三大平台可执行文件,方便直接使用。 项目地址: 音视频 2026年02月14日 117 点赞 0 评论 14119 浏览
通义万相2.1:开启视频生成新时代 摘要:文章开篇便点明了通义万相2.1在视频生成领域的重大突破,强调其作为阿里云通义系列AI模型的重要成员,不仅是简单的模型升级,更是视频生成技术迈向更智能、高效、精准的重要里程碑。其核心技术包括自研的高效VAE和DiT架构,使得模型能够实现无限长1080P视频的高效编解码,并在中文文字视频生成方面取得重大突破&#x 音视频 2025年07月11日 138 点赞 0 评论 14143 浏览
使用 C++ 和 OpenCV 进行表面划痕检测 使用 C++ 和 OpenCV 进行表面划痕检测在工业自动化生产中,产品表面的质量控制至关重要。划痕作为一种常见的表面缺陷,其检测是许多领域(如金属、玻璃、塑料制造)质量保证流程中的一个关键环节。本文将介绍如何使用 C++ 和强大的计算机视觉库 OpenCV 来实现一个基本的表面划痕检测算法。 核心思路划痕通 音视频 2025年09月25日 75 点赞 0 评论 14168 浏览
一个人就是一支影视团队:实测国内最强影视级 AI 视频创作平台 TapNow——告别抽卡,导演级精准控制 实测国内最强影视级 AI 视频平台 TapNow:告别“盲盒抽卡”,实现导演级精准调度 在过去的一年里,文生视频赛道经历了爆发式增长。但对于真正需要将 AI 投入到生产环境中的创作者、产品经理和开发者来说,目前的 AI 视频工具普遍存在一个致命痛点——不可控。 跑偏的物理规律、诡异的肢体形变、如同“开盲盒”般的提示 音视频 2026年04月03日 180 点赞 0 评论 14204 浏览
Qwen2.5-Omni 大模型部署实践(九):音视频交互中多元知识探讨实践 系列篇章💥 No. 文章 1 Qwen2.5-Omni 大模型部署实践(一):环境搭建与模型下载 2 Qwen2.5-Omni 大模型部署实践(二):使用transformers推理实践 3 Qwen2.5-Omni 大模型部署实践(三): 音视频 2025年05月09日 94 点赞 0 评论 14210 浏览