音视频 - 小智博客

B站视频秒转文字，开源神器bili2text

引言在信息爆炸的时代，视频内容已成为知识传播和娱乐的重要载体。Bilibili作为中国领先的视频分享平台，汇聚了海量的教育、娱乐和专业内容。然而，将视频中的语音内容高效转换为可编辑、可搜索的文本，仍然是内容创作者、教育工作者和研究人员面临的挑战。bili2text 是一个开源工具，旨在通过自动化流程实现Bilibili视频到文本

音视频 2025年11月02日 63 点赞 0 评论 15107 浏览

2025年 GitHub 主流开源视频生成模型介绍

Wan 2.1：阿里开源的AI视频生成大模型Wan2.1 是阿里巴巴开源的高性能视频生成模型，凭借技术创新和易用性成为当前AI视频生成领域的标杆工具。其核心特点如下： SOTA性能表现 Wan2.1 在权威评测榜单VBench中以86.2分综合成绩稳居第一，尤其在视频质量（86.67）、语义理解（

音视频 2026年02月21日 125 点赞 0 评论 15113 浏览

【视频生成模型】通义万相Wan2.1模型本地部署和LoRA微调

目录 1 简介 2 本地部署 2.1 配置环境 2.2 下载模型 3 文生视频 3.1 运行命令 3.2 生成结果 4 图生视频 4.1 运行命令 4.2 生成结果 5 首尾帧生成视频 5.1 运行命令 5.2 生成结果 6 提示词扩展 7 LoRA微调 1 简介通义万相 2.1 在 2025 年 1 月推出，

音视频 2025年05月18日 113 点赞 0 评论 15167 浏览

亲测Paraformer-large镜像，长音频离线识别效果惊艳

亲测Paraformer-large镜像，长音频离线识别效果惊艳最近在处理大量会议录音和讲座音频时，一直在寻找一个稳定、高精度且支持长音频的本地语音识别方案。试过不少工具后，终于找到了这款 Paraformer-large语音识别离线版（带Gradio可视化界面） 镜像，实测下来效果非常惊艳——不仅识别准确率高&#

音视频 2026年03月04日 176 点赞 0 评论 15319 浏览

无需验证手机Sora2也能用！视频生成，创建角色APi接入教程，开发小白也能轻松接入

通知！Sora2最近调整了一波规则，需要绑定手机验证，GrsAi已经完全解决了该问题，提高了视频成功率！ Sora2 A文档看不懂？到底怎么调用啊？可以上传真人创建角色吗？3个不同的api都有什么用？怎么收费？本文将详细介绍GrsAI APi源头供应商

音视频 2026年02月16日 117 点赞 0 评论 15320 浏览

LTX-2.3：开源AI视频生成的新标杆，一个模型同时生成视频和音频

当 AI 视频生成不再是闭源巨头的专利在 AI 视频生成领域，我们见证了太多令人惊艳的 demo，但它们大多藏在闭源的高墙之后。而今天，Lightricks 发布的 LTX-2.3 正在改写这个故事——这是一个完全开源、可本地运行、能同时生成高质量视频和同步音频的基础模型。更重要的是，它不只是一个实验室产物，而是一个真正为生产环

音视频 2026年04月03日 151 点赞 0 评论 15393 浏览

如何下载链接为blob类型的视频,video 标签 src:blob 链接转下载MP4

文章目录前言这种链接是如何生成的？ 原理分析第一步，找到源地址 1.在想下载的视频网页，按f12打开开发人员工具。找到video标签，锁定src属性 2.确认src源为blob：样式，转到网络（network），在筛选中输入.m3u8&#xff

音视频 2025年08月21日 85 点赞 0 评论 15422 浏览

前端实现B站视频画中画功能 - 完整代码实现主页面和小窗同步视频控制功能

🌷 古之立大事者，不惟有超世之才，亦必有坚忍不拔之志 🎐 个人CSND主页——Micro麦可乐的博客 🐥《Docker实操教程》专栏以最新的Centos版本为基础进行Docker实操教程，入门到实战 🌺《RabbitMQ》专栏19年编写主要介绍使用JAVA开发RabbitMQ的系列教程&

音视频 2025年08月06日 106 点赞 0 评论 15463 浏览

OpenCV计算机视觉实战（27）——深度学习与卷积神经网络

OpenCV计算机视觉实战（27）——深度学习与卷积神经网络 0. 前言 1. 深度学习简史 1.1 感知器 1.2 浅层学习网络 1.3 深度学习网络 2. 权重、偏置和激活函数 2.1 权重 2.2 偏置 2.3 激活函数 2.4 优化过程 3. 卷积神经网络 3.1 卷积层 3.2 全连接网络 vs 卷积神经网络

音视频 2025年10月28日 106 点赞 0 评论 15522 浏览

视频降噪技术深度解析：从理论到ffmpeg-python实践

视频降噪技术深度解析：从理论到ffmpeg-python实践【免费下载链接】ffmpeg-python Python bindings for FFmpeg - with complex filtering support 项目地址: 在数字视频处理领域，噪声

音视频 2025年12月29日 194 点赞 0 评论 15523 浏览

音视频

首页

IT互联网

音视频

列表

默认

浏览次数

发布时间