跟着Nature Communications学作图:R语言ggplot2散点组合误差线展示响应比(Response ratio) 论文 Meta-analysis of the impacts of global change factors on soil microbial diversity and functionality #Sec15 论文里提供了数据和代码,很好的学习素材 这篇论文是公众号的一位读者留言,说这 人工智能 2025年07月08日 134 点赞 0 评论 12958 浏览
训练深度学习模型的技巧 最核心的技巧:数据集足够大且标记良好,就可以在不更改模型或训练设置的情况下获得良好的结果 但是,获得大量标记良好的数据集是有很高成本的,当数据集达不到上述要求时,可以遵循下面的技巧。 第一:先使用默认设置获得一个基准性能(baseline performance),找出需要改进的地方。借助wandb/tensorboard等工具,查看:train losses, val losses, mAP,P 人工智能 2025年07月08日 66 点赞 0 评论 13079 浏览
Kotlin Flow 背压和线程切换竟然如此相似 前言 上篇分析了Kotlin Flow原理,大部分操作符实现比较简单,相较而言背压和线程切换比较复杂,遗憾的是,纵观网上大部分文章,关于Flow背压和协程切换这块的原理说得比较少,语焉不详,鉴于此,本篇重点分析两者的原理及使用。 通过本篇文章,你将了解到: 什么是背压? 如何处理背压? Flow buffer的原理 Flow 线程切换的使用 Flow 线程切换的原理 1. 什么是背压? 先 人工智能 2025年07月08日 34 点赞 0 评论 16360 浏览
nlp-parser:一个用于依存句法分析的小工具-conll格式-支持sql做更复杂的分析 项目功能 分析中文文本的依存关系, 生成 conll 格式的中间文件, 以及本地 sqlite3 数据库文件, 方便统计各种 词, 词性 之间的不同依存关系频次 主要功能: 把中文文本解析为依存关系 包含分词,词性标注 结果存储为 conllu 文本和 sqlite3: 生成的 sqlite 文件方便用 sql 做各种统计分析 支持自定义正则对文本按行预处理: 命中正则的字符串将会删除 项目源 人工智能 2025年07月08日 125 点赞 0 评论 10822 浏览
Enterprise Data At HUAWEI(六) 基于PDCA的数据质量管理框架 什么是数据质量 华为数据质量指“数据满足应用的可信程度”,有以下6个维度 完整性:数据在创建、传递过程中无缺失和遗漏,包括实体完整、属性完整、记录完整和字段值完整四个方面。 及时性:及时记录和传递相关数据,满足业务对信息获取的时间要求。数据交付要及时,抽取要及时,展现要及时;数据交付时间过长可能导致分析结论失去参考意义。 准确性:真实、准确地记录原始数据,无虚假数 人工智能 2025年07月08日 171 点赞 0 评论 12736 浏览
NoSql_HBase-存储原理 存储设计 Hbase是一个基于Hdfs的分布式列式存储nosql大表数据库 拥有实时读写,和及时查询以及大表存储等功能 HBase内部是存在 namespace 和 table表的概念的的 Table逻辑对象 逻辑层面,让用户去逻辑操作,存储在元数据的一个概念 默认每张表至少一个 region分区 Region:Hbase中数据负载均衡的最小单元 一张表按照行进行分区,实现分布式存储,物理存在 人工智能 2025年07月07日 127 点赞 0 评论 14526 浏览
扩散模型 常见的生成模型(Generative Models)如 GAN、VAE 和基于流( Flow-based )的模型。他们在生成高质量样本方面取得了巨大成功,但每个都有其自身的局限性。 GAN 因其对抗性训练性质,其训练过程难以收敛以及生成多样性欠佳。 VAE 依赖于替代损失(surrogate loss)。流模型必须使用专门的架构来构建可逆变换。 扩散模型( Diffusion Models ) 人工智能 2025年07月07日 197 点赞 0 评论 3483 浏览
论文粗读“Highly-efficient Incomplete Large-scale Multi-view Clustering with Consensus Bipartite Graph” Wang S, Liu X, Liu L, et al. Highly-efficient incomplete large-scale multi-view clustering with consensus bipartite graph[C]//Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Rec 人工智能 2025年07月07日 70 点赞 0 评论 8523 浏览
存在/不存在工具 机器视觉原理与案例详解 工控帮教研组编著 电子工业出版社 2020.7 ISBN 978-7-121-39084-5 检查工具 包括存在/不存在工具、测量工具、计数工具、产品识别工具、几何工具、数学逻辑工具、绘图工具、图像滤波工具、缺陷检测工具、校准工具,如图10-28所示。 图10-28 在选择检查的图案时,为了确保获得最佳效果,可考虑以下选择图案的原则: 在每个图像 人工智能 2025年07月07日 54 点赞 0 评论 2637 浏览
Flink整合面向用户的数据流SDKs/API(Flink关于弃用Dataset API的论述) 动机 Flink提供了三种主要的sdk/API来编写程序:Table API/SQL、DataStream API和DataSet API。我们认为这个API太多了,建议弃用DataSet API,而使用Table API/SQL和DataStream API。当然,这说起来容易做起来难,所以在下面,我们将概述为什么我们认为太多的api对项目和社区有害。然后,我们将描述如何增强Table API/ 人工智能 2025年07月07日 197 点赞 0 评论 19741 浏览