① CS 103 计算的数学基础
计算能力的理论极限是什么?计算机能解决哪些问题?哪些不能?我们如何以数学上的确定性来推理这些问题的答案?本课程探讨这些问题的答案,并作为离散数学、可计算性理论和复杂性理论的介绍。课程完成后,学生将能够轻松编写数学证明、推理离散结构、阅读和编写一阶逻辑语句,以及使用计算设备的数学模型。
学习地址:
② CS106a 编程
突破网页数据集获取难题:Web Unlocker API 助力 AI 训练与微调数据集全方位解决方案
背景随着AI技术的飞速发展,诸如DeepSeek R1、千问QWQ32、文小言、元宝等AI大模型迅速崛起。在AI大模型训练和微调、AI知识库建设中,数据集的获取已成为不可或缺的基础。尤其是在面对各式各样的网页数据结构时,将其整理成可用的数据
本文介绍的用法相对复杂, 简单的用法请参考 这篇文章
seq_file适用于内核需要向应用层输出信息时使用,最常见的用法是遍历内核中的一个list数据结构输出list的内容到应用层;当然也可以输出任意的数据,并且输出到应用层的数据大小没有限制,默认缓冲区是一个PAGE_SIZE,当输出的数据大于PAGE_SIZE时seq_file会把缓冲区大小翻倍,直到超过要输出的数据大小,或者把内存耗尽。
se