从零开始强化学习(四)——策略梯度 四. 策略梯度(Policy Gradient) 4.1 期望奖励(Expected Reward) 在强化学习中有3个组成部分:演员(actor),环境(environment)和奖励函数(reward function) 演员就是一个网络,输入状态,输出动作 环境就是一个函数,输入状态和动作,输出状态。环境是基于规则的规则,是确定不变的 奖励是在某一个状态下采取某个动作能够获得的分数。环境是 人工智能 2025年05月01日 106 点赞 0 评论 3802 浏览
kotlin<第八篇>:协程的启动与取消 一、启动构建器 launch与async构建器都用来启动新协程: 1、launch,返回一个Job,并且不附带任何结果值 2、async,返回一个Deferred,Deferred也是一个Job,可以使用.await()在一个延期的值上得到它的最终结果。 等待一个作业: 1、线程切换 launch(Dispatchers.Default) { println("1") 人工智能 2025年08月04日 102 点赞 0 评论 3801 浏览
扩散模型 常见的生成模型(Generative Models)如 GAN、VAE 和基于流( Flow-based )的模型。他们在生成高质量样本方面取得了巨大成功,但每个都有其自身的局限性。 GAN 因其对抗性训练性质,其训练过程难以收敛以及生成多样性欠佳。 VAE 依赖于替代损失(surrogate loss)。流模型必须使用专门的架构来构建可逆变换。 扩散模型( Diffusion Models ) 人工智能 2025年07月07日 197 点赞 0 评论 3786 浏览
创建自定义的 Angular 管道 我们在上一篇文章中,了解了什么是 Angular 管道,以及如何使用 Angular 提供的一些常用管道。本文将进一步深入探讨如何创建一个 Angular 管道,实现对数据的自定义转换。 创建管道 我们可以使用 Angular CLI 的 generate 命令,创建一个管道: ng generate pipe sort 输出结果: CREATE src/app/sort.pipe.spec. 人工智能 2025年09月27日 131 点赞 0 评论 3738 浏览
Pycharm 接入 Deepseek API完整版教程 最终效果展示: 1.进入Deepseek网站创建API KEY,申请的Key保存好。创建API KEY之后需要充值,因为tokens现在开始收费了。创建过程可以参考该链接 2.如果出现下面的错误,说明api没有在环境变量里正确设置:openai.OpenAIError: The api_key client option m 人工智能 2025年12月23日 103 点赞 0 评论 3707 浏览
群体行为(不要碰到对方) 书名:代码本色:用编程模拟自然系统 作者:Daniel Shiffman 译者:周晗彬 ISBN:978-7-115-36947-5 第6章目录 6.11 群/体行为(不要碰到对方) 1、ArrayList 在粒子系统类中,我们用ArrayList存放粒子的列表。我们会在本例中做同样的事情:把一组Vehicle对象存放到ArrayList中。 ArrayList<Vehicle> 人工智能 2025年08月27日 158 点赞 0 评论 3704 浏览
在家也能做 AI 导演!本地部署 Wan2.1 视频生成模型全攻略 文章目录 前言 1.软件准备 1.1 ComfyUI 1.2 文本编码器 1.3 VAE 1.4 视频生成模型 2.整合配置 3. 本地运行测试 4. 公网使用Wan2.1模型生成视频 4.1 创建远程连接公网地址 5. 固定远程访问公网地址 总结 前言Wan2.1 模型搭配 ComfyUI 框架,能实现文本转视频、图片转动画等功能ÿ 人工智能 2025年12月16日 84 点赞 0 评论 3694 浏览
【中秋节+AI】三款AI产品让我的中秋节不再无趣 前言:欢迎各位光临本博客,这里小编带你直接手撕**,文章并不复杂,愿诸君**耐其心性,忘却杂尘,道有所长!!!! IF’Maxue:个人主页 🔥 个人专栏: 《C语言》 《C++深度学习》 《Li 人工智能 2025年10月20日 178 点赞 0 评论 3691 浏览
AI的提示词专栏:ChatGPT-4 与 GPT-3.5 Prompt 差异分析 AI的提示词专栏:ChatGPT-4 与 GPT-3.5 Prompt 差异分析 本文围绕 ChatGPT-4 与 GPT-3.5 的 Prompt 差异展开分析,指出二者定位不同是差异根源 ——GPT-3.5 主打高效轻量化,ChatGPT-4 聚焦复杂任务深度处理。核心差异体现在上下文理解(ChatGPT-4 窗口更长、关联更准& 人工智能 2025年12月31日 65 点赞 0 评论 3687 浏览
优化算法matlab实现(八)人工蜂群算法matlab实现 注意:此代码实现的是求目标函数最大值,求最小值可将适应度函数乘以-1(框架代码已实现)。 注意:此代码实现的是求目标函数最大值,求最小值可将适应度函数乘以-1(框架代码已实现)。 注意:此代码实现的是求目标函数最大值,求最小值可将适应度函数乘以-1(框架代码已实现)。 1.代码实现 不了解人工蜂群算法可以先看看优化算法笔记(八)人工蜂群算法 实现代码前需要先完成优化算法matlab实现(二)框架编 人工智能 2025年06月15日 86 点赞 0 评论 3648 浏览