登录社区云,与社区用户共同成长
邀请您加入社区
暂无图片
本文介绍了如何在星图GPU平台上自动化部署YOLO11镜像,快速构建目标检测开发环境。用户无需配置依赖或安装驱动,即可通过Jupyter或SSH直接开展人车识别等典型任务,适用于智能安防、交通监控及移动端实时检测等场景,大幅降低AI落地门槛。
本文介绍了医学图像分割任务的基本实现方法,主要包括: 任务定义:输入医学灰度图像,输出像素级二值分割mask 工程结构:包含数据加载、U-Net模型、损失函数和训练循环的完整框架 关键技术: 数据预处理:确保图像和mask严格对齐 标准U-Net实现:包含Encoder-Decoder结构和跳跃连接 损失函数:采用BCE+Dice组合损失 训练流程:展示了从数据加载到模型训练的基本过程
本文详细介绍了基于 ai-engine-direct-helper 项目在 Windows 和 Android 平台上部署 Qwen2.5-VL-3B 模型的步骤,包括模型与服务程序的下载、安装路径配置以及具体的命令行运行指令。
OSWorld 是目前 AI 领域衡量 “智能体(Agent)跨软件操作电脑” 能力最顶尖的基准测试,它模拟真实的操作系统环境,要求 AI 像人类一样通过视觉观察屏幕,并精准操控浏览器、Excel、VS Code 等各类桌面应用来完成跨平台的复杂任务,被OpenAI、Anthropic、字节跳动Seed、月之暗面、智谱等顶尖AI团队广泛采用,更是检验AI能否从“只会聊天”进化为“高效数字员工”的硬
下一代AI的核心突破:从语言预测到状态预测NSP(下一状态预测)标志着AI从语言模型向世界模型的进化关键。与NTP(下一词预测)不同,NSP让AI理解物理规律和因果关系,而不仅是文本概率。其核心在于预测环境状态变化,而非像素细节,通过抽象特征向量捕捉本质规律。Yann LeCun提出的JEPA架构实现了这一理念,在抽象空间进行状态推演。NSP赋予AI规划能力,使其能预判动作后果并选择最优方案,这是
传统方法大多基于数值建模——无论是统计模型(如 ARIMA)、深度自编码器,还是近期兴起的时序基础模型(如 TimesFM、UniTS)其共同局限在于:它们学习的是“正常数据的分布”,而非“异常的语义”。通过精心设计的 prompt,VLM 被引导执行三项操作:保留真正偏离全局模式的异常、剔除与历史行为一致的“伪异常”、并补充可能被初筛遗漏的宏观异常(如缓慢漂移)。而在日常运行阶段则完全正常。这种
本文提出了一种基于深度学习目标检测模型YOLOv12的垃圾智能分类系统,旨在实现高效、精准的垃圾识别与分类。系统针对10类常见垃圾(包括电池、衣物、玻璃、金属、塑料等)进行检测,采用自构建的YOLO格式数据集,包含训练集(9909张)、验证集(977张)和测试集(486张)。通过YOLOv12模型结构,系统集成用户友好的UI界面,支持登录注册功能,便于用户交互与数据管理。实验结果表明,该系统在实时
基于深度学习的水果种类及成熟度分类检测系统利用计算机视觉和深度学习技术,自动识别水果类别并判断其成熟度。该系统通常包含图像采集、数据预处理、模型训练和分类预测模块,适用于农业分拣、零售和食品加工等领域。
本文介绍了如何在星图GPU平台上自动化部署YOLO11镜像,快速构建目标检测环境。无需本地配置,三步即可完成GPU算力适配,在A10显卡上实现推理速度提升50%,适用于商品图识别、工业质检、无人机航拍分析等典型场景。
摘要:本文介绍了一个基于Python的深度学习股票预测系统,采用CNN-LSTM混合模型架构。系统通过金融API获取股票数据,经过预处理后,利用CNN提取空间特征,LSTM捕捉时间依赖关系。项目采用Django框架开发,支持MySQL数据库,提供数据采集、预处理、模型训练和预测评估等功能。系统优化策略包括数据增强、模型融合和超参数调优等,旨在提高预测准确性。虽然面临数据质量、模型泛化等挑战,但该系