机器学习课程-温州大学-01机器学习-引言Facebook AI Research(FAIR)担任研究科 学家。 主要贡献:设计了ResNets 8 国内外知名人工智能企业榜单 编码 企业名称 人工智能技术 应用领域 所属国家 成立时间 资本市场状态 市值/估值/融资额 1 Microsoft(微软) 计算机视觉技术、自然语言处理技术 等 办公 美国 1975年 上市 市值1.21万亿美元 2 Google(谷歌) 计算机视觉技术、自然语言处理技术 身高1.65m,体重100kg的男人肥胖吗? ✓ 根据肿瘤的体积、患者的年龄来判断良性或恶性? ✓ 回归(Regression、Prediction) ✓ 如何预测上海浦东的房价? ✓ 未来的股票市场走向? 2. 机器学习的类型-监督学习 17 ✓ 聚类(Clustering) ✓ 如何将教室里的学生按爱好、身高划分为5类? ✓ 降维( Dimensionality Reduction ree 53 ⚫Pycharm https://www.jetbrains.com/pycharm/ Pycharm 提供 免费的社区版 与 付费的专业版。专业版额外增加了一些功能, 如项目模板、远程开发、数据库支持等。个人学习 Python 使用免费的社区版 已足够。 如果有edu邮箱,那么推荐使用专业版,edu邮箱是可以免费使用专业版的。 安装过程照着提示一步步操作就可以了。 注意:安装路径尽量不使用带有0 码力 | 78 页 | 3.69 MB | 1 年前3
阿里云上深度学习建模实践-程孟力数十个场景化模版 • 所见即所得 交互式建模(DSW) • JupyterLab、WebIDE • 多框架兼容 • 可视化+tensorboard • 图像、视频、文本、 语音标注 • 多场景模板:物体检 测、语音识别 • 数据集管理 • 主动学习 • 智能标注 itags AI SaaS服务(OCR、语音识别、推荐系统、金融风控、疾病预测等) Infrastructure PAI平台(Platform 多维度监控+报警 • 自定义镜像 • 全托管+半托管 • 分布式训练优化 • 超大资源池 智能标注 可视化建模(Designer) 分布式训练(DLC) 在线服务(EAS) 生态市场 开发者工具 • CLI • PAIFlow • OpenAPI AI能力 体验中心 开源 PAI平台(Platform of Artificial Intelligence) Deep0 码力 | 40 页 | 8.51 MB | 1 年前3
机器学习课程-温州大学-01深度学习-引言Facebook AI Research(FAIR)担任研究科 学家。 主要贡献:设计了ResNets 8 国内外知名人工智能企业榜单 编码 企业名称 人工智能技术 应用领域 所属国家 成立时间 资本市场状态 市值/估值/融资额 1 Microsoft(微软) 计算机视觉技术、自然语言处理技术 等 办公 美国 1975年 上市 市值1.21万亿美元 2 Google(谷歌) 计算机视觉技术、自然语言处理技术 ree 54 ⚫Pycharm https://www.jetbrains.com/pycharm/ Pycharm 提供 免费的社区版 与 付费的专业版。专业版额外增加了一些功能, 如项目模板、远程开发、数据库支持等。个人学习 Python 使用免费的社区版 已足够。 如果有edu邮箱,那么推荐使用专业版,edu邮箱是可以免费使用专业版的。 安装过程照着提示一步步操作就可以了。 注意:安装路径尽量不使用带有0 码力 | 80 页 | 5.38 MB | 1 年前3
房源质量打分中深度学习应用及算法优化-周玉驰KE.COM ALL COPYRIGHTS RESERVED 7 目标&价值 平台 提升去化率 经纪人 提升效率和业绩 客户 降低看房成本 业主 缩减销售时长 市场需求恒定,优先成交好房 核心思想 选出好房 核心问题 提升带看效率 加速成交 核心价值 2019 KE.COM ALL COPYRIGHTS RESERVED 8 人工选房方法 RESERVED 17 房源特征 6大方向设计了90维特征 静态特征:69维 时序特征:21维 一套房源能否成交同很多因素相关 客源 17维 性价比 9维 业主 14维 市场 12维 经纪人 9维 基本属性 29维 成交 2019 KE.COM ALL COPYRIGHTS RESERVED 18 时序特征提取 0 5 10 15 20 25 30 ALL COPYRIGHTS RESERVED 27 v2.0+:持续优化 0.5% 业主诚意 0.5% 区域竞争力 特征维度 现状分析 房源基本属性 可以完善补充 客户 可以挖掘 市场 可以挖掘 业主 体现不完善 经纪人 考虑完整 性价比 考虑完整 1% 经纬度 1.5% 潜在热度 2019 KE.COM ALL COPYRIGHTS RESERVED0 码力 | 48 页 | 3.75 MB | 1 年前3
动手学深度学习 v2.0面积,卧室数量,浴室数量,步行距离)可能类似 于:[600, 1, 1, 60]。如果一个人住在匹兹堡,这个特征向量可能更接近[3000, 4, 3, 10]⋯⋯当人们在市场上寻找 新房子时,可能需要估计一栋房子的公平市场价值。为什么这个任务可以归类为回归问题呢?本质上是输出 决定的。销售价格(即标签)是一个数值。当标签取任意数值时,我们称之为回归问题,此时的目标是生成 一个模型,使它的预测非常接近实际标签值。 荐圣诞帽。 更多轶事 • 建立一个人脸检测器,它在所有基准测试中都能很好地工作,但是它在测试数据上失败了:有问题的例 子是人脸充满了整个图像的特写镜头(训练集中没有这样的数据)。 • 为美国市场建立了一个网络搜索引擎,并希望将其部署到英国。 • 通过在一个大的数据集来训练图像分类器,其中每一个大类的数量在数据集近乎是平均的,比如1000个 类别,每个类别由1000个图像表示。但是将该系 将dropout和ReLU应用于LeNet‐5,效果有提升吗?再试试预处理会怎么样? Discussions90 7.2 使用块的网络(VGG) 虽然AlexNet证明深层神经网络卓有成效,但它没有提供一个通用的模板来指导后续的研究人员设计新的网 络。在下面的几个章节中,我们将介绍一些常用于设计深层神经网络的启发式概念。 与芯片设计中工程师从放置晶体管到逻辑元件再到逻辑块的过程类似,神经网络架构的设计也逐渐变得更加0 码力 | 797 页 | 29.45 MB | 1 年前3
机器学习课程-温州大学-10机器学习-聚类很多客户经常上网购物,根据他们的浏览商品的习惯,给他们推荐 什么商品呢? 主要的无监督学习方法 6 1.无监督学习方法概述 主要算法 K-means、密度聚类、层次聚类 聚类 主要应用 市场细分、文档聚类、图像分割、图像压缩、聚类分析、特征学习或者词 典学习、确定犯罪易发地区、保险欺诈检测、公共交通数据分析、IT资产 集群、客户细分、识别癌症数据、搜索引擎应用、医疗应用、药物活性预 医生可以使用聚类算法来发现疾病。以甲状 腺疾病为例。当我们对包含甲状腺疾病和非 甲状腺疾病的数据集应用无监督学习时,可 以使用聚类算法来识别甲状腺疾病数据集。 8 1.无监督学习方法概述 聚类案例 2.市场细分 为了吸引更多的客户,每家公司都在开发易 于使用的功能和技术。为了了解客户,公司 可以使用聚类。聚类将帮助公司了解用户群 ,然后对每个客户进行归类。这样,公司就 可以了解客户,发现客户之间的相似之处,0 码力 | 48 页 | 2.59 MB | 1 年前3
李东亮:云端图像技术的深度学习模型与应用360手机安全产品 移动端用户总数已达约1.49亿 360浏览器 月活跃用户数量为3.03亿 360导航 日均独立访问用户为8900万人 日均点击量约为4.51亿次 360搜索 稳定拥有35%以上的市场份额 中国最大的互联网安全公司 360智能硬件 智能摄像头超400万,儿童手表超 350万,行车记录仪超300万 SACC2017 奇虎360 安全 ——360的基因 SACC20170 码力 | 26 页 | 3.69 MB | 1 年前3
机器学习课程-温州大学-02机器学习-回归梯度下降 03 正则化 04 回归的评价指标 4 监督学习分为回归和分类 ✓ 回归(Regression、Prediction) ✓ 如何预测上海浦东的房价? ✓ 未来的股票市场走向? ✓ 分类(Classification) ✓ 身高1.85m,体重100kg的男人穿什么尺码的T恤? ✓ 根据肿瘤的体积、患者的年龄来判断良性或恶性? 回归的概念 标签连续 标签离散0 码力 | 33 页 | 1.50 MB | 1 年前3
AI大模型千问 qwen 中文文档add_generation_prompt 参数用于在输入中添加生成提示,该提示指向 <|im_start|>assistant\n 。尤其需要注意的是,我们 遵循先前实践,对 chat 模型应用 ChatML 模板。而 max_new_tokens 参数则用于设置响应的最大长度。此 外,通过 tokenizer.batch_decode() 函数对响应进行解码。关于输入部分,上述的 messages 是一个 �→safetensors=True) 接下来,您需要准备数据以进行校准。您需要做的就是将样本放入一个列表中,其中每个样本都是一段文 本。由于我们直接使用微调数据来进行校准,所以我们首先使用 ChatML 模板对其进行格式化。例如: data = [] for msg in messages: msg = c['messages'] text = tokenizer.apply_chat_template(msg for i in range(4)} ) 接下来,你需要准备数据进行校准。你需要做的是将样本放入一个列表中,其中每个样本都是一段文本。由 于我们直接使用微调数据进行校准,所以我们首先使用 ChatML 模板对它进行格式化处理。例如: import torch data = [] for msg in messages: text = tokenizer.apply_chat_template(msg0 码力 | 56 页 | 835.78 KB | 1 年前3
PyTorch OpenVINO 开发实战系列教程第一篇列出了跟本书内容关联密切必须掌握的一些模块功能,希望读 者可以更好的针对性学习,掌握这些知识。 1.1.3 Pytorch 框架现状与趋势 Pytorch 是深度学习框架的后起之秀,它参考了市场上早期框 架包括 torch、caffe、tensorflow 的经验教训,从一开始设 PyTorch + OpenVINO 开发实战系列教程 第一篇 3 计就特别注重开发者体验与生产效率提升,一经发布就引发追0 码力 | 13 页 | 5.99 MB | 1 年前3
共 12 条
- 1
- 2













