大连网站建设培训班制作网页的工具主要有哪些

web/2025/10/3 0:29:03/文章来源:
大连网站建设培训班,制作网页的工具主要有哪些,如何用ftp上传文件到网站,电商平台怎么做在过去的十年中#xff0c;出现了许多涉及计算机视觉(CV)的项目#xff0c;无论是小型的概念验证项目还是更大规模的生产应用。应用计算机视觉的方法是相当标准化的: 1、定义问题(分类、检测、跟踪、分割)、输入数据(图片的大小和类型、视野)和类别(正是我们想要的) 2、注释…在过去的十年中出现了许多涉及计算机视觉(CV)的项目无论是小型的概念验证项目还是更大规模的生产应用。应用计算机视觉的方法是相当标准化的: 1、定义问题(分类、检测、跟踪、分割)、输入数据(图片的大小和类型、视野)和类别(正是我们想要的) 2、注释一些图片 3、选择一个网络架构训练-验证得到一些统计数据 4、构建推理系统并进行部署 到2023年底人工智能领域迎来了生成式人工智能的新成功:大型语言模型(llm)和图像生成模型。每个人都在谈论它它们对小型计算机视觉应用有什么改变吗? 本文将探索是否可以利用它们来构建数据集利用新的架构和新的预训练权重或者从大模型中提取知识。 小型计算机视觉 在这里我们通常感兴趣的是可以以相对较小的规模构建和部署的应用程序: 开发成本不应该太高 它不应该需要一个庞大的基础设施来训练(想想计算能力和数据规模) ‍它不需要很强的研究技能而是应用现有的技术 ⚡推理应该是轻量级和快速的以便它可以嵌入或部署在CPU服务器上 总体环境足迹应该很小(考虑计算能力模型/数据的一般大小没有特定的硬件要求) 这显然不是当今人工智能的趋势因为我们在今年看到的都是具有数十亿个参数的模型并且这些模型开始成为某些应用程序的标准。但重要的是关心更小的规模是至关重要的并不是所有的项目都应该遵循谷歌、Meta、OpenAI或微软的规模趋势并且我们也不可能有它们那么大的资金。 目前来看大多数有趣的计算机视觉项目实际上也比那些大公司的项目规模要小得多但这并不意味着我们就要缩小我们的应用程序而是说我们应该更加关心开发和推理成本。所以考虑到这一点我们还能在应用中利用人工智能的最新发展吗? 首先看看基础模型 计算机视觉中的基础模型 新的大型语言模型(LLM)已经很流行因为你可以很容易地在应用程序中使用基础模型(许多是开源的或者可以通过API使用)。把GPT、Bert、Llama看作这样的模型。基础模型是一个非常大的通用神经网络它是大多数下游任务的基础。它包含了非常广泛的主题语义语法不同的语言等知识。 在计算机视觉中这样的模型已经存在了很长一段时间了:使用ImageNet(100万张标记图像)上预训练的神经网络作为下游任务的“基础”模型是标准的。你可以在它的基础上构建你的神经网络如果需要的话还可以根据你自己的数据对它进行微调。 ImageNet预训练网络和llm之间有两个主要的概念区别: 训练的数据类型:ImageNet依赖于纯粹的监督学习:一个大规模的分类任务而LLM是生成模型:它们以一种使用原始文本的自监督方式训练(任务只是预测下一个单词)。 基础模型对新任务的适应:ImageNet预训练网络系统地需要一个新的学习过程来适应新的任务。但是对于llm虽然可以对模型进行微调但模型已经足够强大无需任何进一步的训练就可以用于下游任务只需用正确的信息提示模型使其对新任务有用。 目前大多数计算机视觉应用如分类目标检测分割仍然使用ImageNet预训练网络。下面我们回顾一下可能用于计算机视觉任务的或即将出现的新模型。 计算机视觉的新基础模型综述 在计算机视觉的世界里除了ImageNet有很多自监督网络的例子其中一些是生成模型(比如GAN和最近的扩散模型)。它们只接受原始图像或图像-文本对(例如图像及其描述)的训练。它们有时被称为LVM(大视觉模型)。 (弱)有监督的视觉模型: 1、DINOv2 (Meta) -一个大型ViT(1B参数)的集合以完全自监督的方式进行训练。 2、SAM Segment Anything (Meta) -一个用于高分辨率图像的ViT专门设计用于分割并可以进行零样本分割(不需要注释来生成新的分割蒙版)。另一个用例是使用SAM作为医学图像分割的附加输入。 基于图像-文本对训练的视觉语言基础模型: CLIP (OpenAI) -图像和简短描述的对齐非常适合于拍摄分类并在实践中用作各种下游CV任务的基础模型 大型生成模型现在是多模态的(包括能够在其架构中理解复杂文本的大型语言模型): StableDiffusion Dall-E (OpenAI) 视觉专用多任务大型模型 Florence-2:统一计算机视觉(Microsoft) 大型闭源坏模型 只能通过api获得:大型多用途模型不以视觉为中心但展示了出色的视觉能力以及生成能力; GPT-4V (OpenAI) Gemini (Google) 除了闭源以外还有许多开源的、更小的、多用途的视觉文本聊天模型正在开发中例如LlaVA。 所有这些模型都是强大的基础模型涵盖了许多视觉领域在许多情况下都能很好地完成判别或生成任务。如何在我们特定的小型环境中利用它们呢? 构建训练数据集 使用这些新模型的一个实用的想法是保持我们的标准训练管道例如广泛使用的Yolo检测器通过生成新的训练图像和/或生成注释来改进我们的数据集。流程如下: 标准数据集由一组带注释的训练和验证图像组成 增强数据集将使用强大的通用模型来添加自动注释: 1)对未标记图像的新注释⇒这需要一个已经适合任务的模型。可以使用一个非常大的通用模型仔细地添加示例或提示进行零标注或者根据现有的人工注释对非常大的模型进行微调。 2)在现有标注的基础上增加一层新的信息例如使用SAM从边界框信息中自动添加分割标注 生成的数据集由生成的图像及其注释组成。构建一个由图像和/或文本组成的提示以生成数千个图像及其注释。可以直接使用API来生成这些带注释的图像(与寻找好的图像和收集人工注释相比成本应该很小)。 将验证集与生成的或增强的集分开因为要在精心标记的数据上度量实际性能。这意味着在实践中即使我们选择了新的生成技术或基础模型仍然需要对真实图像进行一些手动标记。 扩充数据集的例子 可以从现有的图像开始通过丰富它们或使它们更容易注释来改进标签。现在有几个数据标注平台提出使用SAM或DINOv2通过对图片中的物体进行预分割来提高标注效率。 生成的数据集示例 虽然生成数据集的想法已经存在很长时间并且被广泛用于训练LLM但找到真正的小型应用程序来有效地利用生成的数据(自动注释或纯合成数据)是相当具有挑战性的。 不使用基础模型而是使用简单的渲染管道或者使用类似的技术使用3D渲染来生成数据这些结果目前看起来还很粗糙 https://github.com/921kiyo/3d-dl 使用生成模型完全生成图片和注释以下图片是使用Dall-E 生成图片的样例 还可以使用CV处理构建数据集(例如将对象粘贴到背景中进行分割任务)但是这里的问题是数据的质量将在很大程度上取决于生成图像的质量因此将不得不在构建正确的渲染步骤上投入大量精力(在3D中甚至更多)。 目前还没有太多使用纯生成模型生成数据集的成功例子但考虑到最近图像生成AI模型的渲染质量和可操作性我个人认为这只是时间的问题。比如有可能使用ControlNet从现有的分割蒙版或轮廓开始生成已经有标签的新图片但目前还不清楚它是否能很好地与非分布类(即不是标准的COCO类)一起工作或者分辨率是否足够好。 下面这篇论文提出了一个类似的想法即修改现有的标记图片以生成共享分割掩码的新图片从而产生增压的语义数据增强。 https://liu.diva-portal.org/smash/get/diva2:1779399/FULLTEXT01.pdf 但是当生成成千上万的图像而不是手动管理和标记它们时应该考虑成本因为改进并不明显! 最后 通过训练带有人类注释数据的模型来实现现代计算机视觉的方式即将被新的大型基础模型彻底改变。 大型基础模型有时具有“纳米级”版本用于在低端服务器甚至嵌入式应用程序上进行推理。但是对于这些应用来说它们仍然太大了并且对于新任务的调整也不是那么便宜。因为目前我们还是不会边缘设备上使用500M参数的VIT模型而是选择更小更专业的模型。 但是对于小型的推理和低资源开发我们也可以使用大型基础模型或者通过使用api /本地推理直接调用这些模型或者使用这些模型的一些知识。今天主要通过帮助标记数据明天通过其他方式知识转移-例如蒸馏。 没有标准的程序或普遍的方法来从这些大型或生成模型中转移这些知识但它可能会在2024年有所发展! https://avoid.overfit.cn/post/27697c284d4f4a4d93f91be616e3e998 作者:Charles Ollion

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/85913.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

忘记网站后台用户名高端网站建设哪家更专业

联合体 联合体的创建 联合体的关键字是union union S {char a;int i; };除了关键字和结构体不一样之外,联合体的创建语法形式和结构体的很相似,如果不熟悉结构体的创建,可以看一下我上一篇的博客关于结构体知识的详解。 联合体的特点 联合…

路由器做网站80端口公众号登陆入口

1.跳跃游戏 原题:力扣55. 逐步判断下一步的覆盖范围,根据范围去推断是否能到达终点,不用计较每一步走到哪里。 public boolean canJump(int[] nums) {// 题目规定 nums 长度大于等于1if (nums.length 1) {return true;}int cover 0;// f…

家装网站设计漂亮的网站

一、工业级 S25HS01GTDPBHV030 Semper™ NOR闪存 S25HS01GT SEMPER™ NOR Flash闪存系列是英飞凌高性能、安全而可靠的 NOR Flash解决方案。 它集成了适用于汽车、工业、通信等广泛应用的关键安全功能。 凭借 SEMPER™ NOR Flash闪存,英飞凌推出了业界首款符合 ASI…

外贸关键词网站免费网站如何做推广

前言 自2021年中国人民银行发布《金融科技发展规划(2022-2025年)》以来,商业银行迈入数字化转型的高阶阶段。在此背景下,为了进一步提高金融科技的管理水平,商业银行需要改变传统金融运维模式,对已有运维体…

网站建设流程发布网站和网页制作济南做网络推广

水一贴。 在浏览器中按F12点击"source"或者"源程序"点击html、js、css等源码文件所在的窗口的左边,此时点击处显示为蓝色光标,表示断点中断已经设置完毕。配合窗口右上角的"继续" “下一步” "跳过"等控制按钮…

沈阳蓝德网站建设网站对齐原则

linux系统启动过程 启动过程可以分为6步:POST–>BIOS–>MBR(GRUB)–>Kernel–>Init–>Runlevel。POST为Power On Self test,MBR(GRUB)其实也可以分开来讲,MBR的作用是去引导记录,为GRUB做准备。 各过程解析 POS…

南京企业网站搭建wordpress 仿雷锋

从先序与中序遍历序列构造二叉树 描述: 给定两个整数数组 preorder 和 inorder ,其中 preorder 是二叉树的先序遍历, inorder 是同一棵树的中序遍历,请构造二叉树并返回其根节点。 递归法 解题思路: 通过先序遍历我…

网站模板案例怎么建立信息网站平台

1 std::mutex 的基础概念 1.1 std::mutex 的定义与声明 std::mutex 是 C11 标准库中的一个互斥量(mutex)类,用于保护共享资源的并发访问。在多线程环境中,当多个线程试图同时访问和修改同一资源时,可能会发生数据竞争…

金融网站开发目的集团网站推广

来源:DeepTech深科技人脑中,数以千计的神经元间电信号交替传送不断,而长短不一的树突(神经元胞体延伸)在神经元信息整合中起到了关键作用,由此我们的大脑细胞才能正常反应运作。而这次,MIT 的神…

新建网站软件如何做网站免费搭桥链接

矩阵是线性代数课学习的重点内容之一,也是线性代数常见工具之一,在应用数学、统计分析、计算机科学、计算机图像处理级物理等多学科中均有应用。矩阵主要是指数据的行列排列的形式,由行row与列col所组成,在数学中M*N矩阵是指具有M…

太原建站模板源码阳江市网络问政平台登录

编辑 | 萝卜皮格拉斯哥大学(University of Glasgow)的研究人员提出了一种自主化学合成机器人,用于探索、发现和优化由实时光谱反馈、理论和机器学习算法驱动的纳米结构,这些算法控制反应条件并允许选择性地模板化反应。这种方法允…

企业网站建设服务内容瑞安营销网站建设

文章目录1. 比赛结果2. 题目1. LeetCode 5420. 商品折扣后的最终价格 easy2. LeetCode 5422. 子矩形查询 medium3. LeetCode 5423. 找两个和为目标值且不重叠的子数组 medium4. LeetCode 5421. 安排邮筒 hard1. 比赛结果 两题选手😂,前两题很水&#xf…

上海哪家网站建设公司好网站域名是什么

Array.prototype.forEach MDN解释forEach()方法是对数组的每个元素执行一个给定的函数,换句话来说就是在调用forEach()方法的时候,需要传入一个回调函数callback,循环每个数组内部元素时都会执行一次传入的回调函数callback forEach()方法的…

门户网站建设的企业79招商创业网

2024 7/7 转眼间就到周日啦!昨天下午开组会,开了三个半小时。如坐针毡,会后跑了个步、洗了个澡、洗了衣服、躺床上看了会《罪与罚》,睡着了。早上起来,去拿我昨晚充电的车,当我看到车没有停在昨天的位置&am…

如何建立电子商务网站网站开发设计文档

//官方的例子在质量上是有保证的,而各种教程和文档又局限于个人阅读和理解力。 进入jdk官网---找download,,,下滑鼠标----找到如: JDK 8 Demos and Samples 点击下载,,解压进入,比如…

0716网站建设前端开发课程

一、什么是IP代理与SK5代理? IP代理: IP代理是一种允许用户通过代理服务器进行网络连接的技术。用户请求经由代理服务器中转,从而实现隐藏真实IP地址,保护用户隐私,并在一定程度上突破IP访问限制。常见的IP代理有HTTP…

智能建站平台z江苏营销型网站策划

我有罪,直到现在才写集成测试(至少针对数据库相关事务)。 因此,为了消除内感,我阅读了如何在周末以最少的努力实现这一目标。 提供了一个小示例,描述了如何使用Spring和Hibernate轻松实现这一目标。 通过集…

珠海网站设计wordpress hestia

子查询: where字句的子查询: 通常用in关键字: 举个例子: in关键字: not in 关键字: in 也可以用于枚举集合: where中可以用子查询来作为集合来筛选元祖。 some,all的运算符号…

做网站商城如何优化多张图片排版设计欣赏

题目描述 Description小浣熊松松和朋友到野外露营,没想到遇上了π年一次的大洪水,好在松松是一只爱观察的小浣熊,他发现露营地的地形和洪水有如下性质: ①露营地可以被看做是一个N*M的矩形方阵,其中左上角坐标为…

部门规划书 网站建设如何做网站的自由撰稿人

我们可以用电感和电容的特性,以及电压和电流之间的不同步原理来解释PFC(功率因数校正)和LLC(谐振变换器)。 电感和电容的基本概念 电感(Inductor): 电感是一种储存电能的组件。它的电流变化比较慢,电流在电感中延迟,而电压变化得比较快。可以把电感想象成一个“滞后…