CV计算机视觉每日开源代码Paper with code速览-2023.11.22

点击@CV计算机视觉,关注更多CV干货

论文已打包,点击进入—>下载界面

点击加入—>CV计算机视觉交流群

1.【语义分割】Mobile-Seed: Joint Semantic Segmentation and Boundary Detection for Mobile Robots

  • 论文地址:https://arxiv.org//pdf/2311.12651

  • 工程主页:Mobile-Seed: Joint Semantic Segmentation and Boundary Detection for Mobile Robots

  • 开源代码(即将开源):GitHub - WHU-USI3DV/Mobile-Seed: [Arxiv'23] Mobile-Seed: Joint Semantic Segmentation and Boundary Detection for Mobile Robots

2.【医学图像分割】Semi-supervised Medical Image Segmentation via Query Distribution Consistency

  • 论文地址:https://arxiv.org//pdf/2311.12364

  • 开源代码(即将开源):https://github.com/Rows21/DK-UXNet

3.【超分辨率重建】Swift Parameter-free Attention Network for Efficient Super-Resolution

  • 论文地址:https://arxiv.org//pdf/2311.12770

  • 开源代码:GitHub - hongyuanyu/SPAN: Swift Parameter-free Attention Network for Efficient Super-Resolution

4.【域自适应】(WACV2024)GLAD: Global-Local View Alignment and Background Debiasing for Unsupervised Video Domain Adaptation with Large Domain Gap

  • 论文地址:https://arxiv.org//pdf/2311.12467

  • 开源代码:GitHub - KHU-VLL/GLAD

5.【多模态】ShareGPT4V: Improving Large Multi-Modal Models with Better Captions

  • 论文地址:https://arxiv.org//pdf/2311.12793

  • 工程主页:ShareGPT4V

  • 开源代码(即将开源):https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V

6.【多模态】GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning

  • 论文地址:https://arxiv.org//pdf/2311.12631

  • 工程主页:GPT4Motion: Scripting Physical Motions in Text-to-Video Generation via Blender-Oriented GPT Planning

  • 开源代码(即将开源):GitHub - jiaxilv/GPT4Motion

7.【多模态】From Wrong To Right: A Recursive Approach Towards Vision-Language Explanation

  • 论文地址:https://arxiv.org//pdf/2311.12391

  • 开源代码(即将开源):GitHub - para-lost/ReVisE: init

8.【多模态】ViLaM: A Vision-Language Model with Enhanced Visual Grounding and Generalization Capability

  • 论文地址:https://arxiv.org//pdf/2311.12327

  • 开源代码(即将开源):GitHub - AnonymGiant/ViLaM

9.【多模态】Boosting Audio-visual Zero-shot Learning with Large Language Models

  • 论文地址:https://arxiv.org//pdf/2311.12268

  • 开源代码(即将开源):GitHub - chenhaoxing/KDA: This repository is the code of paper 'Boosting Audio-visual Zero-shot Learning with Large Language Models'.

10.【多模态】Enhancing Novel Object Detection via Cooperative Foundational Models

  • 论文地址:https://arxiv.org//pdf/2311.12068

  • 开源代码(即将开源):GitHub - rohit901/cooperative-foundational-models: Official code for our paper "Enhancing Novel Object Detection via Cooperative Foundational Models"

11.【自动驾驶:Occupancy Prediction】SelfOcc: Self-Supervised Vision-Based 3D Occupancy Prediction

  • 论文地址:https://arxiv.org//pdf/2311.12754

  • 开源代码(即将开源):GitHub - huang-yh/SelfOcc: SelfOcc: Self-Supervised Vision-Based 3D Occupancy Prediction

12.【Diffusion】Concept Sliders: LoRA Adaptors for Precise Control in Diffusion Models

  • 论文地址:https://arxiv.org//pdf/2311.12092

  • 开源代码:GitHub - rohitgandikota/sliders: Concept Sliders for Precise Control of Diffusion Models

13.【目标计数】Point, Segment and Count: A Generalized Framework for Object Counting

  • 论文地址:https://arxiv.org//pdf/2311.12386

  • 开源代码(即将开源):GitHub - Hzzone/PseCo

14.【视频生成】MagicDance: Realistic Human Dance Video Generation with Motions & Facial Expressions Transfer

  • 论文地址:https://arxiv.org//pdf/2311.12052

  • 工程主页:MagicDance: Realistic Human Dance Video Generationwith Motions & Facial Expressions Transfer.

  • 开源代码(即将开源):GitHub - Boese0601/MagicDance: MagicDance: Realistic Human Dance Video Generation with Motions & Facial Expressions Transfer

15.【三维重建】TouchSDF: A DeepSDF Approach for 3D Shape Reconstruction using Vision-Based Tactile Sensing

  • 论文地址:https://arxiv.org//pdf/2311.12602

  • 工程主页:TouchSDF

  • 开源代码:GitHub - maurock/TouchSDF: Implementation of the DeepSDF paper

论文已打包,下载链接

CV计算机视觉交流群

群内包含目标检测、图像分割、目标跟踪、Transformer、多模态、NeRF、GAN、缺陷检测、显著目标检测、关键点检测、超分辨率重建、SLAM、人脸、OCR、生物医学图像、三维重建、姿态估计、自动驾驶感知、深度估计、视频理解、行为识别、图像去雾、图像去雨、图像修复、图像检索、车道线检测、点云目标检测、点云分割、图像压缩、运动预测、神经网络量化、网络部署等多个领域的大佬,不定期分享技术知识、面试技巧和内推招聘信息

想进群的同学请添加微信号联系管理员:PingShanHai666。添加好友时请备注:学校/公司+研究方向+昵称

推荐阅读:

CV计算机视觉每日开源代码Paper with code速览-2023.11.21

CV计算机视觉每日开源代码Paper with code速览-2023.11.20

CV计算机视觉每日开源代码Paper with code速览-2023.11.17

CV计算机视觉每日开源代码Paper with code速览-2023.11.16

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/175135.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

7种SQL进阶用法【转】

1.自定义排序(ORDER BY FIELD) 在MySQL中ORDER BY排序除了可以用ASC和DESC之外,还可以使使用自定义排序方式来实现 CREATE TABLE movies ( id INT PRIMARY KEY AUTO_INCREMENT, movie_name VARCHAR(255), actors VARCHAR(255), price DECIMAL(10,2) DEFAULT 50, release date…

P8安全基本理论A001-CIA安全模型-使用PGP描述网络安全CIA模型之私密性、完整性案例

【教学资源名称】 CIA安全模型-使用PGP描述网络安全CIA模型之私密性、完整性案例 【预备知识】 在信息安全等级保护工作中,根据信息系统的机密性(Confidentiality)、完整性(Integrity)、可用性(Availability)来划分信息系统的安全等级,三个性质简称CIA。 私密性(Confi…

ES 8.x开始(docker-compose安装、kibana使用、java操作)

学习文档地址 一、Docker安装 这里使用docker-compose来安装,方便后续迁移,Elasticserach和kibina一起安装。 1、创建安装目录 configdataplugins 2、配置文件 配置文件有两个,一个是ES的配置文件,一个docker-compose的配置文件 …

大厂做项目的过程,你真的知道吗?

文章目录 明确需求排期代码设计技术选型写代码迭代更新 一线大厂的项目是如何从0-1被做出来的,了解大厂项目开发的详细流程;自己开发项目那是单打独斗,没人管你;但进入企业中开发项目那是开团打本,大家都在一股绳上&am…

龙芯loongarch64服务器编译安装pyarrow

1、简介 pyarrow是一个高效的Python库,用于在Python应用程序和Apache Arrow之间进行交互。Arrow是一种跨语言的内存格式,可以快速高效地转移大型数据集合。它提供了一种通用的数据格式,将数据在内存中表示为表格,并支持诸如序列化和分布式读取等功能。 龙芯的Python仓库安…

Ubuntu 22.03 LTS 安装deepin-terminal 分屏

安装 源里面自带了这个软件,可以直接装 sudo apt install deepin-terminal 启动 按下Win键,输入deep即可快速检索出图标,点击启动 效果 分屏 CtrlShiftH 水平分割 CtrlShiftJ 垂直分割 最多分割成四个小窗口,鼠标点击可以切换…

[ BUG ] 踩坑 Axios Delete 请求传参

踩坑 Axios Delete 请求传参 问题描述 今天在写前后端交互时,我想将 data 数据通过 delete 进行传参 axios.delete("/info", data),但是发现后端一直提示参数错误,我看了看代码也没错啊。跟 post、patch 一样的写法为什么会出现参…

三方支付接口成为了电商竞争力的新动力

在当前快速发展的互联网时代,随着电子商务行业的兴起,支付体验已经成为企业获取竞争优势的重要因素。一个快速、安全、便捷的支付环节不仅可以提升用户的体验,还能有效促进交易的完成。在众多支付解决方案中,三方支付接口因其独特…

18.Spring框架中的单例bean是线程安全的吗?(阿里一面)

Spring框架中的单例bean是线程安全的吗?(阿里一面) 不是,Spring框架中的单例bean不是线程安全的。spring 中的 bean 默认是单例模式,spring 框架并没有对单例 bean 进行多线程的封装处理。 实际上大部分时候 spring bean 无状态的(比如 dao 类),所以某种程度上来说 bea…

PCL 计算点云图中任意两点的欧式距离

目录 一、算法原理二、代码实现三、结果展示四、相关链接本文由CSDN点云侠原创,原文链接。如果你不是在点云侠的博客中看到该文章,那么此处便是不要脸的爬虫与GPT。 一、算法原理 使用PCL实现在可视化界面上用鼠标点选两个点,输出两点的坐标和两点之间的欧式距离。 二、代码…

linux 内核线程

内核线程类似于用户进程,通常用于并发处理些工作,它是一种在内核空间实现后台任务的方式,并且可以参与时间片轮转调度。 内核线程可以进行繁忙的异步事件处理,也可以睡眠等待某事件的发生,内核线程可以访问内核函数和…

Linux操作系统使用及C高级编程-D17D18编译与调试

编译 当有线程创建时编译:gcc test.c -o test -lpthread 分文件编写时主要是分为:.c(函数声明的具体实现)、.h(说明性文件:#define 结构体共用体 声明)、.c(main) 条件编译 一般情况下&#x…

激光线提取

在做单线激光三维重建,和多线激光三维重建的时候都会设计到激光线提取算法的实现,如何保持高速和高精度是关键 ,最近优化了steger中心线提取算法,通过并行化实现在cpu版本可以做到2m,GPU版本可以做到0.6ms左右,完全可…

Flask 运用Xterm实现交互终端

Xterm是一个基于X Window System的终端仿真器(Terminal Emulator)。Xterm最初由MIT开发,它允许用户在X Window环境下运行文本终端程序。Xterm提供了一个图形界面终端,使用户能够在图形桌面环境中运行命令行程序。而xterm.js是一个…

Kotlin学习——kt入门合集博客 kt里的委派模式Delegation kt里的特性

Kotlin 是一门现代但已成熟的编程语言,旨在让开发人员更幸福快乐。 它简洁、安全、可与 Java 及其他语言互操作,并提供了多种方式在多个平台间复用代码,以实现高效编程。 https://play.kotlinlang.org/byExample/01_introduction/02_Functio…

23. Spring源码篇之环境变量Environment

简介 在开发过程中,我们通常会把一些变化的数据,或者说不同环境值不一样的数据抽离出来,代码可以根据需要通过配置动态的方式获取不同的值,这个值可以是在配置文件中,数据库中等 在spring中定义了一个统一的环境变量…

android 9 adb安装过程学习(三)

PackageManagerService 一、PackageManagerService.installStage 接下来,进入 PackageManagerService 阶段。从PackageInstallerSession.java的commitLocked调用 这里的 IPackageInstallObserver2 observer 是前面创建的本次 localObserver: 位置&…

详解FreeRTOS:互斥信号量和递归互斥信号量(高级篇—3)

目录 1、互斥信号量 1.1、互斥信号量运作机制 1.2、创建互斥信号量

[SpringCloud] SpringCloud配置中心的核心原理

SpringCloud是什么时候去拉取配置中心的配置中心客户端的配置信息为什么要写在bootstrap文件中对象中注入的属性是如何动态刷新的一些开源的配置中心是如何整合SpringCloud的 文章目录 1.从SpringBoot的启动过程说起1.1 大致过程 2.准备Environment的核心操作2.1 前置操作 3.pr…

NOI / 1.10编程基础之简单排序 提问05:分数线划定 c语言 结构体

描述 世博会志愿者的选拔工作正在 A 市如火如荼的进行。为了选拔最合适的人才,A市对所有报名的选手进行了笔试,笔试分数达到面试分数线的选手方可进入面试。面试分数线根据计划录取人数的150%划定,即如果计划录取m名志愿者,则面试…